Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6851–6900 of 15113 papers

Title	Date	Tasks	Status	Hype
HARPO: Learning to Subvert Online Behavioral Advertising	Nov 9, 2021	Reinforcement Learning (RL)	—Unverified	0
Safe Policy Optimization with Local Generalized Linear Function Approximations	Nov 9, 2021	Reinforcement Learning (RL)Safe Exploration	CodeCode Available	0
Risk Sensitive Model-Based Reinforcement Learning using Uncertainty Guided Planning	Nov 9, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
"Good Robot! Now Watch This!": Repurposing Reinforcement Learning for Task-to-Task Transfer	Nov 8, 2021	Few-Shot LearningMeta Reinforcement Learning	CodeCode Available	1
Dueling RL: Reinforcement Learning with Trajectory Preferences	Nov 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
On Assessing The Safety of Reinforcement Learning algorithms Using Formal Methods	Nov 8, 2021	Autonomous VehiclesQ-Learning	—Unverified	0
Reinforcement Learning for Mixed Autonomy Intersections	Nov 8, 2021	Multi-Task Learningreinforcement-learning	CodeCode Available	1
A Dataset Perspective on Offline Reinforcement Learning	Nov 8, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Interactive Inverse Reinforcement Learning for Cooperative Games	Nov 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Batch Reinforcement Learning from Crowds	Nov 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
FinRL: Deep Reinforcement Learning Framework to Automate Trading in Quantitative Finance	Nov 7, 2021	Deep Reinforcement LearningFriction	—Unverified	0
FinRL-Podracer: High Performance and Scalable Deep Reinforcement Learning for Quantitative Finance	Nov 7, 2021	Deep Reinforcement LearningGPU	—Unverified	0
Explainable Deep Reinforcement Learning for Portfolio Management: An Empirical Approach	Nov 7, 2021	Deep Reinforcement LearningManagement	—Unverified	0
Automatic Goal Generation using Dynamical Distance Learning	Nov 7, 2021	Decision MakingReinforcement Learning (RL)	—Unverified	0
Data-Efficient Deep Reinforcement Learning for Attitude Control of Fixed-Wing UAVs: Field Experiments	Nov 7, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Optimization of the Model Predictive Control Meta-Parameters Through Reinforcement Learning	Nov 7, 2021	Model Predictive Controlreinforcement-learning	—Unverified	0
AI-based Radio Resource Management and Trajectory Design for PD-NOMA Communication in IRS-UAV Assisted Networks	Nov 6, 2021	ManagementReinforcement Learning (RL)	—Unverified	0
d3rlpy: An Offline Deep Reinforcement Learning Library	Nov 6, 2021	D4RLDeep Reinforcement Learning	CodeCode Available	0
Exponential Bellman Equation and Improved Regret Bounds for Risk-Sensitive Reinforcement Learning	Nov 6, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Deep Reinforcement Learning Approach for Composing Moving IoT Services	Nov 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Development of collective behavior in newborn artificial agents	Nov 6, 2021	Deep Reinforcement LearningObject Recognition	—Unverified	0
Robust Deep Reinforcement Learning for Quadcopter Control	Nov 6, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Perturbational Complexity by Distribution Mismatch: A Systematic Analysis of Reinforcement Learning in Reproducing Kernel Hilbert Space	Nov 5, 2021	Reinforcement Learning (RL)	—Unverified	0
Supervised Advantage Actor-Critic for Recommender Systems	Nov 5, 2021	Q-LearningRecommendation Systems	—Unverified	0
Improving RNA Secondary Structure Design using Deep Reinforcement Learning	Nov 5, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Cross Modality 3D Navigation Using Reinforcement Learning and Neural Style Transfer	Nov 5, 2021	Computed Tomography (CT)Diagnostic	CodeCode Available	1
Learning to Cooperate with Unseen Agent via Meta-Reinforcement Learning	Nov 5, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
An Algorithmic Theory of Metacognition in Minds and Machines	Nov 5, 2021	Bayesian OptimizationReinforcement Learning (RL)	—Unverified	0
Control of a fly-mimicking flyer in complex flow using deep reinforcement learning	Nov 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Infinite Time Horizon Safety of Bayesian Neural Networks	Nov 4, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Successor Feature Neural Episodic Control	Nov 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Value Function Spaces: Skill-Centric State Abstractions for Long-Horizon Reasoning	Nov 4, 2021	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Model-Free Risk-Sensitive Reinforcement Learning	Nov 4, 2021	Decision Makingmodel	—Unverified	0
RLDS: an Ecosystem to Generate, Share and Use Datasets in Reinforcement Learning	Nov 4, 2021	Decision MakingImitation Learning	CodeCode Available	1
Towards Learning to Speak and Hear Through Multi-Agent Communication over a Continuous Acoustic Channel	Nov 4, 2021	Language AcquisitionMulti-agent Reinforcement Learning	—Unverified	0
Causal versus Marginal Shapley Values for Robotic Lever Manipulation Controlled using Deep Reinforcement Learning	Nov 4, 2021	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified	0
Generalization in Dexterous Manipulation via Geometry-Aware Multi-Task Learning	Nov 4, 2021	Multi-Task LearningObject	—Unverified	0
Imagine Networks	Nov 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Attacking Deep Reinforcement Learning-Based Traffic Signal Control Systems with Colluding Vehicles	Nov 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
B-Pref: Benchmarking Preference-Based Reinforcement Learning	Nov 4, 2021	Benchmarkingreinforcement-learning	CodeCode Available	1
Is Bang-Bang Control All You Need? Solving Continuous Control with Bernoulli Policies	Nov 3, 2021	AllBenchmarking	—Unverified	0
Autonomous Attack Mitigation for Industrial Control Systems	Nov 3, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
AlphaD3M: Machine Learning Pipeline Synthesis	Nov 3, 2021	AutoMLBIG-bench Machine Learning	—Unverified	0
Online Service Provisioning in NFV-enabled Networks Using Deep Reinforcement Learning	Nov 3, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Tuning the Weights: The Impact of Initial Matrix Configurations on Successor Features Learning Efficacy	Nov 3, 2021	Reinforcement Learning (RL)Representation Learning	—Unverified	0
What Robot do I Need? Fast Co-Adaptation of Morphology and Control using Graph Neural Networks	Nov 3, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Model-Based Episodic Memory Induces Dynamic Hybrid Controls	Nov 3, 2021	modelreinforcement-learning	—Unverified	0
Smooth Imitation Learning via Smooth Costs and Smooth Policies	Nov 3, 2021	continuous-controlContinuous Control	—Unverified	0
Image-Guided Navigation of a Robotic Ultrasound Probe for Autonomous Spinal Sonography Using a Shadow-aware Dual-Agent Framework	Nov 3, 2021	AnatomyDecision Making	—Unverified	0
Curriculum Offline Imitation Learning	Nov 3, 2021	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 138 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified