Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13451–13500 of 15113 papers

Title	Date	Tasks	Status
Trial without Error: Towards Safe Reinforcement Learning via Human Intervention	Jul 17, 2017	Atari Gamesreinforcement-learning	CodeCode Available
Pac-Man Pete: An extensible framework for building AI in VEX Robotics	Nov 25, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Viability of Future Actions: Robust Safety in Reinforcement Learning via Entropy Regularization	Jun 12, 2025	Reinforcement Learning (RL)	CodeCode Available
PAC-Bayesian Soft Actor-Critic Learning	Jan 30, 2023	Reinforcement Learning (RL)	CodeCode Available
Macro action selection with deep reinforcement learning in StarCraft	Dec 2, 2018	Deep Reinforcement LearningReal-Time Strategy Games	CodeCode Available
PAC: Assisted Value Factorisation with Counterfactual Predictions in Multi-Agent Reinforcement Learning	Jun 22, 2022	counterfactualMulti-agent Reinforcement Learning	CodeCode Available
To Measure or Not: A Cost-Sensitive, Selective Measuring Environment for Agricultural Management Decisions with Reinforcement Learning	Jan 22, 2025	ManagementReinforcement Learning (RL)	CodeCode Available
SAGE: Generating Symbolic Goals for Myopic Models in Deep Reinforcement Learning	Mar 9, 2022	Deep Reinforcement LearningMinecraft	CodeCode Available
Real-World Dexterous Object Manipulation based Deep Reinforcement Learning	Nov 22, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available
Straight to the Point: Fast-forwarding Videos via Reinforcement Learning Using Textual Data	Mar 31, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Neural SLAM: Learning to Explore with External Memory	Jun 29, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Strangeness-driven Exploration in Multi-Agent Reinforcement Learning	Dec 27, 2022	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available
P3O: Policy-on Policy-off Policy Optimization	May 5, 2019	MuJoCoReinforcement Learning	CodeCode Available
Real-time visual tracking by deep reinforced decision making	Feb 21, 2017	Deep Reinforcement LearningReal-Time Visual Tracking	CodeCode Available
Real-Time Reinforcement Learning	Nov 11, 2019	continuous-controlContinuous Control	CodeCode Available
Overcoming Slow Decision Frequencies in Continuous Control: Model-Based Sequence Reinforcement Learning for Model-Free Control	Oct 11, 2024	continuous-controlContinuous Control	CodeCode Available
Overcoming Overfitting in Reinforcement Learning via Gaussian Process Diffusion Policy	Jun 16, 2025	GPRReinforcement Learning (RL)	CodeCode Available
Neural Sequence Model Training via α-divergence Minimization	Jun 30, 2017	Machine Translationmodel	CodeCode Available
Multiagent Inverse Reinforcement Learning via Theory of Mind Reasoning	Feb 20, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
ToolRL: Reward is All Tool Learning Needs	Apr 16, 2025	AllReinforcement Learning (RL)	CodeCode Available
Strategic Dialogue Management via Deep Reinforcement Learning	Nov 25, 2015	Deep Reinforcement LearningDialogue Management	CodeCode Available
Tools for Data-driven Modeling of Within-Hand Manipulation with Underactuated Adaptive Hands	Jun 8, 2020	Model-based Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Neural Reward Machines	Aug 16, 2024	Reinforcement Learning (RL)	CodeCode Available
Multi-Agent Image Classification via Reinforcement Learning	May 13, 2019	ClassificationGeneral Classification	CodeCode Available
Neural Optimizer Search with Reinforcement Learning	Sep 21, 2017	Machine Translationreinforcement-learning	CodeCode Available
TorchBeast: A PyTorch Platform for Distributed RL	Oct 8, 2019	OpenAI GymReinforcement Learning	CodeCode Available
TorchProteinLibrary: A computationally efficient, differentiable representation of protein structure	Nov 23, 2018	Protein FoldingReinforcement Learning (RL)	CodeCode Available
Sample Complexity of Robust Reinforcement Learning with a Generative Model	Dec 2, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Neural Operator based Reinforcement Learning for Control of first-order PDEs with Spatially-Varying State Delay	Jan 30, 2025	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
TripleTree: A Versatile Interpretable Representation of Black Box Agents and their Environments	Sep 10, 2020	Deep Reinforcement LearningExplainable artificial intelligence	CodeCode Available
Overcoming Exploration in Reinforcement Learning with Demonstrations	Sep 28, 2017	continuous-controlContinuous Control	CodeCode Available
Real-time calibration of coherent-state receivers: learning by trial and error	Jan 28, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Neural Network Dynamics for Model-Based Deep Reinforcement Learning with Model-Free Fine-Tuning	Aug 8, 2017	Deep Reinforcement Learningmodel	CodeCode Available
MINOS: Multimodal Indoor Simulator for Navigation in Complex Environments	Dec 11, 2017	Deep Reinforcement LearningNavigate	CodeCode Available
Real-Time Bidding by Reinforcement Learning in Display Advertising	Jan 10, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Real-time Adversarial Perturbations against Deep Reinforcement Learning Policies: Attacks and Defenses	Jun 16, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
TrojDRL: Trojan Attacks on Deep Reinforcement Learning Agents	Mar 1, 2019	Data PoisoningDeep Reinforcement Learning	CodeCode Available
To the Max: Reinventing Reward in Reinforcement Learning	Feb 2, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Multi-Agent Deep Reinforcement Learning for Large-scale Traffic Signal Control	Mar 11, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available
Sample-Efficient Deep Reinforcement Learning via Episodic Backward Update	May 31, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization	Oct 17, 2024	continuous-controlContinuous Control	CodeCode Available
Model-free Reinforcement Learning in Infinite-horizon Average-reward Markov Decision Processes	Oct 15, 2019	Multi-Armed Banditsreinforcement-learning	CodeCode Available
Solving the Real Robot Challenge using Deep Reinforcement Learning	Sep 30, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Read, Watch, and Move: Reinforcement Learning for Temporally Grounding Natural Language Descriptions in Videos	Jan 21, 2019	Decision MakingMulti-Task Learning	CodeCode Available
Orchestrated Value Mapping for Reinforcement Learning	Mar 14, 2022	Ensemble LearningQ-Learning	CodeCode Available
Neural Modular Control for Embodied Question Answering	Oct 26, 2018	Embodied Question AnsweringImitation Learning	CodeCode Available
Model-Based Reinforcement Learning with Multi-Task Offline Pretraining	Jun 6, 2023	Knowledge DistillationModel-based Reinforcement Learning	CodeCode Available
USHER: Unbiased Sampling for Hindsight Experience Replay	Jul 3, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Rationally Inattentive Inverse Reinforcement Learning Explains YouTube Commenting Behavior	Oct 24, 2019	Clusteringreinforcement-learning	CodeCode Available
Sample-Efficient Model-Free Reinforcement Learning with Off-Policy Critics	Mar 11, 2019	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 270 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified