Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13151–13200 of 15113 papers

Title	Date	Tasks	Status
Playing Atari with Six Neurons	Jun 4, 2018	Atari GamesDecision Making	CodeCode Available
Offline Learning of Closed-Loop Deep Brain Stimulation Controllers for Parkinson Disease Treatment	Feb 5, 2023	Reinforcement Learning (RL)	CodeCode Available
Training Transition Policies via Distribution Matching for Complex Tasks	Oct 8, 2021	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available
Zero-Shot Reinforcement Learning via Function Encoders	Jan 30, 2024	Decision Makingreinforcement-learning	CodeCode Available
MULTIPOLAR: Multi-Source Policy Aggregation for Transfer Reinforcement Learning between Diverse Environmental Dynamics	Sep 28, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
TrajDeleter: Enabling Trajectory Forgetting in Offline Reinforcement Learning Agents	Apr 18, 2024	energy managementOffline RL	CodeCode Available
Playing Atari Games with Deep Reinforcement Learning and Human Checkpoint Replay	Jul 18, 2016	Atari GamesDeep Reinforcement Learning	CodeCode Available
Reinforcement Learning based Interconnection Routing for Adaptive Traffic Optimization	Aug 13, 2019	BIG-bench Machine Learningreinforcement-learning	CodeCode Available
The Option-Critic Architecture	Sep 16, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
QFlip: An Adaptive Reinforcement Learning Strategy for the FlipIt Security Game	Jun 27, 2019	OpenAI GymQ-Learning	CodeCode Available
A Generic Graph Sparsification Framework using Deep Reinforcement Learning	Dec 2, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available
Trajectory-Aware Eligibility Traces for Off-Policy Reinforcement Learning	Jan 26, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Multiple Object Recognition with Visual Attention	Dec 24, 2014	ObjectObject Recognition	CodeCode Available
M^3RL: Mind-aware Multi-agent Management Reinforcement Learning	Sep 29, 2018	ManagementMulti-agent Reinforcement Learning	CodeCode Available
Sparse Black-box Video Attack with Reinforcement Learning	Jan 11, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Trajectory-Based Off-Policy Deep Reinforcement Learning	May 14, 2019	continuous-controlContinuous Control	CodeCode Available
M^2DQN: A Robust Method for Accelerating Deep Q-learning Network	Sep 16, 2022	Q-Learningreinforcement-learning	CodeCode Available
Robust Constrained-MDPs: Soft-Constrained Robust Policy Optimization under Model Uncertainty	Oct 10, 2020	ManagementReinforcement Learning (RL)	CodeCode Available
Playing 2048 With Reinforcement Learning	Oct 20, 2021	Playing the Game of 2048Q-Learning	CodeCode Available
Sparsely ensembled convolutional neural network classifiers via reinforcement learning	Feb 7, 2021	Ensemble Learningreinforcement-learning	CodeCode Available
Vulnerability of Deep Reinforcement Learning to Policy Induction Attacks	Jan 16, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Meta-Learning of Structured Task Distributions in Humans and Machines	Oct 5, 2020	Meta-LearningMeta Reinforcement Learning	CodeCode Available
Multiple Landmark Detection using Multi-Agent Reinforcement Learning	Jun 30, 2019	AnatomyMedical Image Analysis	CodeCode Available
Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity	Jun 20, 2025	continuous-controlContinuous Control	CodeCode Available
Reinforcement Learning-based Heuristics to Guide Domain-Independent Dynamic Programming	Mar 20, 2025	Combinatorial Optimizationreinforcement-learning	CodeCode Available
Theory of Mind for Deep Reinforcement Learning in Hanabi	Jan 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning Based Graph-to-Sequence Model for Natural Question Generation	Aug 14, 2019	Graph Neural NetworkGraph-to-Sequence	CodeCode Available
Contrastive Multi-document Question Generation	Nov 8, 2019	Contrastive LearningQuestion Generation	CodeCode Available
Reinforcement Learning based Collective Entity Alignment with Adaptive Features	Jan 5, 2021	Decision MakingEntity Alignment	CodeCode Available
Reinforcement learning based adaptive metaheuristics	Jun 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Regret-Based Defense in Adversarial Reinforcement Learning	Feb 14, 2023	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
DRIBO: Robust Deep Reinforcement Learning via Multi-View Information Bottleneck	Feb 26, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
When Does Neuroevolution Outcompete Reinforcement Learning in Transfer Learning Tasks?	May 28, 2025	reinforcement-learningReinforcement Learning	CodeCode Available
Offline Behavior Distillation	Oct 30, 2024	D4RLReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning -based Adaptation and Scheduling Methods for Multi-source DASH	Jul 25, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Robust Distant Supervision Relation Extraction via Deep Reinforcement Learning	May 24, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Multi-Pass Q-Networks for Deep Reinforcement Learning with Parameterised Action Spaces	May 10, 2019	Control with Prametrised ActionsDeep Reinforcement Learning	CodeCode Available
Robust Visual Domain Randomization for Reinforcement Learning	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
WALL-E: An Efficient Reinforcement Learning Research Framework	Jan 18, 2019	MuJoCoreinforcement-learning	CodeCode Available
The PlayStation Reinforcement Learning Environment (PSXLE)	Dec 12, 2019	OpenAI Gymreinforcement-learning	CodeCode Available
Variational Quantum Circuits for Deep Reinforcement Learning	Jun 30, 2019	BIG-bench Machine LearningDecision Making	CodeCode Available
The Potential of the Return Distribution for Exploration in RL	Jun 11, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Robust exploration in linear quadratic reinforcement learning	Jun 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Maximum Reward Formulation In Reinforcement Learning	Oct 8, 2020	Drug Discoveryreinforcement-learning	CodeCode Available
Planning with Goal-Conditioned Policies	Nov 19, 2019	Decision Makingreinforcement-learning	CodeCode Available
When Do Skills Help Reinforcement Learning? A Theoretical Analysis of Temporal Abstractions	Jun 12, 2024	Reinforcement Learning (RL)	CodeCode Available
Off Environment Evaluation Using Convex Risk Minimization	Dec 21, 2021	Reinforcement Learning (RL)	CodeCode Available
Spatiotemporally Constrained Action Space Attacks on Deep Reinforcement Learning Agents	Sep 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Multi-objective Pointer Network for Combinatorial Optimization	Apr 25, 2022	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available
Specializing Versatile Skill Libraries using Local Mixture of Experts	Dec 8, 2021	Incremental LearningMixture-of-Experts	CodeCode Available

Show:10 25 50

← PrevPage 264 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified