Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13101–13150 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning for Improving Agent Design	Oct 9, 2018	OpenAI Gymreinforcement-learning	CodeCode Available
Mode-constrained Model-based Reinforcement Learning via Gaussian Processes	Jul 25, 2023	Gaussian ProcessesModel-based Reinforcement Learning	CodeCode Available
VRKitchen: an Interactive 3D Virtual Environment for Task-oriented Learning	Mar 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning for Few-Shot Text Generation Adaptation	Nov 22, 2021	DiversityDomain Adaptation	CodeCode Available
Reinforcement Learning for Dynamic Memory Allocation	Oct 20, 2024	Managementreinforcement-learning	CodeCode Available
Reinforcement Learning for Control of Non-Markovian Cellular Population Dynamics	Oct 11, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Multitask radiological modality invariant landmark localization using deep reinforcement learning	Jan 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
RLTutor: Reinforcement Learning Based Adaptive Tutoring System by Modeling Virtual Student with Fewer Interactions	Jul 31, 2021	Decision Makingreinforcement-learning	CodeCode Available
RL Unplugged: A Collection of Benchmarks for Offline Reinforcement Learning	Dec 1, 2020	Offline RLreinforcement-learning	CodeCode Available
RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning	Jun 24, 2020	Atari GamesDQN Replay Dataset	CodeCode Available
Reinforcement Learning for Channel Coding: Learned Bit-Flipping Decoding	Jun 11, 2019	Decision Makingreinforcement-learning	CodeCode Available
Multi-task Maximum Entropy Inverse Reinforcement Learning	May 22, 2018	Imitation LearningMeta-Learning	CodeCode Available
Reinforcement Learning for Bandit Neural Machine Translation with Simulated Human Feedback	Jul 24, 2017	DecoderMachine Translation	CodeCode Available
Multi-task Deep Reinforcement Learning with PopArt	Sep 12, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
Solving Royal Game of Ur Using Reinforcement Learning	Aug 23, 2022	Board Gamesreinforcement-learning	CodeCode Available
Reinforcement Learning for Automatic Test Case Prioritization and Selection in Continuous Integration	Nov 9, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning Experiments and Benchmark for Solving Robotic Reaching Tasks	Nov 11, 2020	Positionreinforcement-learning	CodeCode Available
The LoCA Regret: A Consistent Metric to Evaluate Model-Based Behavior in Reinforcement Learning	Jul 7, 2020	General Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available
Meta Policy Learning for Cold-Start Conversational Recommendation	May 24, 2022	Conversational RecommendationMeta Reinforcement Learning	CodeCode Available
Representation Convergence: Mutual Distillation is Secretly a Form of Regularization	Jan 5, 2025	Deep Reinforcement LearningForm	CodeCode Available
Reinforcement Learning-enhanced Shared-account Cross-domain Sequential Recommendation	Jun 16, 2022	Graph Neural NetworkHierarchical Reinforcement Learning	CodeCode Available
Playing Games in the Dark: An approach for cross-modality transfer in reinforcement learning	Nov 28, 2019	OpenAI Gymreinforcement-learning	CodeCode Available
Machine Comprehension by Text-to-Text Neural Question Generation	May 4, 2017	Question AnsweringQuestion Generation	CodeCode Available
The MineRL 2019 Competition on Sample Efficient Reinforcement Learning using Human Priors	Apr 22, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
ROBEL: Robotics Benchmarks for Learning with Low-Cost Robots	Sep 25, 2019	continuous-controlContinuous Control	CodeCode Available
Solving The Lunar Lander Problem under Uncertainty using Reinforcement Learning	Nov 24, 2020	NavigateQ-Learning	CodeCode Available
Solving the optimal stopping problem with reinforcement learning: an application in financial option exercise	Jul 21, 2022	ManagementReinforcement Learning (RL)	CodeCode Available
Variational Information Maximisation for Intrinsically Motivated Reinforcement Learning	Sep 29, 2015	BIG-bench Machine Learningreinforcement-learning	CodeCode Available
Reinforcement Learning Discovers Efficient Decentralized Graph Path Search Strategies	Sep 12, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Robofriend: An Adpative Storytelling Robotic Teddy Bear - Technical Report	Jan 4, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Solving the Rubik's Cube Without Human Knowledge	May 18, 2018	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available
Solving the scalarization issues of Advantage-based Reinforcement Learning Algorithms	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning for Molecular Dynamics Optimization: A Stochastic Pontryagin Maximum Principle Approach	Dec 6, 2022	Decision MakingDrug Discovery	CodeCode Available
The Mirage of Action-Dependent Baselines in Reinforcement Learning	Feb 27, 2018	Policy Gradient Methodsreinforcement-learning	CodeCode Available
Unpaired Sentiment-to-Sentiment Translation: A Cycled Reinforcement Learning Approach	May 14, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning Decoders for Fault-Tolerant Quantum Computation	Oct 16, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
The Multi-Agent Reinforcement Learning in MalmÖ (MARLÖ) Competition	Jan 23, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Playing FPS Games with Deep Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningFPS Games	CodeCode Available
The Natural Language of Actions	Feb 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Robotic Surgery With Lean Reinforcement Learning	May 3, 2021	Q-Learningreinforcement-learning	CodeCode Available
Some Considerations on Learning to Explore via Meta-Reinforcement Learning	Mar 3, 2018	Meta Reinforcement Learningreinforcement-learning	CodeCode Available
Some Insights into Lifelong Reinforcement Learning Systems	Jan 27, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Variational Intrinsic Control	Nov 22, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Multi-Stage Reinforcement Learning For Object Detection	Oct 15, 2018	Objectobject-detection	CodeCode Available
Playing Doom with SLAM-Augmented Deep Reinforcement Learning	Dec 1, 2016	Deep Reinforcement Learningobject-detection	CodeCode Available
Reinforcement Learning-based Token Pruning in Vision Transformers: A Markov Game Approach	Mar 30, 2025	Decision MakingReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning Based Temporal Logic Control with Maximum Probabilistic Satisfaction	Oct 14, 2020	Motion Planningreinforcement-learning	CodeCode Available
SOReL and TOReL: Two Methods for Fully Offline Reinforcement Learning	May 28, 2025	Offline RLreinforcement-learning	CodeCode Available
Offline Reinforcement Learning for Learning to Dispatch for Job Shop Scheduling	Sep 16, 2024	Combinatorial Optimizationcounterfactual	CodeCode Available
Reinforcement learning based process optimization and strategy development in conventional tunneling	Apr 17, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available

Show:10 25 50

← PrevPage 263 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified