Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13551–13600 of 15113 papers

Title	Date	Tasks	Status
Weakly Supervised Scene Text Detection using Deep Reinforcement Learning	Jan 13, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Viewpoint Optimization for Autonomous Strawberry Harvesting with Deep Reinforcement Learning	Mar 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Optimizing Warfarin Dosing using Deep Reinforcement Learning	Feb 7, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
When to Sense and Control? A Time-adaptive Approach for Continuous-Time RL	Jun 3, 2024	Reinforcement Learning (RL)	CodeCode Available
Scalable agent alignment via reward modeling: a research direction	Nov 19, 2018	Atari Gamesreinforcement-learning	CodeCode Available
UVIP: Model-Free Approach to Evaluate Reinforcement Learning Algorithms	May 5, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
VIME: Variational Information Maximizing Exploration	May 31, 2016	continuous-controlContinuous Control	CodeCode Available
Multi-Agent Common Knowledge Reinforcement Learning	Oct 27, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
RamseyRL: A Framework for Intelligent Ramsey Number Counterexample Searching	Aug 23, 2023	Reinforcement Learning (RL)	CodeCode Available
VINE: An Open Source Interactive Data Visualization Tool for Neuroevolution	May 3, 2018	Data VisualizationEvolutionary Algorithms	CodeCode Available
MineRL: A Large-Scale Dataset of Minecraft Demonstrations	Jul 29, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available
Scalable Coordinated Exploration in Concurrent Reinforcement Learning	May 23, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Successive Convex Approximation Based Off-Policy Optimization for Constrained Reinforcement Learning	May 26, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
MAC-PO: Multi-Agent Experience Replay via Collective Priority Optimization	Feb 21, 2023	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available
Successor Feature Landmarks for Long-Horizon Goal-Conditioned Reinforcement Learning	Nov 18, 2021	Efficient Explorationreinforcement-learning	CodeCode Available
Weak Supervision for Fake News Detection via Reinforcement Learning	Dec 28, 2019	ArticlesFake News Detection	CodeCode Available
Towards a Reinforcement Learning Environment Toolbox for Intelligent Electric Motor Control	Oct 21, 2019	Model Predictive ControlOpenAI Gym	CodeCode Available
Scalable Evaluation of Online Facilitation Strategies via Synthetic Simulation of Discussions	Mar 13, 2025	Reinforcement Learning (RL)	CodeCode Available
VIREL: A Variational Inference Framework for Reinforcement Learning	Nov 3, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Successor Options: An Option Discovery Framework for Reinforcement Learning	May 14, 2019	Navigatereinforcement-learning	CodeCode Available
Using machine learning to inform harvest control rule design in complex fishery settings	Dec 16, 2024	Bayesian OptimizationManagement	CodeCode Available
Successor Representation Active Inference	Jul 20, 2022	Reinforcement Learning (RL)	CodeCode Available
Successor Uncertainties: Exploration and Uncertainty in Temporal Difference Learning	Oct 15, 2018	Decision Makingreinforcement-learning	CodeCode Available
RAIN: Reinforcement Algorithms for Improving Numerical Weather and Climate Models	Aug 28, 2024	Reinforcement Learning (RL)	CodeCode Available
Meta-Gradient Reinforcement Learning	May 24, 2018	Meta-Learningreinforcement-learning	CodeCode Available
Optimizing thermodynamic trajectories using evolutionary and gradient-based reinforcement learning	Mar 20, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Virtual Augmented Reality for Atari Reinforcement Learning	Oct 12, 2023	Image Segmentationreinforcement-learning	CodeCode Available
RACCER: Towards Reachable and Certain Counterfactual Explanations for Reinforcement Learning	Mar 8, 2023	counterfactualreinforcement-learning	CodeCode Available
Mastering the Game of Sungka from Random Play	May 17, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Towards Augmented Microscopy with Reinforcement Learning-Enhanced Workflows	Aug 4, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Optimizing the Neural Architecture of Reinforcement Learning Agents	Nov 30, 2020	Atari GamesMeta Reinforcement Learning	CodeCode Available
Multi-Agent Advisor Q-Learning	Oct 26, 2021	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available
QVMix and QVMix-Max: Extending the Deep Quality-Value Family of Algorithms to Cooperative Multi-Agent Reinforcement Learning	Dec 22, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Multi-Agent Adversarial Inverse Reinforcement Learning	Jul 30, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Q-Value Weighted Regression: Reinforcement Learning with Limited Data	Feb 12, 2021	Atari Gamescontinuous-control	CodeCode Available
Neural Keyphrase Generation via Reinforcement Learning with Adaptive Rewards	Jun 10, 2019	Keyphrase Generationreinforcement-learning	CodeCode Available
Using Natural Language and Program Abstractions to Instill Human Inductive Biases in Machines	May 23, 2022	Meta-LearningMeta Reinforcement Learning	CodeCode Available
Using Natural Language for Reward Shaping in Reinforcement Learning	Mar 5, 2019	Atari GamesMontezuma's Revenge	CodeCode Available
Super Reinforcement Bros: Playing Super Mario Bros with Reinforcement Learning	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Using Offline Data to Speed Up Reinforcement Learning in Procedurally Generated Environments	Apr 18, 2023	Imitation LearningOffline RL	CodeCode Available
Optimizing Power Grid Topologies with Reinforcement Learning: A Survey of Methods and Challenges	Apr 11, 2025	Decision MakingReinforcement Learning (RL)	CodeCode Available
QUOTA: The Quantile Option Architecture for Reinforcement Learning	Nov 5, 2018	Decision MakingDistributional Reinforcement Learning	CodeCode Available
Optimizing Heat Alert Issuance with Reinforcement Learning	Dec 21, 2023	Data AugmentationDecision Making	CodeCode Available
Two-step dynamic obstacle avoidance	Nov 28, 2023	NavigateReinforcement Learning (RL)	CodeCode Available
Massively Parallel Methods for Deep Reinforcement Learning	Jul 15, 2015	Atari GamesDeep Reinforcement Learning	CodeCode Available
Two steps to risk sensitivity	Nov 12, 2021	Decision MakingDistributional Reinforcement Learning	CodeCode Available
Supervised Learning-enhanced Multi-Group Actor Critic for Live Stream Allocation in Feed	Nov 28, 2024	Recommendation SystemsReinforcement Learning (RL)	CodeCode Available
Queueing Network Controls via Deep Reinforcement Learning	Jul 31, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
SUPERVISED POLICY UPDATE	May 1, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available
Supervised Policy Update for Deep Reinforcement Learning	May 29, 2018	Deep Reinforcement LearningMuJoCo	CodeCode Available

Show:10 25 50

← PrevPage 272 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified