Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14951–15000 of 15113 papers

Title	Date	Tasks	Status
Learning Time-Sensitive Strategies in Space Fortress	May 17, 2018	Atari GamesReinforcement Learning	CodeCode Available
Continuous-Time Mean-Variance Portfolio Selection: A Reinforcement Learning Framework	Apr 25, 2019	Continuous ControlPortfolio Optimization	CodeCode Available
Guided Exploration in Reinforcement Learning via Monte Carlo Critic Optimization	Jun 25, 2022	continuous-controlContinuous Control	CodeCode Available
Exchangeable Models in Meta Reinforcement Learning	Jun 12, 2020	Meta Reinforcement Learningreinforcement-learning	CodeCode Available
Guided Feature Transformation (GFT): A Neural Language Grounding Module for Embodied Agents	May 22, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Learning from Trajectories via Subgoal Discovery	Nov 3, 2019	Imitation LearningReinforcement Learning	CodeCode Available
Action Priors for Large Action Spaces in Robotics	Jan 11, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Continuous Doubly Constrained Batch Reinforcement Learning	Feb 18, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
ExIt-OOS: Towards Learning from Planning in Imperfect Information Games	Aug 30, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Guided Policy Optimization under Partial Observability	May 21, 2025	continuous-controlContinuous Control	CodeCode Available
Incorporating Rivalry in Reinforcement Learning for a Competitive Game	Aug 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Learning When to Think: Shaping Adaptive Reasoning in R1-Style Models via Multi-Stage RL	May 16, 2025	Reinforcement Learning (RL)	CodeCode Available
An Atari Model Zoo for Analyzing, Visualizing, and Comparing Deep Reinforcement Learning Agents	Dec 17, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
LEACH-RLC: Enhancing IoT Data Transmission with Optimized Clustering and Reinforcement Learning	Jan 28, 2024	Clusteringreinforcement-learning	CodeCode Available
GuideLight: "Industrial Solution" Guidance for More Practical Traffic Signal Control Agents	Jul 15, 2024	Reinforcement Learning (RL)Traffic Signal Control	CodeCode Available
Continuous Deep Q-Learning with Simulator for Stabilization of Uncertain Discrete-Time Systems	Jan 13, 2021	Q-LearningReinforcement Learning (RL)	CodeCode Available
Guiding Evolutionary Strategies by Differentiable Robot Simulators	Oct 1, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Bayesian Inference with Anchored Ensembles of Neural Networks, and Application to Exploration in Reinforcement Learning	May 29, 2018	Bayesian Inferencereinforcement-learning	CodeCode Available
Increasing Data Efficiency of Driving Agent By World Model	Dec 14, 2020	Autonomous Drivingreinforcement-learning	CodeCode Available
Bayesian Design Principles for Offline-to-Online Reinforcement Learning	May 31, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Continuous Control With Ensemble Deep Deterministic Policy Gradients	Nov 30, 2021	continuous-controlContinuous Control	CodeCode Available
Bayesian Curiosity for Efficient Exploration in Reinforcement Learning	Nov 20, 2019	Efficient Explorationreinforcement-learning	CodeCode Available
Experiential Explanations for Reinforcement Learning	Oct 10, 2022	Chunkingcounterfactual	CodeCode Available
Adaptive Discretization for Episodic Reinforcement Learning in Metric Spaces	Oct 17, 2019	Q-Learningreinforcement-learning	CodeCode Available
Increasing performance of electric vehicles in ride-hailing services using deep reinforcement learning	Dec 7, 2019	Autonomous VehiclesDecision Making	CodeCode Available
Experimental evaluation of offline reinforcement learning for HVAC control in buildings	Aug 15, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available
Increasing the Action Gap: New Operators for Reinforcement Learning	Dec 15, 2015	Atari GamesQ-Learning	CodeCode Available
Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning	Oct 15, 2024	D4RLModel-based Reinforcement Learning	CodeCode Available
Learning Generalizable Device Placement Algorithms for Distributed Machine Learning	Dec 1, 2019	BIG-bench Machine LearningReinforcement Learning	CodeCode Available
Batch Value-function Approximation with Only Realizability	Aug 11, 2020	Model SelectionReinforcement Learning (RL)	CodeCode Available
Expert-Free Online Transfer Learning in Multi-Agent Reinforcement Learning	Jan 26, 2025	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Learning Generalizable Representations for Reinforcement Learning via Adaptive Meta-learner of Behavioral Similarities	Dec 26, 2022	Data Augmentationreinforcement-learning	CodeCode Available
Expert Proximity as Surrogate Rewards for Single Demonstration Imitation Learning	Feb 1, 2024	Imitation LearningMuJoCo	CodeCode Available
gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo	Mar 14, 2019	BenchmarkingOpenAI Gym	CodeCode Available
Continuous-action Reinforcement Learning for Playing Racing Games: Comparing SPG to PPO	Jan 15, 2020	OpenAI Gymreinforcement-learning	CodeCode Available
EXPIL: Explanatory Predicate Invention for Learning in Games	Jun 10, 2024	Reinforcement Learning (RL)	CodeCode Available
Gym-Ignition: Reproducible Robotic Simulations for Reinforcement Learning	Nov 5, 2019	OpenAI Gymreinforcement-learning	CodeCode Available
BaRC: Backward Reachability Curriculum for Robotic Reinforcement Learning	Jun 16, 2018	continuous-controlContinuous Control	CodeCode Available
Balancing Value Underestimation and Overestimation with Realistic Actor-Critic	Oct 19, 2021	continuous-controlContinuous Control	CodeCode Available
Explainable Action Advising for Multi-Agent Reinforcement Learning	Nov 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Adaptive Diffusion Policy Optimization for Robotic Manipulation	May 13, 2025	continuous-controlContinuous Control	CodeCode Available
Attention-Based Reward Shaping for Sparse and Delayed Rewards	May 16, 2025	Reinforcement Learning (RL)	CodeCode Available
Explainable and Safe Reinforcement Learning for Autonomous Air Mobility	Nov 24, 2022	Adversarial AttackDeep Reinforcement Learning	CodeCode Available
Learning to Ask Medical Questions using Reinforcement Learning	Mar 31, 2020	feature selectionreinforcement-learning	CodeCode Available
An analysis of Reinforcement Learning applied to Coach task in IEEE Very Small Size Soccer	Nov 23, 2020	Reinforcement Learning (RL)	CodeCode Available
Balancing the Scales: Reinforcement Learning for Fair Classification	Jul 15, 2024	ClassificationFairness	CodeCode Available
Adversarial Online Multi-Task Reinforcement Learning	Jan 11, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Learning to Schedule Communication in Multi-agent Reinforcement Learning	Feb 5, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
Balancing detectability and performance of attacks on the control channel of Markov Decision Processes	Sep 15, 2021	Reinforcement Learning (RL)	CodeCode Available
Continual Task Learning through Adaptive Policy Self-Composition	Nov 18, 2024	Continual LearningOffline RL	CodeCode Available

Show:10 25 50

← PrevPage 300 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified