Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1775 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Hindsight Experience Replay	Jul 5, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
Example-guided learning of stochastic human driving policies using deep reinforcement learning	Dec 23, 2022	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	1	5
An empirical investigation of the challenges of real-world reinforcement learning	Mar 24, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
Execution-based Code Generation using Deep Reinforcement Learning	Jan 31, 2023	Code CompletionCode Generation	CodeCode Available	1	5
Benchmarking Actor-Critic Deep Reinforcement Learning Algorithms for Robotics Control with Action Constraints	Apr 18, 2023	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1	5
Hindsight Preference Learning for Offline Preference-based Reinforcement Learning	Jul 5, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Hierarchical Reinforcement Learning with Timed Subgoals	Dec 6, 2021	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Believe What You See: Implicit Constraint Approach for Offline Multi-Agent Reinforcement Learning	Jun 7, 2021	Multi-agent Reinforcement LearningOffline RL	CodeCode Available	1	5
Simplified Action Decoder for Deep Multi-Agent Reinforcement Learning	Dec 4, 2019	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1	5
Exploiting Multimodal Reinforcement Learning for Simultaneous Machine Translation	Feb 22, 2021	Machine Translationreinforcement-learning	CodeCode Available	1	5
Explainable Reinforcement Learning for Longitudinal Control	Feb 6, 2021	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	1	5
Hierarchical Skills for Efficient Exploration	Oct 20, 2021	continuous-controlContinuous Control	CodeCode Available	1	5
Reactive Exploration to Cope with Non-Stationarity in Lifelong Reinforcement Learning	Jul 12, 2022	Lifelong learningPolicy Gradient Methods	CodeCode Available	1	5
Explainable Reinforcement Learning via a Causal World Model	May 4, 2023	modelreinforcement-learning	CodeCode Available	1	5
Explaining Autonomous Driving Actions with Visual Question Answering	Jul 19, 2023	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1	5
RealAnt: An Open-Source Low-Cost Quadruped for Education and Research in Real-World Reinforcement Learning	Nov 5, 2020	MuJoCoreinforcement-learning	CodeCode Available	1	5
Behavior Proximal Policy Optimization	Feb 22, 2023	D4RLOffline RL	CodeCode Available	1	5
Bellman: A Toolbox for Model-Based Reinforcement Learning in TensorFlow	Mar 26, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Hierarchical Reinforcement Learning for Power Network Topology Control	Nov 3, 2023	AllHierarchical Reinforcement Learning	CodeCode Available	1	5
Hierarchical Kickstarting for Skill Transfer in Reinforcement Learning	Jul 23, 2022	Inductive BiasNetHack	CodeCode Available	1	5
Behavior From the Void: Unsupervised Active Pre-Training	Mar 8, 2021	Atari GamesReinforcement Learning (RL)	CodeCode Available	1	5
Hierarchical Learning-based Graph Partition for Large-scale Vehicle Routing Problems	Feb 12, 2025	Reinforcement Learning (RL)	CodeCode Available	1	5
Automatic Data Augmentation for Generalization in Deep Reinforcement Learning	Jun 23, 2020	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1	5
Automatic Data Augmentation for Generalization in Reinforcement Learning	Dec 1, 2021	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1	5
Hierarchical clustering in particle physics through reinforcement learning	Nov 16, 2020	Clusteringreinforcement-learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 71 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified