Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1926–1950 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Backprop-Free Reinforcement Learning with Active Neural Generative Coding	Jul 10, 2021	Q-Learningreinforcement-learning	CodeCode Available	1	5
Bidirectional Model-based Policy Optimization	Jul 4, 2020	Decision Makingmodel	CodeCode Available	1	5
Guiding Online Reinforcement Learning with Action-Free Offline Pretraining	Jan 30, 2023	Offline RLreinforcement-learning	CodeCode Available	1	5
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining	Oct 1, 2024	Atari Gamesmodel	CodeCode Available	1	5
ScheduleNet: Learn to solve multi-agent scheduling problems with reinforcement learning	Jun 6, 2021	Decision MakingGraph Attention	CodeCode Available	1	5
Adaptive Risk-Tendency: Nano Drone Navigation in Cluttered Environments with Distributional Reinforcement Learning	Mar 28, 2022	Distributional Reinforcement LearningDrone navigation	CodeCode Available	1	5
Addressing Function Approximation Error in Actor-Critic Methods	Feb 26, 2018	Continuous ControlOpenAI Gym	CodeCode Available	1	5
Beyond Greedy Search: Tracking by Multi-Agent Reinforcement Learning-based Beam Search	May 19, 2022	Decision MakingImage Captioning	CodeCode Available	1	5
A Search-Based Testing Approach for Deep Reinforcement Learning Agents	Jun 15, 2022	Autonomous DrivingDecision Making	CodeCode Available	1	5
GUI-G1: Understanding R1-Zero-Like Training for Visual Grounding in GUI Agents	May 21, 2025	Answer GenerationReinforcement Learning (RL)	CodeCode Available	1	5
Gym-ANM: Reinforcement Learning Environments for Active Network Management Tasks in Electricity Distribution Systems	Mar 14, 2021	ManagementModel Predictive Control	CodeCode Available	1	5
Beyond OOD State Actions: Supported Cross-Domain Offline Reinforcement Learning	Jun 22, 2023	Data AugmentationOffline RL	CodeCode Available	1	5
Hearts Gym: Learning Reinforcement Learning as a Team Event	Sep 7, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Beyond Pick-and-Place: Tackling Robotic Stacking of Diverse Shapes	Oct 12, 2021	Offline RLReinforcement Learning (RL)	CodeCode Available	1	5
Improving Model-Based Reinforcement Learning with Internal State Representations through Self-Supervision	Feb 10, 2021	Board GamesModel-based Reinforcement Learning	CodeCode Available	1	5
Self-Activating Neural Ensembles for Continual Reinforcement Learning	Dec 31, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Improving the Validity of Automatically Generated Feedback via Reinforcement Learning	Mar 2, 2024	MathMisconceptions	CodeCode Available	1	5
Harnessing Mixed Offline Reinforcement Learning Datasets via Trajectory Weighting	Jun 22, 2023	Offline RLreinforcement-learning	CodeCode Available	1	5
Self-Paced Contextual Reinforcement Learning	Oct 7, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Information Design in Multi-Agent Reinforcement Learning	May 8, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Harnessing Discrete Representations For Continual Reinforcement Learning	Dec 2, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
A multi-agent reinforcement learning model of common-pool resource appropriation	Jul 20, 2017	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1	5
Self-Supervised Discovering of Interpretable Features for Reinforcement Learning	Mar 16, 2020	Atari GamesDecision Making	CodeCode Available	1	5
HAZARD Challenge: Embodied Decision Making in Dynamically Changing Environments	Jan 23, 2024	Common Sense ReasoningDecision Making	CodeCode Available	1	5
Optimization Methods for Interpretable Differentiable Decision Trees in Reinforcement Learning	Mar 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 78 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified