Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4176–4200 of 15113 papers

Title	Date	Tasks	Status	Score
Reducing Overestimation Bias in Multi-Agent Domains Using Double Centralized Critics	Oct 3, 2019	Multi-agent Reinforcement LearningReinforcement Learning	CodeCode Available	5
Monitored Markov Decision Processes	Feb 9, 2024	Reinforcement Learning (RL)	CodeCode Available	5
On Credit Assignment in Hierarchical Reinforcement Learning	Mar 7, 2022	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5
Mutation Testing of Deep Reinforcement Learning Based on Real Faults	Jan 13, 2023	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Towards Optimally Decentralized Multi-Robot Collision Avoidance via Deep Reinforcement Learning	Sep 28, 2017	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available	5
Robust Offline Reinforcement learning with Heavy-Tailed Rewards	Oct 28, 2023	Offline RLOff-policy evaluation	CodeCode Available	5
Towards optimized actions in critical situations of soccer games with deep reinforcement learning	Sep 14, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Personalized Exercise Recommendation with Semantically-Grounded Knowledge Tracing	Jul 15, 2025	Knowledge TracingMath	CodeCode Available	5
Monolithic vs. hybrid controller for multi-objective Sim-to-Real learning	Aug 17, 2021	Reinforcement Learning (RL)	CodeCode Available	5
Refining Few-Step Text-to-Multiview Diffusion via Reinforcement Learning	May 26, 2025	Denoisingreinforcement-learning	CodeCode Available	5
Robust On-Policy Sampling for Data-Efficient Policy Evaluation in Reinforcement Learning	Nov 29, 2021	Offline RLreinforcement-learning	CodeCode Available	5
Solving Offline Reinforcement Learning with Decision Tree Regression	Jan 21, 2024	D4RLFeature Importance	CodeCode Available	5
Towards Practical Multi-Object Manipulation using Relational Reinforcement Learning	Dec 23, 2019	Objectreinforcement-learning	CodeCode Available	5
Robust optimal well control using an adaptive multi-grid reinforcement learning framework	Jul 7, 2022	Computational Efficiencyreinforcement-learning	CodeCode Available	5
Mutual Information Based Knowledge Transfer Under State-Action Dimension Mismatch	Jun 12, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	5
Robust Policy Optimization in Deep Reinforcement Learning	Dec 14, 2022	continuous-controlContinuous Control	CodeCode Available	5
Towards Robust Deep Reinforcement Learning for Traffic Signal Control: Demand Surges, Incidents and Sensor Failures	Apr 17, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	5
UNSAT Solver Synthesis via Monte Carlo Forest Search	Nov 22, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Personalized Multimorbidity Management for Patients with Type 2 Diabetes Using Reinforcement Learning of Electronic Health Records	Oct 29, 2020	Managementreinforcement-learning	CodeCode Available	5
Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and Smoothness	Sep 29, 2023	Offline RLreinforcement-learning	CodeCode Available	5
Towards Safe Mechanical Ventilation Treatment Using Deep Offline Reinforcement Learning	Oct 5, 2022	Deep Reinforcement LearningQ-Learning	CodeCode Available	5
Towards Safe Policy Improvement for Non-Stationary MDPs	Oct 23, 2020	Decision Makingreinforcement-learning	CodeCode Available	5
Kernel-Based Reinforcement Learning: A Finite-Time Analysis	Apr 12, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Towards Sample Efficient Agents through Algorithmic Alignment	Aug 7, 2020	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	5
MyCaffe: A Complete C# Re-Write of Caffe with Reinforcement Learning	Oct 4, 2018	Deep Learningreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 168 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified