Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2926–2950 of 15113 papers

Title	Date	Tasks	Status	Score
Influence-Based Multi-Agent Exploration	Oct 12, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Impartial Games: A Challenge for Reinforcement Learning	May 25, 2022	Board GamesPosition	CodeCode Available	5
Imperfect also Deserves Reward: Multi-Level and Sequential Reward Modeling for Better Dialog Management	Apr 10, 2021	Managementreinforcement-learning	CodeCode Available	5
Imitation Learning for Sentence Generation with Dilated Convolutions Using Adversarial Training	Aug 15, 2019	DiversityGenerative Adversarial Network	CodeCode Available	5
Controlling epidemics through optimal allocation of test kits and vaccine doses across networks	Jul 29, 2021	Managementreinforcement-learning	CodeCode Available	5
Imitation Learning by Reinforcement Learning	Aug 10, 2021	continuous-controlContinuous Control	CodeCode Available	5
Quantum enhancements for deep reinforcement learning in large spaces	Oct 28, 2019	BIG-bench Machine LearningDecision Making	CodeCode Available	5
Input Convex Neural Networks	Sep 22, 2016	ImputationInference Optimization	CodeCode Available	5
IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning	May 15, 2025	Efficient ExplorationImitation Learning	CodeCode Available	5
Dealing with uncertainty: balancing exploration and exploitation in deep recurrent reinforcement learning	Oct 12, 2023	Autonomous Drivingreinforcement-learning	CodeCode Available	5
Continuous-action Reinforcement Learning for Playing Racing Games: Comparing SPG to PPO	Jan 15, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	5
Continual Task Learning through Adaptive Policy Self-Composition	Nov 18, 2024	Continual LearningOffline RL	CodeCode Available	5
A Robust Quantile Huber Loss With Interpretable Parameter Adjustment In Distributional Reinforcement Learning	Jan 4, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Imitate the Good and Avoid the Bad: An Incremental Approach to Safe Reinforcement Learning	Dec 16, 2023	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	5
Control of Continuous Quantum Systems with Many Degrees of Freedom based on Convergent Reinforcement Learning	Dec 21, 2022	Deep Reinforcement LearningQ-Learning	CodeCode Available	5
Importance Prioritized Policy Distillation	Aug 25, 2022	Atari GamesDecision Making	CodeCode Available	5
Imagination-Augmented Agents for Deep Reinforcement Learning	Jul 19, 2017	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	5
Illuminating Generalization in Deep Reinforcement Learning through Procedural Level Generation	Jun 28, 2018	ClusteringDeep Reinforcement Learning	CodeCode Available	5
IGN : Implicit Generative Networks	Jun 13, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Continual Reinforcement Learning in 3D Non-stationary Environments	May 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Continual Reinforcement Learning for HVAC Systems Control: Integrating Hypernetworks and Transfer Learning	Mar 24, 2025	Continual LearningDeep Reinforcement Learning	CodeCode Available	5
A Framework for Automated Cellular Network Tuning with Reinforcement Learning	Aug 13, 2018	ManagementQ-Learning	CodeCode Available	5
IKEA Furniture Assembly Environment for Long-Horizon Complex Manipulation Tasks	Nov 17, 2019	Industrial Robotsreinforcement-learning	CodeCode Available	5
Imagining In-distribution States: How Predictable Robot Behavior Can Enable User Control Over Learned Policies	Jun 19, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Continual Policy Distillation of Reinforcement Learning-based Controllers for Soft Robotic In-Hand Manipulation	Apr 5, 2024	Reinforcement Learning (RL)	CodeCode Available	5

Show:10 25 50

← PrevPage 118 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified