Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3976–4000 of 15113 papers

Title	Date	Tasks	Status	Score
Fast deep reinforcement learning using online adjustments from the past	Oct 18, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Fast Rates for Maximum Entropy Exploration	Mar 14, 2023	Reinforcement Learning (RL)	CodeCode Available	5
Fantastic Rewards and How to Tame Them: A Case Study on Reward Learning for Task-oriented Dialogue Systems	Feb 20, 2023	Learning-To-RankReinforcement Learning (RL)	CodeCode Available	5
Fast, Accurate and Lightweight Super-Resolution with Neural Architecture Search	Jan 22, 2019	Neural Architecture SearchReinforcement Learning	CodeCode Available	5
Fairness Through Counterfactual Utilities	Aug 11, 2021	BIG-bench Machine Learningcounterfactual	CodeCode Available	5
Action-Decision Networks for Visual Tracking With Deep Reinforcement Learning	Jul 1, 2017	Deep Reinforcement LearningGPU	CodeCode Available	5
A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning	Dec 31, 2021	Atari GamesMeta Reinforcement Learning	CodeCode Available	5
An agentic system with reinforcement-learned subsystem improvements for parsing form-like documents	May 16, 2025	FormLanguage Modeling	CodeCode Available	5
Shaping Advice in Deep Multi-Agent Reinforcement Learning	Mar 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Detecting Spiky Corruption in Markov Decision Processes	Jun 30, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Bayesian Curiosity for Efficient Exploration in Reinforcement Learning	Nov 20, 2019	Efficient Explorationreinforcement-learning	CodeCode Available	5
FairStream: Fair Multimedia Streaming Benchmark for Reinforcement Learning Agents	Oct 28, 2024	Fairnessreinforcement-learning	CodeCode Available	5
External Model Motivated Agents: Reinforcement Learning for Enhanced Environment Sampling	Jun 28, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
Extrapolating Beyond Suboptimal Demonstrations via Inverse Reinforcement Learning from Observations	Apr 12, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available	5
A Comparison of Reinforcement Learning Frameworks for Software Testing Tasks	Aug 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Catastrophic Interference in Reinforcement Learning: A Solution Based on Context Division and Knowledge Distillation	Sep 1, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available	5
Extending Environments To Measure Self-Reflection In Reinforcement Learning	Oct 13, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Expressive Priors in Bayesian Neural Networks: Kernel Combinations and Periodic Functions	May 15, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Extended Markov Games to Learn Multiple Tasks in Multi-Agent Reinforcement Learning	Feb 14, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Exploring with Sticky Mittens: Reinforcement Learning with Expert Interventions via Option Templates	Feb 25, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Case-Based Inverse Reinforcement Learning Using Temporal Coherence	Jun 12, 2022	Imitation Learningreinforcement-learning	CodeCode Available	5
Sim-Env: Decoupling OpenAI Gym Environments from Simulation Models	Feb 19, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	5
SimpleDS: A Simple Deep Reinforcement Learning Dialogue System	Jan 18, 2016	Deep Reinforcement LearningFeature Engineering	CodeCode Available	5
Exponential Family Model-Based Reinforcement Learning via Score Matching	Dec 28, 2021	Density EstimationModel-based Reinforcement Learning	CodeCode Available	5
Safety Augmented Value Estimation from Demonstrations (SAVED): Safe Deep Model-Based RL for Sparse Cost Robotic Tasks	May 31, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 160 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified