Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2776–2800 of 15113 papers

Title	Date	Tasks	Status	Score
AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting	May 24, 2025	GSM8KReinforcement Learning (RL)	CodeCode Available	5
Incentivizing Reasoning from Weak Supervision	May 26, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	5
Incorporating Rivalry in Reinforcement Learning for a Competitive Game	Aug 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
A Study on Overfitting in Deep Reinforcement Learning	Apr 18, 2018	Deep Reinforcement LearningInductive Bias	CodeCode Available	5
AgentForge: A Flexible Low-Code Platform for Reinforcement Learning Agent Design	Oct 25, 2024	Decision MakingReinforcement Learning (RL)	CodeCode Available	5
Gradient Importance Learning for Incomplete Observations	Jul 5, 2021	ImputationMissing Values	CodeCode Available	5
A Study of Reinforcement Learning for Neural Machine Translation	Aug 27, 2018	Machine TranslationNMT	CodeCode Available	5
Improving Unsupervised Hierarchical Representation with Reinforcement Learning	Jan 1, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models	Jul 3, 2015	Atari Gamesreinforcement-learning	CodeCode Available	5
Increasing Data Efficiency of Driving Agent By World Model	Dec 14, 2020	Autonomous Drivingreinforcement-learning	CodeCode Available	5
Information-Directed Exploration for Deep Reinforcement Learning	Dec 18, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Learning Fair Policies in Multiobjective (Deep) Reinforcement Learning with Average and Discounted Rewards	Aug 18, 2020	Deep Reinforcement LearningFairness	CodeCode Available	5
A Study of Plasticity Loss in On-Policy Deep Reinforcement Learning	May 29, 2024	Continual LearningDeep Reinforcement Learning	CodeCode Available	5
Improving Robustness of Deep Reinforcement Learning Agents: Environment Attack based on the Critic Network	Apr 7, 2021	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	5
Improving Generalization in Reinforcement Learning Training Regimes for Social Robot Navigation	Aug 29, 2023	Decision MakingNavigate	CodeCode Available	5
Improving Sample Efficiency of Reinforcement Learning with Background Knowledge from Large Language Models	Jul 4, 2024	Common Sense ReasoningReinforcement Learning (RL)	CodeCode Available	5
A Structured Prediction Approach for Generalization in Cooperative Multi-Agent Reinforcement Learning	Oct 19, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Improving reinforcement learning algorithms: towards optimal learning rate policies	Nov 6, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improving Reinforcement Learning Based Image Captioning with Natural Language Prior	Sep 13, 2018	Image Captioningreinforcement-learning	CodeCode Available	5
Improving Portfolio Optimization Results with Bandit Networks	Oct 5, 2024	Portfolio OptimizationRecommendation Systems	CodeCode Available	5
Improving Policy Optimization with Generalist-Specialist Learning	Jun 26, 2022	Deep Reinforcement LearningImitation Learning	CodeCode Available	5
Improving Post-Processing of Audio Event Detectors Using Reinforcement Learning	Aug 19, 2022	Classificationreinforcement-learning	CodeCode Available	5
RH-Net: Improving Neural Relation Extraction via Reinforcement Learning and Hierarchical Relational Searching	Oct 27, 2020	Denoisingreinforcement-learning	CodeCode Available	5
Improving Information Extraction by Acquiring External Evidence with Reinforcement Learning	Mar 25, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improving Generalization on the ProcGen Benchmark with Simple Architectural Changes and Scale	Oct 13, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 112 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified