Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2775 of 15113 papers

Title	Date	Tasks	Status	Score
Infinite Time Horizon Safety of Bayesian Neural Networks	Nov 4, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Influence-aware Memory Architectures for Deep Reinforcement Learning	Nov 18, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Inferring Behavior-Specific Context Improves Zero-Shot Generalization in Reinforcement Learning	Apr 15, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
Influence-Based Multi-Agent Exploration	Oct 12, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Increasing performance of electric vehicles in ride-hailing services using deep reinforcement learning	Dec 7, 2019	Autonomous VehiclesDecision Making	CodeCode Available	5
Increasing the Action Gap: New Operators for Reinforcement Learning	Dec 15, 2015	Atari GamesQ-Learning	CodeCode Available	5
Incorporating Rivalry in Reinforcement Learning for a Competitive Game	Aug 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Accept Synthetic Objects as Real: End-to-End Training of Attentive Deep Visuomotor Policies for Manipulation in Clutter	Sep 24, 2019	Data AugmentationImitation Learning	CodeCode Available	5
Increasing Data Efficiency of Driving Agent By World Model	Dec 14, 2020	Autonomous Drivingreinforcement-learning	CodeCode Available	5
Incentivizing Reasoning from Weak Supervision	May 26, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	5
Agent-Time Attention for Sparse Rewards Multi-Agent Reinforcement Learning	Oct 31, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models	Jul 3, 2015	Atari Gamesreinforcement-learning	CodeCode Available	5
Improving Unsupervised Hierarchical Representation with Reinforcement Learning	Jan 1, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
A0C: Alpha Zero in Continuous Action Space	May 24, 2018	Board Gamesreinforcement-learning	CodeCode Available	5
Agent-State Construction with Auxiliary Inputs	Nov 15, 2022	Decision Makingreinforcement-learning	CodeCode Available	5
Improving the sample-efficiency of neural architecture search with reinforcement learning	Oct 13, 2021	AutoMLDeep Learning	CodeCode Available	5
Gradient Importance Learning for Incomplete Observations	Jul 5, 2021	ImputationMissing Values	CodeCode Available	5
Influencing Reinforcement Learning through Natural Language Guidance	Apr 4, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Improving Sample Efficiency of Reinforcement Learning with Background Knowledge from Large Language Models	Jul 4, 2024	Common Sense ReasoningReinforcement Learning (RL)	CodeCode Available	5
Improving the Efficient Neural Architecture Search via Rewarding Modifications	Dec 17, 2020	Neural Architecture Searchreinforcement-learning	CodeCode Available	5
Improving Robustness of Deep Reinforcement Learning Agents: Environment Attack based on the Critic Network	Apr 7, 2021	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	5
Improving the Performance of Backward Chained Behavior Trees that use Reinforcement Learning	Dec 27, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
A Survey of Deep Network Solutions for Learning Control in Robotics: From Reinforcement to Imitation	Dec 21, 2016	Deep Reinforcement LearningImitation Learning	CodeCode Available	5
RH-Net: Improving Neural Relation Extraction via Reinforcement Learning and Hierarchical Relational Searching	Oct 27, 2020	Denoisingreinforcement-learning	CodeCode Available	5
Improving Generalization in Reinforcement Learning Training Regimes for Social Robot Navigation	Aug 29, 2023	Decision MakingNavigate	CodeCode Available	5

Show:10 25 50

← PrevPage 111 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified