SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3631–3640 of 15113 papers

Title	Date	Tasks	Status	Hype
Learning Bipedal Walking for Humanoids with Current Feedback	Mar 7, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	3
On the Sample Complexity of Vanilla Model-Based Offline Reinforcement Learning with Dependent Samples	Mar 7, 2023	Offline RLOff-policy evaluation	—Unverified	0
Diminishing Return of Value Expansion Methods in Model-Based Reinforcement Learning	Mar 7, 2023	continuous-controlContinuous Control	CodeCode Available	1
Dexterous In-hand Manipulation by Guiding Exploration with Simple Sub-skill Controllers	Mar 6, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Perspectives on the Social Impacts of Reinforcement Learning with Human Feedback	Mar 6, 2023	Misinformationreinforcement-learning	—Unverified	0
Reinforcement Learning Based Self-play and State Stacking Techniques for Noisy Air Combat Environment	Mar 6, 2023	Reinforcement Learning (RL)	—Unverified	0
MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning	Mar 6, 2023	continuous-controlContinuous Control	—Unverified	0
Safe Reinforcement Learning via Probabilistic Logic Shields	Mar 6, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Efficient Skill Acquisition for Complex Manipulation Tasks in Obstructed Environments	Mar 6, 2023	Deep Reinforcement LearningMotion Planning	—Unverified	0
Ensemble Reinforcement Learning: A Survey	Mar 5, 2023	Ensemble LearningModel Selection	—Unverified	0

Show:10 25 50

← PrevPage 364 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified