SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4421–4430 of 15113 papers

Title	Date	Tasks	Status
A General Framework for Sample-Efficient Function Approximation in Reinforcement Learning	Sep 30, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Generalised Inverse Reinforcement Learning Framework	May 25, 2021	OpenAI Gymreinforcement-learning	—Unverified
A Generalized Natural Actor-Critic Algorithm	Dec 1, 2009	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Generalized Projected Bellman Error for Off-policy Value Estimation in Reinforcement Learning	Apr 28, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Generalized Reinforcement Learning Algorithm for Online 3D Bin-Packing	Jul 1, 2020	3D Bin PackingDeep Reinforcement Learning	—Unverified
A General Perspective on Objectives of Reinforcement Learning	Jun 5, 2023	reinforcement-learningReinforcement Learning	—Unverified
A General Theory of Relativity in Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Generative Framework for Simultaneous Machine Translation	Nov 1, 2021	Machine Translationreinforcement-learning	—Unverified
Agent-Agnostic Human-in-the-Loop Reinforcement Learning	Jan 15, 2017	reinforcement-learningReinforcement Learning	—Unverified
Agent-Aware Dropout DQN for Safe and Efficient On-line Dialogue Policy Learning	Sep 1, 2017	Automatic Speech Recognition (ASR)Dialogue Management	—Unverified

Show:10 25 50

← PrevPage 443 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified