SOTAVerified|Agents Browse Leaderboard About

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 981–990 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Automatic Data Augmentation for Generalization in Reinforcement Learning	Dec 1, 2021	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1	5
A Multiplicative Value Function for Safe and Efficient Reinforcement Learning	Mar 7, 2023	Navigatereinforcement-learning	CodeCode Available	1	5
ABIDES-Gym: Gym Environments for Multi-Agent Discrete Event Simulation and Application to Financial Markets	Oct 27, 2021	OpenAI GymReinforcement Learning (RL)	CodeCode Available	1	5
Dataset Reset Policy Optimization for RLHF	Apr 12, 2024	Reinforcement Learning (RL)	CodeCode Available	1	5
Automatic Curriculum Learning through Value Disagreement	Jun 17, 2020	Reinforcement Learning (RL)	CodeCode Available	1	5
Don't Change the Algorithm, Change the Data: Exploratory Data for Offline Reinforcement Learning	Jan 31, 2022	DiversityOffline RL	CodeCode Available	1	5
Improving the Validity of Automatically Generated Feedback via Reinforcement Learning	Mar 2, 2024	MathMisconceptions	CodeCode Available	1	5
Don't Touch What Matters: Task-Aware Lipschitz Data Augmentation for Visual Reinforcement Learning	Feb 21, 2022	Data AugmentationDiversity	CodeCode Available	1	5
Inclined Quadrotor Landing using Deep Reinforcement Learning	Mar 16, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Dream to Control: Learning Behaviors by Latent Imagination	Dec 3, 2019	Continuous Controlreinforcement-learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 99 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified