SOTAVerified|Agents Browse Leaderboard About

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–710 of 15113 papers

Title	Date	Tasks	Status	Hype
Critic Regularized Regression	Jun 26, 2020	Offline RLregression	CodeCode Available	1
CROP: Conservative Reward for Model-based Offline Policy Optimization	Oct 26, 2023	D4RLOffline RL	CodeCode Available	1
Contextualized Rewriting for Text Summarization	Jan 31, 2021	Extractive Summarizationreinforcement-learning	CodeCode Available	1
Cross Modality 3D Navigation Using Reinforcement Learning and Neural Style Transfer	Nov 5, 2021	Computed Tomography (CT)Diagnostic	CodeCode Available	1
Crowd-Robot Interaction: Crowd-aware Robot Navigation with Attention-based Deep Reinforcement Learning	Sep 24, 2018	Deep Reinforcement LearningHuman Dynamics	CodeCode Available	1
Affordance Learning from Play for Sample-Efficient Policy Learning	Mar 1, 2022	Deep Reinforcement LearningMotion Planning	CodeCode Available	1
Continual World: A Robotic Benchmark For Continual Reinforcement Learning	May 23, 2021	Continual Learningreinforcement-learning	CodeCode Available	1
Controlgym: Large-Scale Control Environments for Benchmarking Reinforcement Learning Algorithms	Nov 30, 2023	BenchmarkingOpenAI Gym	CodeCode Available	1
Actor-Attention-Critic for Multi-Agent Reinforcement Learning	Oct 5, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Cross-Modal Domain Adaptation for Reinforcement Learning	Jan 1, 2021	Domain AdaptationMuJoCo	CodeCode Available	1

Show:10 25 50

← PrevPage 71 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified