SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4471–4480 of 15113 papers

Title	Date	Tasks	Status
Learning Curricula in Open-Ended Worlds	Dec 3, 2023	Decision MakingDeep Reinforcement Learning	—Unverified
BenchMARL: Benchmarking Multi-Agent Reinforcement Learning	Dec 3, 2023	BenchmarkingMulti-agent Reinforcement Learning	—Unverified
Self-Critical Alternate Learning based Semantic Broadcast Communication	Dec 3, 2023	Reinforcement Learning (RL)Semantic Communication	—Unverified
A Survey of Temporal Credit Assignment in Deep Reinforcement Learning	Dec 2, 2023	Decision MakingDeep Reinforcement Learning	—Unverified
DDxT: Deep Generative Transformer Models for Differential Diagnosis	Dec 2, 2023	Reinforcement Learning (RL)Self-Supervised Learning	CodeCode Available
A Multifidelity Sim-to-Real Pipeline for Verifiable and Compositional Reinforcement Learning	Dec 2, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Efficient Off-Policy Safe Reinforcement Learning Using Trust Region Conditional Value at Risk	Dec 1, 2023	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Tracking Object Positions in Reinforcement Learning: A Metric for Keypoint Detection (extended version)	Dec 1, 2023	Keypoint DetectionReinforcement Learning (RL)	CodeCode Available
Safe Reinforcement Learning in Tensor Reproducing Kernel Hilbert Space	Dec 1, 2023	reinforcement-learningReinforcement Learning	—Unverified
Optimal Attack and Defense for Reinforcement Learning	Nov 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 448 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified