SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4361–4370 of 15113 papers

Title	Date	Tasks	Status
Addressing the issue of stochastic environments and local decision-making in multi-objective reinforcement learning	Nov 16, 2022	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
Data-pooling Reinforcement Learning for Personalized Healthcare Intervention	Nov 16, 2022	Decision MakingManagement	—Unverified
Reinforcement Learning Methods for Wordle: A POMDP/Adaptive Control Approach	Nov 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
APT: Adaptive Perceptual quality based camera Tuning using reinforcement learning	Nov 15, 2022	object-detectionObject Detection	—Unverified
General Intelligence Requires Rethinking Exploration	Nov 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Explainable Action Advising for Multi-Agent Reinforcement Learning	Nov 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Contextual Transformer for Offline Meta Reinforcement Learning	Nov 15, 2022	D4RLMeta Reinforcement Learning	—Unverified
Agent-State Construction with Auxiliary Inputs	Nov 15, 2022	Decision Makingreinforcement-learning	CodeCode Available
Universal Distributional Decision-based Black-box Adversarial Attack with Reinforcement Learning	Nov 15, 2022	Adversarial Attackreinforcement-learning	—Unverified
Offline Reinforcement Learning with Adaptive Behavior Regularization	Nov 15, 2022	D4RLOffline RL	—Unverified

Show:10 25 50

← PrevPage 437 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified