SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 421–430 of 755 papers

Title	Date	Tasks	Status	Hype	Score
Trajectory Data Suffices for Statistically Efficient Learning in Offline RL with Linear q^π-Realizability and Concentrability	May 27, 2024	Computational EfficiencyOffline RL	—Unverified	0	0
Trajectory-wise Iterative Reinforcement Learning Framework for Auto-bidding	Feb 23, 2024	Offline RLreinforcement-learning	—Unverified	0	0
Transferred Q-learning	Feb 9, 2022	Offline RLQ-Learning	—Unverified	0	0
UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning	Jun 5, 2024	D4RLOffline RL	—Unverified	0	0
UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning Leveraging Planning	Nov 22, 2021	Decision MakingOffline RL	—Unverified	0	0
Uncertainty-Aware Decision Transformer for Stochastic Driving Environments	Sep 28, 2023	Autonomous DrivingOffline RL	—Unverified	0	0
Uncertainty-aware Distributional Offline Reinforcement Learning	Mar 26, 2024	Offline RLreinforcement-learning	—Unverified	0	0
Uncertainty Regularized Policy Learning for Offline Reinforcement Learning	Sep 29, 2021	D4RLOffline RL	—Unverified	0	0
Uncertainty Weighted Offline Reinforcement Learning	Jan 1, 2021	Offline RLQ-Learning	—Unverified	0	0
Understanding Reinforcement Learning Algorithms: The Progress from Basic Q-learning to Proximal Policy Optimization	Mar 31, 2023	Offline RLQ-Learning	—Unverified	0	0

Show:10 25 50

← PrevPage 43 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified