SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 261–270 of 755 papers

Title	Date	Tasks	Status	Hype
CLUE: Calibrated Latent Guidance for Offline Reinforcement Learning	Jun 23, 2023	Imitation LearningOffline RL	—Unverified	0
Efficient Online RL Fine Tuning with Offline Pre-trained Policy Only	May 22, 2025	Imitation LearningOffline RL	—Unverified	0
A Fast Convergence Theory for Offline Decision Making	Jun 3, 2024	Decision MakingOffline RL	—Unverified	0
A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning	Nov 27, 2023	Offline RLReinforcement Learning (RL)	—Unverified	0
Improving Multi-Step Reasoning Abilities of Large Language Models with Direct Advantage Policy Optimization	Dec 24, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0
ChiPFormer: Transferable Chip Placement via Offline Decision Transformer	Jun 26, 2023	Offline RLReinforcement Learning (RL)	—Unverified	0
Efficient Imitation Learning with Conservative World Models	May 21, 2024	Imitation LearningOffline RL	—Unverified	0
Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic Settings	May 13, 2021	Offline RL	—Unverified	0
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning	Jan 1, 2024	continuous-controlContinuous Control	—Unverified	0
Dual Generator Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 27 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified