SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 211–220 of 755 papers

Title	Date	Tasks	Status	Hype	Score
Compositional Conservatism: A Transductive Approach in Offline Reinforcement Learning	Apr 6, 2024	D4RLOffline RL	CodeCode Available	0	5
Optimistic Critic Reconstruction and Constrained Fine-Tuning for General Offline-to-Online RL	Dec 25, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	0	5
On the Effectiveness of Offline RL for Dialogue Response Generation	Jul 23, 2023	Offline RLreinforcement-learning	CodeCode Available	0	5
On Practical Reinforcement Learning: Provable Robustness, Scalability, and Statistical Efficiency	Mar 3, 2022	Offline RLreinforcement-learning	CodeCode Available	0	5
Off-policy Evaluation in Doubly Inhomogeneous Environments	Jun 14, 2023	Offline RLOff-policy evaluation	CodeCode Available	0	5
Offline RL With Resource Constrained Online Deployment	Oct 7, 2021	D4RLOffline RL	CodeCode Available	0	5
Offline RL with Smooth OOD Generalization in Convex Hull and its Neighborhood	Jun 10, 2025	Computational EfficiencyD4RL	CodeCode Available	0	5
Active Advantage-Aligned Online Reinforcement Learning with Offline Data	Feb 11, 2025	Offline RLreinforcement-learning	CodeCode Available	0	5
A Survey on Offline Reinforcement Learning: Taxonomy, Review, and Open Problems	Mar 2, 2022	Offline RLreinforcement-learning	CodeCode Available	0	5
DR-SAC: Distributionally Robust Soft Actor-Critic for Reinforcement Learning under Uncertainty	Jun 14, 2025	continuous-controlContinuous Control	CodeCode Available	0	5

Show:10 25 50

← PrevPage 22 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified