SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 661–670 of 755 papers

Title	Date	Tasks	Status	Hype	Score
LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble	Nov 26, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0	0
LLQL: Logistic Likelihood Q-Learning for Reinforcement Learning	Jul 5, 2023	Offline RLQ-Learning	—Unverified	0	0
Language Decision Transformers with Exponential Tilt for Interactive Text Environments	Feb 10, 2023	Offline RL	—Unverified	0	0
Measurement Scheduling for ICU Patients with Offline Reinforcement Learning	Feb 12, 2024	Offline RLreinforcement-learning	—Unverified	0	0
Minimax Optimal and Computationally Efficient Algorithms for Distributionally Robust Offline Reinforcement Learning	Mar 14, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0	0
Minimax-Optimal Reward-Agnostic Exploration in Reinforcement Learning	Apr 14, 2023	Offline RLreinforcement-learning	—Unverified	0	0
Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization	Dec 7, 2023	Model-based Reinforcement LearningOffline RL	—Unverified	0	0
Model-Based Offline Planning	Aug 12, 2020	modelOffline RL	—Unverified	0	0
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation	Mar 26, 2025	D4RLData Augmentation	—Unverified	0	0
Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds	Aug 16, 2024	Model-based Reinforcement LearningOffline RL	—Unverified	0	0

Show:10 25 50

← PrevPage 67 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified