SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 161–170 of 755 papers

Title	Date	Tasks	Status	Hype
Benchmarks for Reinforcement Learning with Biased Offline Data and Imperfect Simulators	Jun 30, 2024	Autonomous VehiclesOffline RL	—Unverified	0
Model-based Offline Reinforcement Learning with Lower Expectile Q-Learning	Jun 30, 2024	D4RLOffline RL	—Unverified	0
Preference Elicitation for Offline Reinforcement Learning	Jun 26, 2024	Offline RLreinforcement-learning	—Unverified	0
Equivariant Offline Reinforcement Learning	Jun 20, 2024	Offline RLQ-Learning	—Unverified	0
Urban-Focused Multi-Task Offline Reinforcement Learning with Contrastive Data Sharing	Jun 20, 2024	Autonomous DrivingData Augmentation	—Unverified	0
Order-Optimal Instance-Dependent Bounds for Offline Reinforcement Learning with Preference Feedback	Jun 18, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0
The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation	Jun 17, 2024	Offline RL	—Unverified	0
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning	Jun 14, 2024	Offline RL	CodeCode Available	3
Binary Reward Labeling: Bridging Offline Preference and Reward-Based Reinforcement Learning	Jun 14, 2024	D4RLOffline RL	—Unverified	0
DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning	Jun 13, 2024	D4RLOffline RL	—Unverified	0

Show:10 25 50

← PrevPage 17 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified