SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 321–330 of 755 papers

Title	Date	Tasks	Status	Hype
Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds	Aug 16, 2024	Model-based Reinforcement LearningOffline RL	—Unverified	0
Experimental evaluation of offline reinforcement learning for HVAC control in buildings	Aug 15, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	0
D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning	Aug 15, 2024	Deep Reinforcement LearningOffline RL	—Unverified	0
Hybrid Reinforcement Learning Breaks Sample Size Barriers in Linear MDPs	Aug 8, 2024	Offline RLreinforcement-learning	—Unverified	0
Consistent time travel for realistic interactions with historical data: reinforcement learning for market making	Aug 5, 2024	Offline RL	—Unverified	0
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning	Jul 29, 2024	Offline RLreinforcement-learning	—Unverified	0
Language-Conditioned Offline RL for Multi-Robot Navigation	Jul 29, 2024	Offline RLRobot Navigation	—Unverified	0
Diffusion Models as Optimizers for Efficient Planning in Offline RL	Jul 23, 2024	D4RLDecision Making	CodeCode Available	0
ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems	Jul 18, 2024	Offline RLRecommendation Systems	CodeCode Available	0
Sparsity-based Safety Conservatism for Constrained Offline Reinforcement Learning	Jul 17, 2024	Autonomous DrivingDecision Making	—Unverified	0

Show:10 25 50

← PrevPage 33 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified