SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 561–570 of 755 papers

Title	Date	Tasks	Status	Hype
Why So Pessimistic? Estimating Uncertainties for Offline RL through Ensembles, and Why Their Independence Matters	May 27, 2022	D4RLOffline RL	—Unverified	0
Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes	May 26, 2022	Causal InferenceOffline RL	—Unverified	0
When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning	May 23, 2022	D4RLOffline RL	CodeCode Available	1
User-Interactive Offline Reinforcement Learning	May 21, 2022	Offline RLreinforcement-learning	—Unverified	0
How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation	May 6, 2022	Offline RLReinforcement Learning (RL)	—Unverified	0
Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline Reinforcement Learning	May 5, 2022	Offline RLreinforcement-learning	—Unverified	0
Towards Flexible Inference in Sequential Decision Problems via Bidirectional Transformers	Apr 28, 2022	Decision MakingOffline RL	—Unverified	0
RAMBO-RL: Robust Adversarial Model-Based Offline Reinforcement Learning	Apr 26, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Learning Value Functions from Undirected State-only Experience	Apr 26, 2022	Future predictionImitation Learning	—Unverified	0
COptiDICE: Offline Constrained Reinforcement Learning via Stationary Distribution Correction Estimation	Apr 19, 2022	Offline RLOff-policy evaluation	CodeCode Available	1

Show:10 25 50

← PrevPage 57 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified