Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 576–600 of 755 papers

Title	Date	Tasks	Status	Hype
Offline Reinforcement Learning Under Value and Density-Ratio Realizability: The Power of Gaps	Mar 25, 2022	Offline RLReinforcement Learning (RL)	—Unverified	0
A Conservative Q-Learning approach for handling distribution shift in sepsis treatment strategies	Mar 25, 2022	Deep Reinforcement LearningOffline RL	—Unverified	0
Bellman Residual Orthogonalization for Offline Reinforcement Learning	Mar 24, 2022	Offline RLOff-policy evaluation	—Unverified	0
Optimizing Trajectories for Highway Driving with Offline Reinforcement Learning	Mar 21, 2022	Autonomous DrivingOffline RL	—Unverified	0
Semi-Markov Offline Reinforcement Learning for Healthcare	Mar 17, 2022	Offline RLreinforcement-learning	CodeCode Available	0
COPA: Certifying Robust Policies for Offline Reinforcement Learning against Poisoning Attacks	Mar 16, 2022	Offline RLreinforcement-learning	CodeCode Available	0
Latent-Variable Advantage-Weighted Policy Optimization for Offline RL	Mar 16, 2022	continuous-controlContinuous Control	CodeCode Available	1
DARA: Dynamics-Aware Reward Augmentation in Offline Reinforcement Learning	Mar 13, 2022	Offline RLreinforcement-learning	—Unverified	0
On Practical Reinforcement Learning: Provable Robustness, Scalability, and Statistical Efficiency	Mar 3, 2022	Offline RLreinforcement-learning	CodeCode Available	0
Reliable validation of Reinforcement Learning Benchmarks	Mar 2, 2022	BenchmarkingData Compression	—Unverified	0
A Survey on Offline Reinforcement Learning: Taxonomy, Review, and Open Problems	Mar 2, 2022	Offline RLreinforcement-learning	CodeCode Available	0
Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample Complexity	Feb 28, 2022	Offline RLQ-Learning	—Unverified	0
All You Need Is Supervised Learning: From Imitation Learning to Meta-RL With Upside Down RL	Feb 24, 2022	AllImitation Learning	CodeCode Available	1
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning	Feb 23, 2022	D4RLOffline RL	CodeCode Available	1
VRL3: A Data-Driven Framework for Visual Deep Reinforcement Learning	Feb 17, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available	2
cosFormer: Rethinking Softmax in Attention	Feb 17, 2022	D4RLLanguage Modeling	CodeCode Available	1
Supported Policy Optimization for Offline Reinforcement Learning	Feb 13, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Flowformer: Linearizing Transformers with Conservation Flows	Feb 13, 2022	D4RLOffline RL	CodeCode Available	2
Settling the Communication Complexity for Distributed Offline Reinforcement Learning	Feb 10, 2022	Multi-Armed BanditsOffline RL	—Unverified	0
Transferred Q-learning	Feb 9, 2022	Offline RLQ-Learning	—Unverified	0
Offline Reinforcement Learning with Realizability and Single-policy Concentrability	Feb 9, 2022	Offline RLreinforcement-learning	—Unverified	0
Rethinking Goal-conditioned Supervised Learning and Its Connection to Offline RL	Feb 9, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Adversarially Trained Actor Critic for Offline Reinforcement Learning	Feb 5, 2022	continuous-controlContinuous Control	CodeCode Available	1
How to Leverage Unlabeled Data in Offline Reinforcement Learning	Feb 3, 2022	Offline RLreinforcement-learning	—Unverified	0
Don't Change the Algorithm, Change the Data: Exploratory Data for Offline Reinforcement Learning	Jan 31, 2022	DiversityOffline RL	CodeCode Available	1

Show:10 25 50

← PrevPage 24 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified