Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 755 papers

Title	Date	Tasks	Status
Strategic Decision-Making in the Presence of Information Asymmetry: Provably Efficient RL with Algorithmic Instruments	Aug 23, 2022	Decision MakingOffline RL	—Unverified
Distributionally Robust Model-Based Offline Reinforcement Learning with Near-Optimal Sample Complexity	Aug 11, 2022	Decision MakingOffline RL	—Unverified
Offline Reinforcement Learning at Multiple Frequencies	Jul 26, 2022	Offline RLreinforcement-learning	—Unverified
BCRLSP: An Offline Reinforcement Learning Framework for Sequential Targeted Promotion	Jul 16, 2022	Offline RLreinforcement-learning	—Unverified
GriddlyJS: A Web IDE for Reinforcement Learning	Jul 13, 2022	Offline RLreinforcement-learning	—Unverified
Offline Equilibrium Finding	Jul 12, 2022	Offline RL	CodeCode Available
Offline RL Policies Should be Trained to be Adaptive	Jul 5, 2022	Offline RL	—Unverified
An Empirical Study of Implicit Regularization in Deep Offline RL	Jul 5, 2022	Offline RL	—Unverified
Prompting Decision Transformer for Few-Shot Policy Generalization	Jun 27, 2022	Few-Shot LearningInductive Bias	—Unverified
A Survey on Model-based Reinforcement Learning	Jun 19, 2022	Decision Makingmodel	—Unverified
Bootstrapped Transformer for Offline Reinforcement Learning	Jun 17, 2022	Offline RLreinforcement-learning	—Unverified
Double Check Your State Before Trusting It: Confidence-Aware Bidirectional Offline Model-Based Imagination	Jun 16, 2022	D4RLOffline RL	CodeCode Available
Contrastive Learning as Goal-Conditioned Reinforcement Learning	Jun 15, 2022	Contrastive LearningData Augmentation	—Unverified
Regularizing a Model-based Policy Stationary Distribution to Stabilize Offline Reinforcement Learning	Jun 14, 2022	continuous-controlContinuous Control	CodeCode Available
Provable Benefit of Multitask Representation Learning in Reinforcement Learning	Jun 13, 2022	Offline RLreinforcement-learning	—Unverified
Provably Efficient Offline Reinforcement Learning with Trajectory-Wise Reward	Jun 13, 2022	Offline RLreinforcement-learning	—Unverified
Federated Offline Reinforcement Learning	Jun 11, 2022	Offline RLPrivacy Preserving	—Unverified
Large-Scale Retrieval for Reinforcement Learning	Jun 10, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
On the Role of Discount Factor in Offline Reinforcement Learning	Jun 7, 2022	D4RLOffline RL	—Unverified
Offline Reinforcement Learning with Causal Structured World Models	Jun 3, 2022	Model-based Reinforcement LearningOffline RL	—Unverified
Offline Reinforcement Learning with Differential Privacy	Jun 2, 2022	Offline RLreinforcement-learning	—Unverified
Model Generation with Provable Coverability for Offline Reinforcement Learning	Jun 1, 2022	Offline RLOut-of-Distribution Generalization	—Unverified
Know Your Boundaries: The Necessity of Explicit Behavioral Cloning in Offline RL	Jun 1, 2022	D4RLOffline RL	—Unverified
Nearly Minimax Optimal Offline Reinforcement Learning with Linear Function Approximation: Single-Agent MDP and Markov Game	May 31, 2022	Offline RLReinforcement Learning (RL)	—Unverified
You Can't Count on Luck: Why Decision Transformers and RvS Fail in Stochastic Environments	May 31, 2022	Offline RLPlaying the Game of 2048	—Unverified
Multi-Game Decision Transformers	May 30, 2022	Atari GamesOffline RL	CodeCode Available
Why So Pessimistic? Estimating Uncertainties for Offline RL through Ensembles, and Why Their Independence Matters	May 27, 2022	D4RLOffline RL	—Unverified
Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes	May 26, 2022	Causal InferenceOffline RL	—Unverified
User-Interactive Offline Reinforcement Learning	May 21, 2022	Offline RLreinforcement-learning	—Unverified
How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation	May 6, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline Reinforcement Learning	May 5, 2022	Offline RLreinforcement-learning	—Unverified
Towards Flexible Inference in Sequential Decision Problems via Bidirectional Transformers	Apr 28, 2022	Decision MakingOffline RL	—Unverified
Learning Value Functions from Undirected State-only Experience	Apr 26, 2022	Future predictionImitation Learning	—Unverified
When Should We Prefer Offline Reinforcement Learning Over Behavioral Cloning?	Apr 12, 2022	Atari GamesDiagnostic	—Unverified
Settling the Sample Complexity of Model-Based Offline Reinforcement Learning	Apr 11, 2022	Offline RLreinforcement-learning	—Unverified
A Conservative Q-Learning approach for handling distribution shift in sepsis treatment strategies	Mar 25, 2022	Deep Reinforcement LearningOffline RL	—Unverified
Offline Reinforcement Learning Under Value and Density-Ratio Realizability: The Power of Gaps	Mar 25, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Bellman Residual Orthogonalization for Offline Reinforcement Learning	Mar 24, 2022	Offline RLOff-policy evaluation	—Unverified
Optimizing Trajectories for Highway Driving with Offline Reinforcement Learning	Mar 21, 2022	Autonomous DrivingOffline RL	—Unverified
Semi-Markov Offline Reinforcement Learning for Healthcare	Mar 17, 2022	Offline RLreinforcement-learning	CodeCode Available
COPA: Certifying Robust Policies for Offline Reinforcement Learning against Poisoning Attacks	Mar 16, 2022	Offline RLreinforcement-learning	CodeCode Available
DARA: Dynamics-Aware Reward Augmentation in Offline Reinforcement Learning	Mar 13, 2022	Offline RLreinforcement-learning	—Unverified
On Practical Reinforcement Learning: Provable Robustness, Scalability, and Statistical Efficiency	Mar 3, 2022	Offline RLreinforcement-learning	CodeCode Available
Reliable validation of Reinforcement Learning Benchmarks	Mar 2, 2022	BenchmarkingData Compression	—Unverified
A Survey on Offline Reinforcement Learning: Taxonomy, Review, and Open Problems	Mar 2, 2022	Offline RLreinforcement-learning	CodeCode Available
Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample Complexity	Feb 28, 2022	Offline RLQ-Learning	—Unverified
Settling the Communication Complexity for Distributed Offline Reinforcement Learning	Feb 10, 2022	Multi-Armed BanditsOffline RL	—Unverified
Offline Reinforcement Learning with Realizability and Single-policy Concentrability	Feb 9, 2022	Offline RLreinforcement-learning	—Unverified
Transferred Q-learning	Feb 9, 2022	Offline RLQ-Learning	—Unverified
How to Leverage Unlabeled Data in Offline Reinforcement Learning	Feb 3, 2022	Offline RLreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 13 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified