Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 755 papers

Title	Date	Tasks	Status	Hype
Reliable Conditioning of Behavioral Cloning for Offline Reinforcement Learning	Oct 11, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Pre-Training for Robots: Offline RL Enables Learning New Tasks from a Handful of Trials	Oct 11, 2022	Offline RLQ-Learning	CodeCode Available	1
BAFFLE: Hiding Backdoors in Offline Reinforcement Learning Datasets	Oct 7, 2022	Autonomous DrivingBackdoor Attack	CodeCode Available	1
VIP: Towards Universal Visual Reward and Representation via Value-Implicit Pre-Training	Sep 30, 2022	Offline RLOpen-Ended Question Answering	CodeCode Available	1
Offline Reinforcement Learning via High-Fidelity Generative Behavior Modeling	Sep 29, 2022	Computational EfficiencyD4RL	CodeCode Available	1
Optimistic Curiosity Exploration and Conservative Exploitation with Linear Reward Shaping	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	1
Efficient Planning in a Compact Latent Action Space	Aug 22, 2022	continuous-controlContinuous Control	CodeCode Available	1
AdaCat: Adaptive Categorical Discretization for Autoregressive Models	Aug 3, 2022	Density EstimationOffline RL	CodeCode Available	1
Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations	Jul 20, 2022	Imitation LearningOffline RL	CodeCode Available	1
When to Trust Your Simulator: Dynamics-Aware Hybrid Offline-and-Online Reinforcement Learning	Jun 27, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Behavior Transformers: Cloning k modes with one stone	Jun 22, 2022	Object DetectionOffline RL	CodeCode Available	1
Value Memory Graph: A Graph-Structured World Model for Offline Reinforcement Learning	Jun 9, 2022	D4RLModel-based Reinforcement Learning	CodeCode Available	1
RORL: Robust Offline Reinforcement Learning via Conservative Smoothing	Jun 6, 2022	Decision MakingOffline RL	CodeCode Available	1
When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning	May 23, 2022	D4RLOffline RL	CodeCode Available	1
RAMBO-RL: Robust Adversarial Model-Based Offline Reinforcement Learning	Apr 26, 2022	Offline RLreinforcement-learning	CodeCode Available	1
COptiDICE: Offline Constrained Reinforcement Learning via Stationary Distribution Correction Estimation	Apr 19, 2022	Offline RLOff-policy evaluation	CodeCode Available	1
Offline Reinforcement Learning for Safer Blood Glucose Control in People with Type 1 Diabetes	Apr 7, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1
CIRS: Bursting Filter Bubbles by Counterfactual Interactive Recommender System	Apr 4, 2022	Causal Inferencecounterfactual	CodeCode Available	1
Latent-Variable Advantage-Weighted Policy Optimization for Offline RL	Mar 16, 2022	continuous-controlContinuous Control	CodeCode Available	1
All You Need Is Supervised Learning: From Imitation Learning to Meta-RL With Upside Down RL	Feb 24, 2022	AllImitation Learning	CodeCode Available	1
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning	Feb 23, 2022	D4RLOffline RL	CodeCode Available	1
cosFormer: Rethinking Softmax in Attention	Feb 17, 2022	D4RLLanguage Modeling	CodeCode Available	1
Supported Policy Optimization for Offline Reinforcement Learning	Feb 13, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Rethinking Goal-conditioned Supervised Learning and Its Connection to Offline RL	Feb 9, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Adversarially Trained Actor Critic for Offline Reinforcement Learning	Feb 5, 2022	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 6 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified