Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–725 of 755 papers

Title	Date	Tasks	Status
Behavioral Priors and Dynamics Models: Improving Performance and Domain Transfer in Offline RL	Jun 16, 2021	D4RLDomain Generalization	—Unverified
On Multi-objective Policy Optimization as a Tool for Reinforcement Learning: Case Studies in Offline RL and Finetuning	Jun 15, 2021	Deep Reinforcement LearningMixture-of-Experts	—Unverified
Offline Reinforcement Learning as Anti-Exploration	Jun 11, 2021	continuous-controlContinuous Control	—Unverified
Corruption-Robust Offline Reinforcement Learning	Jun 11, 2021	Adversarial RobustnessOffline RL	—Unverified
Offline Inverse Reinforcement Learning	Jun 9, 2021	Data AugmentationImitation Learning	—Unverified
Policy Finetuning: Bridging Sample-Efficient Offline and Online Reinforcement Learning	Jun 9, 2021	Offline RLOpen-Ended Question Answering	—Unverified
Improving Long-Term Metrics in Recommendation Systems using Short-Horizon Reinforcement Learning	Jun 1, 2021	Offline RLRecommendation Systems	—Unverified
Revisiting Design Choices in Offline Model Based Reinforcement Learning	May 21, 2021	Bayesian OptimizationModel-based Reinforcement Learning	—Unverified
Model-Based Offline Planning with Trajectory Pruning	May 16, 2021	modelOffline RL	CodeCode Available
Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic Settings	May 13, 2021	Offline RL	—Unverified
Interpretable performance analysis towards offline reinforcement learning: A dataset perspective	May 12, 2021	Offline RLQ-Learning	—Unverified
InferNet for Delayed Reinforcement Tasks: Addressing the Temporal Credit Assignment Problem	May 2, 2021	Atari GamesOffline RL	—Unverified
Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism	Mar 22, 2021	Imitation LearningMulti-Armed Bandits	—Unverified
Regularized Behavior Value Estimation	Mar 17, 2021	Offline RL	—Unverified
Offline Reinforcement Learning with Fisher Divergence Critic Regularization	Mar 14, 2021	Offline RLreinforcement-learning	—Unverified
Sample Complexity of Offline Reinforcement Learning with Deep ReLU Networks	Mar 11, 2021	Offline RLreinforcement-learning	—Unverified
S4RL: Surprisingly Simple Self-Supervision for Offline Reinforcement Learning	Mar 10, 2021	Autonomous DrivingD4RL	—Unverified
Instabilities of Offline RL with Pre-Trained Neural Representation	Mar 8, 2021	Offline RLReinforcement Learning (RL)	—Unverified
Two-step reinforcement learning for model-free redesign of nonlinear optimal regulator	Mar 5, 2021	Offline RLreinforcement-learning	CodeCode Available
DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning	Feb 23, 2021	Continuous ControlOffline RL	—Unverified
Uncertainty Estimation Using Riemannian Model~Dynamics for Offline Reinforcement Learning	Feb 22, 2021	Autonomous Drivingcontinuous-control	—Unverified
Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning	Feb 19, 2021	Offline RLreinforcement-learning	—Unverified
PerSim: Data-Efficient Offline Reinforcement Learning with Heterogeneous Agents via Personalized Simulators	Feb 13, 2021	Offline RLreinforcement-learning	—Unverified
Q-Value Weighted Regression: Reinforcement Learning with Limited Data	Feb 12, 2021	Atari Gamescontinuous-control	CodeCode Available
Representation Matters: Offline Pretraining for Sequential Decision Making	Feb 11, 2021	Decision MakingImitation Learning	—Unverified

Show:10 25 50

← PrevPage 29 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified