Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 755 papers

Title	Date	Tasks	Status
Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism	Mar 22, 2021	Imitation LearningMulti-Armed Bandits	—Unverified
A Conservative Q-Learning approach for handling distribution shift in sepsis treatment strategies	Mar 25, 2022	Deep Reinforcement LearningOffline RL	—Unverified
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning	Jul 29, 2024	Offline RLreinforcement-learning	—Unverified
ADG: Ambient Diffusion-Guided Dataset Recovery for Corruption-Robust Offline Reinforcement Learning	May 29, 2025	DenoisingMuJoCo	—Unverified
Diffusion-Based Offline RL for Improved Decision-Making in Augmented ARC Task	Oct 15, 2024	ARCDecision Making	—Unverified
Diffused Task-Agnostic Milestone Planner	Dec 6, 2023	Decision MakingOffline RL	—Unverified
A Primal-Dual Algorithm for Offline Constrained Reinforcement Learning with Linear MDPs	Feb 7, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Accelerating Diffusion Models in Offline RL via Reward-Aware Consistency Trajectory Distillation	Jun 9, 2025	Decision MakingMuJoCo	—Unverified
DiffStitch: Boosting Offline Reinforcement Learning with Diffusion-based Trajectory Stitching	Feb 4, 2024	D4RLData Augmentation	—Unverified
DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning	Jun 13, 2024	D4RLOffline RL	—Unverified
BRAC+: Going Deeper with Behavior Regularized Offline Reinforcement Learning	Jan 1, 2021	Offline RLreinforcement-learning	—Unverified
Bootstrapped Transformer for Offline Reinforcement Learning	Jun 17, 2022	Offline RLreinforcement-learning	—Unverified
How to Provably Improve Return Conditioned Supervised Learning?	Jun 10, 2025	Decision MakingOffline RL	—Unverified
Boosting Offline Reinforcement Learning with Residual Generative Modeling	Jun 19, 2021	Offline RLQ-Learning	—Unverified
DIAR: Diffusion-model-guided Implicit Q-learning with Adaptive Revaluation	Oct 15, 2024	Decision MakingOffline RL	—Unverified
A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning	Dec 12, 2023	MuJoCoOffline RL	—Unverified
Dialogue Evaluation with Offline Reinforcement Learning	Sep 2, 2022	Dialogue EvaluationOffline RL	—Unverified
Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm	Sep 24, 2024	Offline RLOff-policy evaluation	—Unverified
Boosting Offline Reinforcement Learning via Data Rebalancing	Oct 17, 2022	D4RLOffline RL	—Unverified
Addressing Extrapolation Error in Deep Offline Reinforcement Learning	Jan 1, 2021	Offline RLreinforcement-learning	—Unverified
Design from Policies: Conservative Test-Time Adaptation for Offline Policy Optimization	Jun 26, 2023	Offline RLTest-time Adaptation	—Unverified
Learning Dexterous Manipulation from Suboptimal Experts	Oct 16, 2020	Offline RLQ-Learning	—Unverified
Boosting Offline Reinforcement Learning for Autonomous Driving with Hierarchical Latent Skills	Sep 24, 2023	Autonomous DrivingOffline RL	—Unverified
LLQL: Logistic Likelihood Q-Learning for Reinforcement Learning	Jul 5, 2023	Offline RLQ-Learning	—Unverified
Launchpad: Learning to Schedule Using Offline and Online RL Methods	Dec 1, 2022	Deep Reinforcement LearningOffline RL	—Unverified

Show:10 25 50

← PrevPage 13 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified