Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–475 of 755 papers

Title	Date	Tasks	Status
Uncertainty Estimation Using Riemannian Model~Dynamics for Offline Reinforcement Learning	Feb 22, 2021	Autonomous Drivingcontinuous-control	—Unverified
Generalize by Touching: Tactile Ensemble Skill Transfer for Robotic Furniture Assembly	Apr 26, 2024	Contact-rich ManipulationOffline RL	—Unverified
Generative Probabilistic Planning for Optimizing Supply Chain Networks	Apr 11, 2024	Deep Reinforcement LearningOffline RL	—Unverified
GenPO: Generative Diffusion Models Meet On-Policy Reinforcement Learning	May 24, 2025	GPUOffline RL	—Unverified
Goal-Conditioned Data Augmentation for Offline Reinforcement Learning	Dec 29, 2024	D4RLData Augmentation	—Unverified
Learning Goal-Conditioned Policies from Sub-Optimal Offline Data via Metric Learning	Feb 16, 2024	Metric LearningOffline RL	—Unverified
Goal-Conditioned Predictive Coding for Offline Reinforcement Learning	Jul 7, 2023	Decision MakingOffline RL	—Unverified
Graph Decision Transformer	Mar 7, 2023	Offline RLOpenAI Gym	—Unverified
GriddlyJS: A Web IDE for Reinforcement Learning	Jul 13, 2022	Offline RLreinforcement-learning	—Unverified
Guided Data Augmentation for Offline Reinforcement Learning and Imitation Learning	Oct 27, 2023	Autonomous DrivingD4RL	—Unverified
H2O+: An Improved Framework for Hybrid Offline-and-Online RL with Dynamics Gaps	Sep 22, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Harnessing Density Ratios for Online Reinforcement Learning	Jan 18, 2024	Offline RLreinforcement-learning	—Unverified
H-GAP: Humanoid Control with a Generalist Planner	Dec 5, 2023	Humanoid ControlModel Predictive Control	—Unverified
How to Leverage Unlabeled Data in Offline Reinforcement Learning	Feb 3, 2022	Offline RLreinforcement-learning	—Unverified
How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation	May 6, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Human-centric Dialog Training via Offline Reinforcement Learning	Oct 12, 2020	Language ModellingOffline RL	—Unverified
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance	Sep 4, 2023	Offline RLreinforcement-learning	—Unverified
Unified Preference Optimization: Language Model Alignment Beyond the Preference Frontier	May 28, 2024	Language ModelingLanguage Modelling	—Unverified
Hybrid Reinforcement Learning Breaks Sample Size Barriers in Linear MDPs	Aug 8, 2024	Offline RLreinforcement-learning	—Unverified
Hyperparameter Selection for Offline Reinforcement Learning	Jul 17, 2020	Offline RLreinforcement-learning	—Unverified
Implicit Offline Reinforcement Learning via Supervised Learning	Oct 21, 2022	Offline RLreinforcement-learning	—Unverified
Importance of Empirical Sample Complexity Analysis for Offline Reinforcement Learning	Dec 31, 2021	Offline RLreinforcement-learning	—Unverified
Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback	Dec 3, 2024	ObjectOffline RL	—Unverified
Improving Long-Term Metrics in Recommendation Systems using Short-Horizon Reinforcement Learning	Jun 1, 2021	Offline RLRecommendation Systems	—Unverified
Improving Multi-Step Reasoning Abilities of Large Language Models with Direct Advantage Policy Optimization	Dec 24, 2024	Offline RLReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 19 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified