Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 755 papers

Title	Date	Tasks	Status
Uncertainty Estimation Using Riemannian Model~Dynamics for Offline Reinforcement Learning	Feb 22, 2021	Autonomous Drivingcontinuous-control	—Unverified
Generalize by Touching: Tactile Ensemble Skill Transfer for Robotic Furniture Assembly	Apr 26, 2024	Contact-rich ManipulationOffline RL	—Unverified
Generative Probabilistic Planning for Optimizing Supply Chain Networks	Apr 11, 2024	Deep Reinforcement LearningOffline RL	—Unverified
GenPO: Generative Diffusion Models Meet On-Policy Reinforcement Learning	May 24, 2025	GPUOffline RL	—Unverified
Goal-Conditioned Data Augmentation for Offline Reinforcement Learning	Dec 29, 2024	D4RLData Augmentation	—Unverified
Learning Goal-Conditioned Policies from Sub-Optimal Offline Data via Metric Learning	Feb 16, 2024	Metric LearningOffline RL	—Unverified
Goal-Conditioned Predictive Coding for Offline Reinforcement Learning	Jul 7, 2023	Decision MakingOffline RL	—Unverified
Graph Decision Transformer	Mar 7, 2023	Offline RLOpenAI Gym	—Unverified
GriddlyJS: A Web IDE for Reinforcement Learning	Jul 13, 2022	Offline RLreinforcement-learning	—Unverified
Guided Data Augmentation for Offline Reinforcement Learning and Imitation Learning	Oct 27, 2023	Autonomous DrivingD4RL	—Unverified
H2O+: An Improved Framework for Hybrid Offline-and-Online RL with Dynamics Gaps	Sep 22, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Harnessing Density Ratios for Online Reinforcement Learning	Jan 18, 2024	Offline RLreinforcement-learning	—Unverified
H-GAP: Humanoid Control with a Generalist Planner	Dec 5, 2023	Humanoid ControlModel Predictive Control	—Unverified
How to Leverage Unlabeled Data in Offline Reinforcement Learning	Feb 3, 2022	Offline RLreinforcement-learning	—Unverified
How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation	May 6, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Human-centric Dialog Training via Offline Reinforcement Learning	Oct 12, 2020	Language ModellingOffline RL	—Unverified
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance	Sep 4, 2023	Offline RLreinforcement-learning	—Unverified
Unified Preference Optimization: Language Model Alignment Beyond the Preference Frontier	May 28, 2024	Language ModelingLanguage Modelling	—Unverified
Hybrid Reinforcement Learning Breaks Sample Size Barriers in Linear MDPs	Aug 8, 2024	Offline RLreinforcement-learning	—Unverified
Hyperparameter Selection for Offline Reinforcement Learning	Jul 17, 2020	Offline RLreinforcement-learning	—Unverified
Implicit Offline Reinforcement Learning via Supervised Learning	Oct 21, 2022	Offline RLreinforcement-learning	—Unverified
Importance of Empirical Sample Complexity Analysis for Offline Reinforcement Learning	Dec 31, 2021	Offline RLreinforcement-learning	—Unverified
Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback	Dec 3, 2024	ObjectOffline RL	—Unverified
Improving Long-Term Metrics in Recommendation Systems using Short-Horizon Reinforcement Learning	Jun 1, 2021	Offline RLRecommendation Systems	—Unverified
Improving Multi-Step Reasoning Abilities of Large Language Models with Direct Advantage Policy Optimization	Dec 24, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Improving Offline Reinforcement Learning with Inaccurate Simulators	May 7, 2024	D4RLGenerative Adversarial Network	—Unverified
Improving Offline RL by Blending Heuristics	Jun 1, 2023	D4RLOffline RL	—Unverified
Improving Zero-shot Generalization in Offline Reinforcement Learning using Generalized Similarity Functions	Nov 29, 2021	Contrastive LearningDecision Making	—Unverified
InferNet for Delayed Reinforcement Tasks: Addressing the Temporal Credit Assignment Problem	May 2, 2021	Atari GamesOffline RL	—Unverified
Iteratively Refined Behavior Regularization for Offline Reinforcement Learning	Jun 9, 2023	D4RLOffline RL	—Unverified
Instabilities of Offline RL with Pre-Trained Neural Representation	Mar 8, 2021	Offline RLReinforcement Learning (RL)	—Unverified
Instructed Diffuser with Temporal Condition Guidance for Offline Reinforcement Learning	Jun 8, 2023	Decision MakingOffline RL	—Unverified
Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning	Feb 19, 2021	Offline RLreinforcement-learning	—Unverified
Integrating Domain Knowledge for handling Limited Data in Offline RL	Jun 11, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Integrating Multi-Modal Input Token Mixer Into Mamba-Based Decision Models: Decision MetaMamba	Aug 20, 2024	MambaOffline RL	—Unverified
Integrating Offline Reinforcement Learning with Transformers for Sequential Recommendation	Jul 26, 2023	Offline RLreinforcement-learning	—Unverified
Integrating Reinforcement Learning and Large Language Models for Crop Production Process Management Optimization and Control through A New Knowledge-Based Deep Learning Paradigm	Oct 13, 2024	ManagementOffline RL	—Unverified
IntelliLung: Advancing Safe Mechanical Ventilation using Offline RL with Hybrid Actions and Clinically Aligned Rewards	Jun 17, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Interpretable performance analysis towards offline reinforcement learning: A dataset perspective	May 12, 2021	Offline RLQ-Learning	—Unverified
Inverse Concave-Utility Reinforcement Learning is Inverse Game Theory	May 29, 2024	Imitation LearningOffline RL	—Unverified
IQL-TD-MPC: Implicit Q-Learning for Hierarchical Model Predictive Control	Jun 1, 2023	D4RLModel-based Reinforcement Learning	—Unverified
Is Conditional Generative Modeling all you need for Decision-Making?	Nov 28, 2022	AllDecision Making	—Unverified
Is Inverse Reinforcement Learning Harder than Standard Reinforcement Learning? A Theoretical Perspective	Nov 29, 2023	Offline RLreinforcement-learning	—Unverified
Is Pessimism Provably Efficient for Offline RL?	Dec 30, 2020	Offline RLReinforcement Learning (RL)	—Unverified
KAN v.s. MLP for Offline Reinforcement Learning	Sep 15, 2024	D4RLKolmogorov-Arnold Networks	—Unverified
Know Your Boundaries: The Necessity of Explicit Behavioral Cloning in Offline RL	Jun 1, 2022	D4RLOffline RL	—Unverified
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics	Nov 2, 2021	D4RLData Augmentation	—Unverified
Language-Conditioned Offline RL for Multi-Robot Navigation	Jul 29, 2024	Offline RLRobot Navigation	—Unverified
Large Language Model driven Policy Exploration for Recommender Systems	Jan 23, 2025	Language ModelingLanguage Modelling	—Unverified
Large-Scale Retrieval for Reinforcement Learning	Jun 10, 2022	Decision MakingDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 13 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified