Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 755 papers

Title	Date	Tasks	Status
Launchpad: Learning to Schedule Using Offline and Online RL Methods	Dec 1, 2022	Deep Reinforcement LearningOffline RL	—Unverified
Learning Dexterous Manipulation from Suboptimal Experts	Oct 16, 2020	Offline RLQ-Learning	—Unverified
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified
Learning to Clarify by Reinforcement Learning Through Reward-Weighted Fine-Tuning	Jun 8, 2025	Offline RLQuestion Answering	—Unverified
Learning to Influence Human Behavior with Offline Reinforcement Learning	Mar 3, 2023	Autonomous DrivingOffline RL	—Unverified
Learning to View: Decision Transformers for Active Object Detection	Jan 23, 2023	Active Object DetectionMotion Planning	—Unverified
Learning Value Functions from Undirected State-only Experience	Apr 26, 2022	Future predictionImitation Learning	—Unverified
Leveraging Domain-Unlabeled Data in Offline Reinforcement Learning across Two Domains	Apr 11, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Leveraging Offline Data in Online Reinforcement Learning	Nov 9, 2022	Offline RLreinforcement-learning	—Unverified
Leveraging Optimal Transport for Enhanced Offline Reinforcement Learning in Surgical Robotic Environments	Oct 13, 2023	Active LearningOffline RL	—Unverified
LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble	Nov 26, 2024	Offline RLReinforcement Learning (RL)	—Unverified
LLQL: Logistic Likelihood Q-Learning for Reinforcement Learning	Jul 5, 2023	Offline RLQ-Learning	—Unverified
Language Decision Transformers with Exponential Tilt for Interactive Text Environments	Feb 10, 2023	Offline RL	—Unverified
Measurement Scheduling for ICU Patients with Offline Reinforcement Learning	Feb 12, 2024	Offline RLreinforcement-learning	—Unverified
Minimax Optimal and Computationally Efficient Algorithms for Distributionally Robust Offline Reinforcement Learning	Mar 14, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Minimax-Optimal Reward-Agnostic Exploration in Reinforcement Learning	Apr 14, 2023	Offline RLreinforcement-learning	—Unverified
Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization	Dec 7, 2023	Model-based Reinforcement LearningOffline RL	—Unverified
Model-Based Offline Planning	Aug 12, 2020	modelOffline RL	—Unverified
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation	Mar 26, 2025	D4RLData Augmentation	—Unverified
Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds	Aug 16, 2024	Model-based Reinforcement LearningOffline RL	—Unverified
Model-enhanced Contrastive Reinforcement Learning for Sequential Recommendation	Oct 25, 2023	Contrastive Learningmodel	—Unverified
Model Generation with Provable Coverability for Offline Reinforcement Learning	Jun 1, 2022	Offline RLOut-of-Distribution Generalization	—Unverified
MoMA: Model-based Mirror Ascent for Offline Reinforcement Learning	Jan 21, 2024	Decision MakingOffline RL	—Unverified
MOORL: A Framework for Integrating Offline-Online Reinforcement Learning	Jun 11, 2025	D4RLDeep Reinforcement Learning	—Unverified
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified
MOReL: Model-Based Offline Reinforcement Learning	Dec 1, 2020	modelOffline RL	—Unverified
MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning	Jan 6, 2024	Offline RLRobot Manipulation	—Unverified
Multi-Objective Decision Transformers for Offline Reinforcement Learning	Aug 31, 2023	D4RLOffline RL	—Unverified
Multi-Objective-Optimization Multi-AUV Assisted Data Collection Framework for IoUT Based on Offline Reinforcement Learning	Oct 15, 2024	Collision AvoidanceOffline RL	—Unverified
Multi-Object Navigation in real environments using hybrid policies	Jan 24, 2024	Imitation LearningObject	—Unverified
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified
Nearly Minimax Optimal Offline Reinforcement Learning with Linear Function Approximation: Single-Agent MDP and Markov Game	May 31, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Near-Optimal Offline Reinforcement Learning via Double Variance Reduction	Feb 2, 2021	Offline RLreinforcement-learning	—Unverified
Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning	Jul 7, 2020	Offline RLreinforcement-learning	—Unverified
Neural Network Approximation for Pessimistic Offline Reinforcement Learning	Dec 19, 2023	Deep Reinforcement LearningOffline RL	—Unverified
Off-dynamics Conditional Diffusion Planners	Oct 16, 2024	Offline RLReinforcement Learning (RL)	—Unverified
OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control	Nov 10, 2024	Multi-agent Reinforcement LearningOffline RL	—Unverified
Offline Actor-Critic Reinforcement Learning Scales to Large Models	Feb 8, 2024	continuous-controlContinuous Control	—Unverified
Offline Evaluation for Reinforcement Learning-based Recommendation: A Critical Issue and Some Alternatives	Jan 3, 2023	Offline RLRecommendation Systems	—Unverified
Offline Fictitious Self-Play for Competitive Games	Feb 29, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Offline Guarded Safe Reinforcement Learning for Medical Treatment Optimization Strategies	May 22, 2025	Offline RLQ-Learning	—Unverified
Offline Inverse Constrained Reinforcement Learning for Safe-Critical Decision Making in Healthcare	Oct 10, 2024	Common Sense ReasoningData Augmentation	—Unverified
Offline Inverse Reinforcement Learning	Jun 9, 2021	Data AugmentationImitation Learning	—Unverified
Offline Model-Based Reinforcement Learning with Anti-Exploration	Aug 20, 2024	D4RLmodel	—Unverified
Offline Multi-Agent Reinforcement Learning with Coupled Value Factorization	Jun 15, 2023	ManagementMulti-agent Reinforcement Learning	—Unverified
Offline Multi-task Transfer RL with Representational Penalization	Feb 19, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Offline Policy Evaluation and Optimization under Confounding	Nov 29, 2022	Offline RLOff-policy evaluation	—Unverified
Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data	Jun 24, 2023	Offline RLreinforcement-learning	—Unverified
Offline Policy Optimization in RL with Variance Regularizaton	Dec 29, 2022	continuous-controlContinuous Control	—Unverified
Offline Policy Optimization with Variance Regularization	Jan 1, 2021	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 14 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified