Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 676–700 of 755 papers

Title	Date	Tasks	Status
MOReL: Model-Based Offline Reinforcement Learning	Dec 1, 2020	modelOffline RL	—Unverified
MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning	Jan 6, 2024	Offline RLRobot Manipulation	—Unverified
Multi-Objective Decision Transformers for Offline Reinforcement Learning	Aug 31, 2023	D4RLOffline RL	—Unverified
Multi-Objective-Optimization Multi-AUV Assisted Data Collection Framework for IoUT Based on Offline Reinforcement Learning	Oct 15, 2024	Collision AvoidanceOffline RL	—Unverified
Multi-Object Navigation in real environments using hybrid policies	Jan 24, 2024	Imitation LearningObject	—Unverified
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified
Nearly Minimax Optimal Offline Reinforcement Learning with Linear Function Approximation: Single-Agent MDP and Markov Game	May 31, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Near-Optimal Offline Reinforcement Learning via Double Variance Reduction	Feb 2, 2021	Offline RLreinforcement-learning	—Unverified
Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning	Jul 7, 2020	Offline RLreinforcement-learning	—Unverified
Neural Network Approximation for Pessimistic Offline Reinforcement Learning	Dec 19, 2023	Deep Reinforcement LearningOffline RL	—Unverified
Off-dynamics Conditional Diffusion Planners	Oct 16, 2024	Offline RLReinforcement Learning (RL)	—Unverified
OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control	Nov 10, 2024	Multi-agent Reinforcement LearningOffline RL	—Unverified
Offline Actor-Critic Reinforcement Learning Scales to Large Models	Feb 8, 2024	continuous-controlContinuous Control	—Unverified
Offline Evaluation for Reinforcement Learning-based Recommendation: A Critical Issue and Some Alternatives	Jan 3, 2023	Offline RLRecommendation Systems	—Unverified
Offline Fictitious Self-Play for Competitive Games	Feb 29, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Offline Guarded Safe Reinforcement Learning for Medical Treatment Optimization Strategies	May 22, 2025	Offline RLQ-Learning	—Unverified
Offline Inverse Constrained Reinforcement Learning for Safe-Critical Decision Making in Healthcare	Oct 10, 2024	Common Sense ReasoningData Augmentation	—Unverified
Offline Inverse Reinforcement Learning	Jun 9, 2021	Data AugmentationImitation Learning	—Unverified
Offline Model-Based Reinforcement Learning with Anti-Exploration	Aug 20, 2024	D4RLmodel	—Unverified
Offline Multi-Agent Reinforcement Learning with Coupled Value Factorization	Jun 15, 2023	ManagementMulti-agent Reinforcement Learning	—Unverified
Offline Multi-task Transfer RL with Representational Penalization	Feb 19, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Offline Policy Evaluation and Optimization under Confounding	Nov 29, 2022	Offline RLOff-policy evaluation	—Unverified
Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data	Jun 24, 2023	Offline RLreinforcement-learning	—Unverified
Offline Policy Optimization in RL with Variance Regularizaton	Dec 29, 2022	continuous-controlContinuous Control	—Unverified
Offline Policy Optimization with Variance Regularization	Jan 1, 2021	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 28 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified