Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 326–350 of 755 papers

Title	Date	Tasks	Status
MOORL: A Framework for Integrating Offline-Online Reinforcement Learning	Jun 11, 2025	D4RLDeep Reinforcement Learning	—Unverified
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified
Learning to Clarify by Reinforcement Learning Through Reward-Weighted Fine-Tuning	Jun 8, 2025	Offline RLQuestion Answering	—Unverified
Dialogue Evaluation with Offline Reinforcement Learning	Sep 2, 2022	Dialogue EvaluationOffline RL	—Unverified
Addressing Extrapolation Error in Deep Offline Reinforcement Learning	Jan 1, 2021	Offline RLreinforcement-learning	—Unverified
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified
Learning Value Functions from Undirected State-only Experience	Apr 26, 2022	Future predictionImitation Learning	—Unverified
Boosting Offline Reinforcement Learning with Residual Generative Modeling	Jun 19, 2021	Offline RLQ-Learning	—Unverified
Design from Policies: Conservative Test-Time Adaptation for Offline Policy Optimization	Jun 26, 2023	Offline RLTest-time Adaptation	—Unverified
Learning Dexterous Manipulation from Suboptimal Experts	Oct 16, 2020	Offline RLQ-Learning	—Unverified
Boosting Offline Reinforcement Learning for Autonomous Driving with Hierarchical Latent Skills	Sep 24, 2023	Autonomous DrivingOffline RL	—Unverified
Model Generation with Provable Coverability for Offline Reinforcement Learning	Jun 1, 2022	Offline RLOut-of-Distribution Generalization	—Unverified
Launchpad: Learning to Schedule Using Offline and Online RL Methods	Dec 1, 2022	Deep Reinforcement LearningOffline RL	—Unverified
Leveraging Optimal Transport for Enhanced Offline Reinforcement Learning in Surgical Robotic Environments	Oct 13, 2023	Active LearningOffline RL	—Unverified
DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning	Jun 13, 2024	D4RLOffline RL	—Unverified
LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble	Nov 26, 2024	Offline RLReinforcement Learning (RL)	—Unverified
LLQL: Logistic Likelihood Q-Learning for Reinforcement Learning	Jul 5, 2023	Offline RLQ-Learning	—Unverified
Language Decision Transformers with Exponential Tilt for Interactive Text Environments	Feb 10, 2023	Offline RL	—Unverified
Deploying Offline Reinforcement Learning with Human Feedback	Mar 13, 2023	Decision MakingModel Selection	—Unverified
Large-Scale Retrieval for Reinforcement Learning	Jun 10, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Delphic Offline Reinforcement Learning under Nonidentifiable Hidden Confounding	Jun 1, 2023	ManagementOffline RL	—Unverified
Bi-Level Offline Policy Optimization with Limited Exploration	Oct 10, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Multi-Objective-Optimization Multi-AUV Assisted Data Collection Framework for IoUT Based on Offline Reinforcement Learning	Oct 15, 2024	Collision AvoidanceOffline RL	—Unverified
Nearly Minimax Optimal Offline Reinforcement Learning with Linear Function Approximation: Single-Agent MDP and Markov Game	May 31, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Large Language Model driven Policy Exploration for Recommender Systems	Jan 23, 2025	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 14 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified