Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–675 of 755 papers

Title	Date	Tasks	Status
Launchpad: Learning to Schedule Using Offline and Online RL Methods	Dec 1, 2022	Deep Reinforcement LearningOffline RL	—Unverified
Learning Dexterous Manipulation from Suboptimal Experts	Oct 16, 2020	Offline RLQ-Learning	—Unverified
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified
Learning to Clarify by Reinforcement Learning Through Reward-Weighted Fine-Tuning	Jun 8, 2025	Offline RLQuestion Answering	—Unverified
Learning to Influence Human Behavior with Offline Reinforcement Learning	Mar 3, 2023	Autonomous DrivingOffline RL	—Unverified
Learning to View: Decision Transformers for Active Object Detection	Jan 23, 2023	Active Object DetectionMotion Planning	—Unverified
Learning Value Functions from Undirected State-only Experience	Apr 26, 2022	Future predictionImitation Learning	—Unverified
Leveraging Domain-Unlabeled Data in Offline Reinforcement Learning across Two Domains	Apr 11, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Leveraging Offline Data in Online Reinforcement Learning	Nov 9, 2022	Offline RLreinforcement-learning	—Unverified
Leveraging Optimal Transport for Enhanced Offline Reinforcement Learning in Surgical Robotic Environments	Oct 13, 2023	Active LearningOffline RL	—Unverified
LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble	Nov 26, 2024	Offline RLReinforcement Learning (RL)	—Unverified
LLQL: Logistic Likelihood Q-Learning for Reinforcement Learning	Jul 5, 2023	Offline RLQ-Learning	—Unverified
Language Decision Transformers with Exponential Tilt for Interactive Text Environments	Feb 10, 2023	Offline RL	—Unverified
Measurement Scheduling for ICU Patients with Offline Reinforcement Learning	Feb 12, 2024	Offline RLreinforcement-learning	—Unverified
Minimax Optimal and Computationally Efficient Algorithms for Distributionally Robust Offline Reinforcement Learning	Mar 14, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Minimax-Optimal Reward-Agnostic Exploration in Reinforcement Learning	Apr 14, 2023	Offline RLreinforcement-learning	—Unverified
Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization	Dec 7, 2023	Model-based Reinforcement LearningOffline RL	—Unverified
Model-Based Offline Planning	Aug 12, 2020	modelOffline RL	—Unverified
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation	Mar 26, 2025	D4RLData Augmentation	—Unverified
Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds	Aug 16, 2024	Model-based Reinforcement LearningOffline RL	—Unverified
Model-enhanced Contrastive Reinforcement Learning for Sequential Recommendation	Oct 25, 2023	Contrastive Learningmodel	—Unverified
Model Generation with Provable Coverability for Offline Reinforcement Learning	Jun 1, 2022	Offline RLOut-of-Distribution Generalization	—Unverified
MoMA: Model-based Mirror Ascent for Offline Reinforcement Learning	Jan 21, 2024	Decision MakingOffline RL	—Unverified
MOORL: A Framework for Integrating Offline-Online Reinforcement Learning	Jun 11, 2025	D4RLDeep Reinforcement Learning	—Unverified
More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning	Feb 11, 2024	Distributional Reinforcement LearningMulti-Armed Bandits	—Unverified

Show:10 25 50

← PrevPage 27 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified