Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 755 papers

Title	Date	Tasks	Status
End-to-end Offline Reinforcement Learning for Glycemia Control	Oct 16, 2023	Offline RLreinforcement-learning	—Unverified
End-to-End Offline Goal-Oriented Dialog Policy Learning via Policy Gradient	Dec 7, 2017	DecoderGoal-Oriented Dialog	—Unverified
From Novelty to Imitation: Self-Distilled Rewards for Offline Reinforcement Learning	Jul 17, 2025	D4RLOffline RL	—Unverified
ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization	Oct 2, 2024	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Enabling A Network AI Gym for Autonomous Cyber Agents	Apr 3, 2023	Deep Reinforcement LearningOffline RL	—Unverified
Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL	Apr 15, 2024	GPUOffline RL	—Unverified
Augmenting Offline RL with Unlabeled Data	Jun 11, 2024	Offline RLTransfer Learning	—Unverified
EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL	Jul 21, 2020	D4RLDecision Making	—Unverified
CLUE: Calibrated Latent Guidance for Offline Reinforcement Learning	Jun 23, 2023	Imitation LearningOffline RL	—Unverified
Efficient Online RL Fine Tuning with Offline Pre-trained Policy Only	May 22, 2025	Imitation LearningOffline RL	—Unverified
A Fast Convergence Theory for Offline Decision Making	Jun 3, 2024	Decision MakingOffline RL	—Unverified
A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning	Nov 27, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Learning Dexterous Manipulation from Suboptimal Experts	Oct 16, 2020	Offline RLQ-Learning	—Unverified
ChiPFormer: Transferable Chip Placement via Offline Decision Transformer	Jun 26, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Efficient Imitation Learning with Conservative World Models	May 21, 2024	Imitation LearningOffline RL	—Unverified
Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic Settings	May 13, 2021	Offline RL	—Unverified
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning	Jan 1, 2024	continuous-controlContinuous Control	—Unverified
Dual Generator Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	—Unverified
A Survey on Model-based Reinforcement Learning	Jun 19, 2022	Decision Makingmodel	—Unverified
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning	Oct 18, 2023	Offline RLQuantization	—Unverified
DRDT3: Diffusion-Refined Decision Test-Time Training Model	Jan 12, 2025	D4RLOffline RL	—Unverified
DR3: Value-Based Deep Reinforcement Learning Requires Explicit Regularization	Dec 9, 2021	Atari GamesD4RL	—Unverified
CDSA: Conservative Denoising Score-based Algorithm for Offline Reinforcement Learning	Jun 11, 2024	D4RLDenoising	—Unverified
Double Pessimism is Provably Efficient for Distributionally Robust Offline Reinforcement Learning: Generic Algorithm and Robust Partial Coverage	May 16, 2023	Offline RL	—Unverified
A Survey of Zero-shot Generalisation in Deep Reinforcement Learning	Nov 18, 2021	Deep Reinforcement LearningOffline RL	—Unverified
A Strong Baseline for Batch Imitation Learning	Feb 6, 2023	continuous-controlContinuous Control	—Unverified
Causal prompting model-based offline reinforcement learning	Jun 3, 2024	modelOffline RL	—Unverified
DOMAIN: MilDly COnservative Model-BAsed OfflINe Reinforcement Learning	Sep 16, 2023	D4RLmodel	—Unverified
Domain Generalization for Robust Model-Based Offline Reinforcement Learning	Nov 27, 2022	Domain GeneralizationOffline RL	—Unverified
Prior-Guided Diffusion Planning for Offline Reinforcement Learning	May 16, 2025	Decision MakingDenoising	—Unverified
Large-Scale Retrieval for Reinforcement Learning	Jun 10, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Launchpad: Learning to Schedule Using Offline and Online RL Methods	Dec 1, 2022	Deep Reinforcement LearningOffline RL	—Unverified
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified
Leveraging Offline Data in Online Reinforcement Learning	Nov 9, 2022	Offline RLreinforcement-learning	—Unverified
Domain Adaptation for Offline Reinforcement Learning with Limited Samples	Aug 22, 2024	Domain AdaptationOffline RL	—Unverified
Can Offline Reinforcement Learning Help Natural Language Understanding?	Sep 15, 2022	Language ModelingLanguage Modelling	—Unverified
Diverse Transformer Decoding for Offline Reinforcement Learning Using Financial Algorithmic Approaches	Feb 13, 2025	D4RLOffline RL	—Unverified
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation	Sep 14, 2022	Offline RLreinforcement-learning	—Unverified
Enhancing Video Analytics Accuracy via Real-time Automated Camera Parameter Tuning	Jul 8, 2021	Face DetectionFace Recognition	—Unverified
Distributionally Robust Model-Based Offline Reinforcement Learning with Near-Optimal Sample Complexity	Aug 11, 2022	Decision MakingOffline RL	—Unverified
Discovering Multiple Solutions from a Single Task in Offline Reinforcement Learning	Jun 10, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Cache-Efficient Posterior Sampling for Reinforcement Learning with LLM-Derived Priors Across Discrete and Continuous Domains	May 12, 2025	continuous-controlContinuous Control	—Unverified
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning	Jun 13, 2023	D4RLEfficient Exploration	—Unverified
Advancing RAN Slicing with Offline Reinforcement Learning	Dec 16, 2023	ManagementOffline RL	—Unverified
ARMOR: A Model-based Framework for Improving Arbitrary Baseline Policies with Offline Data	Nov 8, 2022	Offline RL	—Unverified
Diffusion Self-Weighted Guidance for Offline Reinforcement Learning	May 23, 2025	Offline RLreinforcement-learning	—Unverified
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning	Jul 10, 2023	continuous-controlContinuous Control	—Unverified
Budgeting Counterfactual for Offline RL	Jul 12, 2023	counterfactualCounterfactual Reasoning	—Unverified
A Dual Approach to Imitation Learning from Observations with Offline Datasets	Jun 13, 2024	Imitation LearningOffline RL	—Unverified
Bridging the Gap Between Offline and Online Reinforcement Learning Evaluation Methodologies	Dec 15, 2022	Offline RLreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 6 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified