Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 755 papers

Title	Date	Tasks	Status
Diffusion-Based Offline RL for Improved Decision-Making in Augmented ARC Task	Oct 15, 2024	ARCDecision Making	—Unverified
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning	Jul 29, 2024	Offline RLreinforcement-learning	—Unverified
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning	Jul 10, 2023	continuous-controlContinuous Control	—Unverified
Diffusion Self-Weighted Guidance for Offline Reinforcement Learning	May 23, 2025	Offline RLreinforcement-learning	—Unverified
Discovering Multiple Solutions from a Single Task in Offline Reinforcement Learning	Jun 10, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Distributionally Robust Model-Based Offline Reinforcement Learning with Near-Optimal Sample Complexity	Aug 11, 2022	Decision MakingOffline RL	—Unverified
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation	Sep 14, 2022	Offline RLreinforcement-learning	—Unverified
Diverse Transformer Decoding for Offline Reinforcement Learning Using Financial Algorithmic Approaches	Feb 13, 2025	D4RLOffline RL	—Unverified
Domain Adaptation for Offline Reinforcement Learning with Limited Samples	Aug 22, 2024	Domain AdaptationOffline RL	—Unverified
Domain Generalization for Robust Model-Based Offline Reinforcement Learning	Nov 27, 2022	Domain GeneralizationOffline RL	—Unverified
DOMAIN: MilDly COnservative Model-BAsed OfflINe Reinforcement Learning	Sep 16, 2023	D4RLmodel	—Unverified
Double Pessimism is Provably Efficient for Distributionally Robust Offline Reinforcement Learning: Generic Algorithm and Robust Partial Coverage	May 16, 2023	Offline RL	—Unverified
DR3: Value-Based Deep Reinforcement Learning Requires Explicit Regularization	Dec 9, 2021	Atari GamesD4RL	—Unverified
DRDT3: Diffusion-Refined Decision Test-Time Training Model	Jan 12, 2025	D4RLOffline RL	—Unverified
Dual Generator Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	—Unverified
Efficient Imitation Learning with Conservative World Models	May 21, 2024	Imitation LearningOffline RL	—Unverified
Efficient Online RL Fine Tuning with Offline Pre-trained Policy Only	May 22, 2025	Imitation LearningOffline RL	—Unverified
EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL	Jul 21, 2020	D4RLDecision Making	—Unverified
Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL	Apr 15, 2024	GPUOffline RL	—Unverified
Enabling A Network AI Gym for Autonomous Cyber Agents	Apr 3, 2023	Deep Reinforcement LearningOffline RL	—Unverified
End-to-End Offline Goal-Oriented Dialog Policy Learning via Policy Gradient	Dec 7, 2017	DecoderGoal-Oriented Dialog	—Unverified
End-to-end Offline Reinforcement Learning for Glycemia Control	Oct 16, 2023	Offline RLreinforcement-learning	—Unverified
Energy-Weighted Flow Matching for Offline Reinforcement Learning	Mar 6, 2025	Offline RLreinforcement-learning	—Unverified
Enhanced DACER Algorithm with High Diffusion Efficiency	May 29, 2025	DenoisingImitation Learning	—Unverified
Enhancing Cross-domain Pre-Trained Decision Transformers with Adaptive Attention	Sep 11, 2024	Offline RL	—Unverified
Enhancing Offline Model-Based RL via Active Model Selection: A Bayesian Optimization Perspective	Feb 17, 2025	Bayesian Optimizationmodel	—Unverified
Enhancing Pre-Trained Decision Transformers with Prompt-Tuning Bandits	Feb 7, 2025	InformativenessOffline RL	—Unverified
Enhancing Reinforcement Learning Through Guided Search	Aug 19, 2024	Offline RLreinforcement-learning	—Unverified
ENOTO: Improving Offline-to-Online Reinforcement Learning with Q-Ensembles	Jun 12, 2023	Offline RLreinforcement-learning	—Unverified
Ensemble Successor Representations for Task Generalization in Offline-to-Online Reinforcement Learning	May 12, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified
Equivariant Data Augmentation for Generalization in Offline Reinforcement Learning	Sep 14, 2023	Data AugmentationOffline RL	—Unverified
Equivariant Offline Reinforcement Learning	Jun 20, 2024	Offline RLQ-Learning	—Unverified
Evaluation of Active Feature Acquisition Methods for Static Feature Settings	Dec 6, 2023	Offline RLreinforcement-learning	—Unverified
Evaluation-Time Policy Switching for Offline Reinforcement Learning	Mar 15, 2025	Behavioural cloningOffline RL	—Unverified
Exclusively Penalized Q-learning for Offline Reinforcement Learning	May 23, 2024	Offline RLQ-Learning	—Unverified
Exploiting Generalization in Offline Reinforcement Learning via Unseen State Augmentations	Aug 7, 2023	Offline RLreinforcement-learning	—Unverified
Exploring the Potential of Offline RL for Reasoning in LLMs: A Preliminary Study	May 4, 2025	Offline RLReinforcement Learning (RL)	—Unverified
A Tractable Inference Perspective of Offline RL	Oct 31, 2023	MuJoCoOffline RL	—Unverified
Feasibility-Aware Pessimistic Estimation: Toward Long-Horizon Safety in Offline RL	May 13, 2025	Offline RLSafe Reinforcement Learning	—Unverified
Federated Offline Reinforcement Learning	Jun 11, 2022	Offline RLPrivacy Preserving	—Unverified
Federated Offline Reinforcement Learning: Collaborative Single-Policy Coverage Suffices	Feb 8, 2024	Federated LearningOffline RL	—Unverified
Fighting Uncertainty with Gradients: Offline Reinforcement Learning via Diffusion Score Matching	Jun 24, 2023	Imitation LearningOffline RL	—Unverified
Finer Behavioral Foundation Models via Auto-Regressive Features and Advantage Weighting	Dec 5, 2024	D4RLOffline RL	—Unverified
Finetuning from Offline Reinforcement Learning: Challenges, Trade-offs and Practical Solutions	Mar 30, 2023	DiversityOffline RL	—Unverified
Finetuning Offline World Models in the Real World	Oct 24, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Flexible Blood Glucose Control: Offline Reinforcement Learning from Human Feedback	Jan 27, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning	Jun 26, 2025	Action GenerationDecision Making	—Unverified
FOSP: Fine-tuning Offline Safe Policy through World Models	Jul 6, 2024	Model-based Reinforcement LearningOffline RL	—Unverified
From Novelty to Imitation: Self-Distilled Rewards for Offline Reinforcement Learning	Jul 17, 2025	D4RLOffline RL	—Unverified

Show:10 25 50

← PrevPage 12 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified