Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 755 papers

Title	Date	Tasks	Status
Human-centric Dialog Training via Offline Reinforcement Learning	Oct 12, 2020	Language ModellingOffline RL	—Unverified
Contrastive Learning as Goal-Conditioned Reinforcement Learning	Jun 15, 2022	Contrastive LearningData Augmentation	—Unverified
Flexible Blood Glucose Control: Offline Reinforcement Learning from Human Feedback	Jan 27, 2025	Offline RLReinforcement Learning (RL)	—Unverified
BECAUSE: Bilinear Causal Representation for Generalizable Offline Model-based Reinforcement Learning	Jul 15, 2024	Model-based Reinforcement LearningOffline RL	—Unverified
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance	Sep 4, 2023	Offline RLreinforcement-learning	—Unverified
Contrastive Diffuser: Planning Towards High Return States via Contrastive Learning	Feb 5, 2024	Contrastive LearningD4RL	—Unverified
BCRLSP: An Offline Reinforcement Learning Framework for Sequential Targeted Promotion	Jul 16, 2022	Offline RLreinforcement-learning	—Unverified
Bayesian Reparameterization of Reward-Conditioned Reinforcement Learning with Energy-based Models	May 18, 2023	MuJoCoOffline RL	—Unverified
Contextual Transformer for Offline Meta Reinforcement Learning	Nov 15, 2022	D4RLMeta Reinforcement Learning	—Unverified
Feasibility-Aware Pessimistic Estimation: Toward Long-Horizon Safety in Offline RL	May 13, 2025	Offline RLSafe Reinforcement Learning	—Unverified
Context-Former: Stitching via Latent Conditioned Sequence Modeling	Jan 29, 2024	D4RLDecision Making	—Unverified
AdaCred: Adaptive Causal Decision Transformers with Feature Crediting	Dec 19, 2024	AttributeImitation Learning	—Unverified
Unified Preference Optimization: Language Model Alignment Beyond the Preference Frontier	May 28, 2024	Language ModelingLanguage Modelling	—Unverified
Align Your Intents: Offline Imitation Learning via Optimal Transport	Feb 20, 2024	D4RLDecision Making	—Unverified
A Tractable Inference Perspective of Offline RL	Oct 31, 2023	MuJoCoOffline RL	—Unverified
Exploring the Potential of Offline RL for Reasoning in LLMs: A Preliminary Study	May 4, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Exploiting Generalization in Offline Reinforcement Learning via Unseen State Augmentations	Aug 7, 2023	Offline RLreinforcement-learning	—Unverified
Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning	Jun 1, 2023	FairnessOffline RL	—Unverified
H-GAP: Humanoid Control with a Generalist Planner	Dec 5, 2023	Humanoid ControlModel Predictive Control	—Unverified
How to Leverage Unlabeled Data in Offline Reinforcement Learning	Feb 3, 2022	Offline RLreinforcement-learning	—Unverified
Evaluation-Time Policy Switching for Offline Reinforcement Learning	Mar 15, 2025	Behavioural cloningOffline RL	—Unverified
Evaluation of Active Feature Acquisition Methods for Static Feature Settings	Dec 6, 2023	Offline RLreinforcement-learning	—Unverified
Equivariant Offline Reinforcement Learning	Jun 20, 2024	Offline RLQ-Learning	—Unverified
Equivariant Data Augmentation for Generalization in Offline Reinforcement Learning	Sep 14, 2023	Data AugmentationOffline RL	—Unverified
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified
Ensemble Successor Representations for Task Generalization in Offline-to-Online Reinforcement Learning	May 12, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Conservative Data Sharing for Multi-Task Offline Reinforcement Learning	Sep 16, 2021	Offline RLreinforcement-learning	—Unverified
Batch-Constrained Distributional Reinforcement Learning for Session-based Recommendation	Dec 16, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation	May 6, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Exclusively Penalized Q-learning for Offline Reinforcement Learning	May 23, 2024	Offline RLQ-Learning	—Unverified
Hybrid Reinforcement Learning Breaks Sample Size Barriers in Linear MDPs	Aug 8, 2024	Offline RLreinforcement-learning	—Unverified
ENOTO: Improving Offline-to-Online Reinforcement Learning with Q-Ensembles	Jun 12, 2023	Offline RLreinforcement-learning	—Unverified
Confidence-Conditioned Value Functions for Offline Reinforcement Learning	Dec 8, 2022	Offline RLreinforcement-learning	—Unverified
Enhancing Reinforcement Learning Through Guided Search	Aug 19, 2024	Offline RLreinforcement-learning	—Unverified
Enhancing Pre-Trained Decision Transformers with Prompt-Tuning Bandits	Feb 7, 2025	InformativenessOffline RL	—Unverified
A Validation Tool for Designing Reinforcement Learning Environments	Dec 10, 2021	Offline RLreinforcement-learning	—Unverified
Automatic Trade-off Adaptation in Offline RL	Jun 16, 2023	Offline RL	—Unverified
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning	Jul 19, 2021	Offline RLQ-Learning	—Unverified
Enhancing Offline Model-Based RL via Active Model Selection: A Bayesian Optimization Perspective	Feb 17, 2025	Bayesian Optimizationmodel	—Unverified
Enhancing Cross-domain Pre-Trained Decision Transformers with Adaptive Attention	Sep 11, 2024	Offline RL	—Unverified
Federated Offline Reinforcement Learning	Jun 11, 2022	Offline RLPrivacy Preserving	—Unverified
Federated Offline Reinforcement Learning: Collaborative Single-Policy Coverage Suffices	Feb 8, 2024	Federated LearningOffline RL	—Unverified
Fighting Uncertainty with Gradients: Offline Reinforcement Learning via Diffusion Score Matching	Jun 24, 2023	Imitation LearningOffline RL	—Unverified
Finer Behavioral Foundation Models via Auto-Regressive Features and Advantage Weighting	Dec 5, 2024	D4RLOffline RL	—Unverified
Finetuning from Offline Reinforcement Learning: Challenges, Trade-offs and Practical Solutions	Mar 30, 2023	DiversityOffline RL	—Unverified
Finetuning Offline World Models in the Real World	Oct 24, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Enhanced DACER Algorithm with High Diffusion Efficiency	May 29, 2025	DenoisingImitation Learning	—Unverified
Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning	Jun 26, 2025	Action GenerationDecision Making	—Unverified
Energy-Weighted Flow Matching for Offline Reinforcement Learning	Mar 6, 2025	Offline RLreinforcement-learning	—Unverified
Comparing Model-free and Model-based Algorithms for Offline Reinforcement Learning	Jan 14, 2022	modelMuJoCo	—Unverified

Show:10 25 50

← PrevPage 5 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified