Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–475 of 755 papers

Title	Date	Tasks	Status
You Can't Count on Luck: Why Decision Transformers and RvS Fail in Stochastic Environments	May 31, 2022	Offline RLPlaying the Game of 2048	—Unverified
You Only Evaluate Once: a Simple Baseline Algorithm for Offline RL	Oct 5, 2021	D4RLOffline RL	—Unverified
Your Offline Policy is Not Trustworthy: Bilevel Reinforcement Learning for Sequential Portfolio Optimization	May 19, 2025	Offline RLPortfolio Optimization	—Unverified
PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation	Jun 6, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Prior-Guided Diffusion Planning for Offline Reinforcement Learning	May 16, 2025	Decision MakingDenoising	—Unverified
How to Provably Improve Return Conditioned Supervised Learning?	Jun 10, 2025	Decision MakingOffline RL	—Unverified
Accelerating Diffusion Models in Offline RL via Reward-Aware Consistency Trajectory Distillation	Jun 9, 2025	Decision MakingMuJoCo	—Unverified
Accelerating Offline Reinforcement Learning Application in Real-Time Bidding and Recommendation: Potential Use of Simulation	Sep 17, 2021	Decision MakingOffline RL	—Unverified
Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning	Jun 1, 2023	FairnessOffline RL	—Unverified
A Conservative Q-Learning approach for handling distribution shift in sepsis treatment strategies	Mar 25, 2022	Deep Reinforcement LearningOffline RL	—Unverified
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning	Oct 18, 2023	Offline RLQuantization	—Unverified
AdaCred: Adaptive Causal Decision Transformers with Feature Crediting	Dec 19, 2024	AttributeImitation Learning	—Unverified
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning	Mar 14, 2023	continuous-controlContinuous Control	—Unverified
Adaptive Q-learning for Interaction-Limited Reinforcement Learning	Sep 29, 2021	Offline RLQ-Learning	—Unverified
Addressing Distribution Shift in Online Reinforcement Learning with Offline Datasets	Jan 1, 2021	D4RLMuJoCo	—Unverified
Addressing Extrapolation Error in Deep Offline Reinforcement Learning	Jan 1, 2021	Offline RLreinforcement-learning	—Unverified
ADG: Ambient Diffusion-Guided Dataset Recovery for Corruption-Robust Offline Reinforcement Learning	May 29, 2025	DenoisingMuJoCo	—Unverified
A Dual Approach to Imitation Learning from Observations with Offline Datasets	Jun 13, 2024	Imitation LearningOffline RL	—Unverified
Advancing RAN Slicing with Offline Reinforcement Learning	Dec 16, 2023	ManagementOffline RL	—Unverified
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning	Jan 1, 2024	continuous-controlContinuous Control	—Unverified
A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning	Nov 27, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Align Your Intents: Offline Imitation Learning via Optimal Transport	Feb 20, 2024	D4RLDecision Making	—Unverified
Task-Agnostic Learning to Accomplish New Tasks	Sep 9, 2022	Imitation LearningOffline RL	—Unverified
Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning	May 3, 2025	D4RLOffline RL	—Unverified
An Empirical Study of Implicit Regularization in Deep Offline RL	Jul 5, 2022	Offline RL	—Unverified

Show:10 25 50

← PrevPage 19 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified