Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 726–750 of 755 papers

Title	Date	Tasks	Status
Contrastive Example-Based Control	Jul 24, 2023	Offline RL	CodeCode Available
Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and Smoothness	Sep 29, 2023	Offline RLreinforcement-learning	CodeCode Available
Diffusion Models as Optimizers for Efficient Planning in Offline RL	Jul 23, 2024	D4RLDecision Making	CodeCode Available
Step-wise Policy for Rare-tool Knowledge (SPaRK): Offline RL that Drives Diverse Tool Use in LLMs	Jul 15, 2025	DiversityMMLU	CodeCode Available
DiffCPS: Diffusion Model based Constrained Policy Search for Offline Reinforcement Learning	Oct 9, 2023	D4RLOffline RL	CodeCode Available
MICRO: Model-Based Offline Reinforcement Learning with a Conservative Bellman Operator	Dec 7, 2023	Offline RLreinforcement-learning	CodeCode Available
DiffClone: Enhanced Behaviour Cloning in Robotics with Diffusion-Driven Policy Learning	Jan 17, 2024	Offline RLRobot Manipulation	CodeCode Available
MAHALO: Unifying Offline Reinforcement Learning and Imitation Learning from Observations	Mar 30, 2023	Decision MakingImitation Learning	CodeCode Available
Revisiting Bellman Errors for Offline Model Selection	Jan 31, 2023	Atari Gamesmodel	CodeCode Available
Unified Off-Policy Learning to Rank: a Reinforcement Learning Perspective	Jun 13, 2023	Learning-To-RankOffline RL	CodeCode Available
Leveraging Unlabeled Data Sharing through Kernel Function Approximation in Offline Reinforcement Learning	Aug 22, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available
Continual Task Learning through Adaptive Policy Self-Composition	Nov 18, 2024	Continual LearningOffline RL	CodeCode Available
Learning Versatile Skills with Curriculum Masking	Oct 23, 2024	Decision MakingOffline RL	CodeCode Available
DeepAveragers: Offline Reinforcement Learning by Solving Derived Non-Parametric MDPs	Oct 18, 2020	Offline RLreinforcement-learning	CodeCode Available
Behavior Prior Representation learning for Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	CodeCode Available
Compositional Conservatism: A Transductive Approach in Offline Reinforcement Learning	Apr 6, 2024	D4RLOffline RL	CodeCode Available
Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL	May 26, 2025	D4RLOffline RL	CodeCode Available
RL Unplugged: A Collection of Benchmarks for Offline Reinforcement Learning	Dec 1, 2020	Offline RLreinforcement-learning	CodeCode Available
RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning	Jun 24, 2020	Atari GamesDQN Replay Dataset	CodeCode Available
Decision Transformer under Random Frame Dropping	Mar 3, 2023	Deep Reinforcement LearningMuJoCo	CodeCode Available
Learning to Reach Goals via Diffusion	Oct 4, 2023	Computational EfficiencyDecision Making	CodeCode Available
The CoSTAR Block Stacking Dataset: Learning with Workspace Constraints	Oct 27, 2018	6D Pose Estimation using RGBDIndustrial Robots	CodeCode Available
Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL	Jun 8, 2024	Data AugmentationMamba	CodeCode Available
TrajDeleter: Enabling Trajectory Forgetting in Offline Reinforcement Learning Agents	Apr 18, 2024	energy managementOffline RL	CodeCode Available
Robust Offline Reinforcement learning with Heavy-Tailed Rewards	Oct 28, 2023	Offline RLOff-policy evaluation	CodeCode Available

Show:10 25 50

← PrevPage 30 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified