Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–525 of 755 papers

Title	Date	Tasks	Status
Boosting Offline Reinforcement Learning for Autonomous Driving with Hierarchical Latent Skills	Sep 24, 2023	Autonomous DrivingOffline RL	—Unverified
Boosting Offline Reinforcement Learning via Data Rebalancing	Oct 17, 2022	D4RLOffline RL	—Unverified
Boosting Offline Reinforcement Learning with Residual Generative Modeling	Jun 19, 2021	Offline RLQ-Learning	—Unverified
Bootstrapped Transformer for Offline Reinforcement Learning	Jun 17, 2022	Offline RLreinforcement-learning	—Unverified
BRAC+: Going Deeper with Behavior Regularized Offline Reinforcement Learning	Jan 1, 2021	Offline RLreinforcement-learning	—Unverified
Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism	Mar 22, 2021	Imitation LearningMulti-Armed Bandits	—Unverified
Bridging the Gap Between Offline and Online Reinforcement Learning Evaluation Methodologies	Dec 15, 2022	Offline RLreinforcement-learning	—Unverified
Budgeting Counterfactual for Offline RL	Jul 12, 2023	counterfactualCounterfactual Reasoning	—Unverified
Cache-Efficient Posterior Sampling for Reinforcement Learning with LLM-Derived Priors Across Discrete and Continuous Domains	May 12, 2025	continuous-controlContinuous Control	—Unverified
Enhancing Video Analytics Accuracy via Real-time Automated Camera Parameter Tuning	Jul 8, 2021	Face DetectionFace Recognition	—Unverified
Can Offline Reinforcement Learning Help Natural Language Understanding?	Sep 15, 2022	Language ModelingLanguage Modelling	—Unverified
Causal prompting model-based offline reinforcement learning	Jun 3, 2024	modelOffline RL	—Unverified
CDSA: Conservative Denoising Score-based Algorithm for Offline Reinforcement Learning	Jun 11, 2024	D4RLDenoising	—Unverified
Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic Settings	May 13, 2021	Offline RL	—Unverified
ChiPFormer: Transferable Chip Placement via Offline Decision Transformer	Jun 26, 2023	Offline RLReinforcement Learning (RL)	—Unverified
CLUE: Calibrated Latent Guidance for Offline Reinforcement Learning	Jun 23, 2023	Imitation LearningOffline RL	—Unverified
ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization	Oct 2, 2024	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Comparing Model-free and Model-based Algorithms for Offline Reinforcement Learning	Jan 14, 2022	modelMuJoCo	—Unverified
Confidence-Conditioned Value Functions for Offline Reinforcement Learning	Dec 8, 2022	Offline RLreinforcement-learning	—Unverified
Conservative Data Sharing for Multi-Task Offline Reinforcement Learning	Sep 16, 2021	Offline RLreinforcement-learning	—Unverified
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning	Jul 19, 2021	Offline RLQ-Learning	—Unverified
Context-Former: Stitching via Latent Conditioned Sequence Modeling	Jan 29, 2024	D4RLDecision Making	—Unverified
Contextual Transformer for Offline Meta Reinforcement Learning	Nov 15, 2022	D4RLMeta Reinforcement Learning	—Unverified
Contrastive Diffuser: Planning Towards High Return States via Contrastive Learning	Feb 5, 2024	Contrastive LearningD4RL	—Unverified
Contrastive Learning as Goal-Conditioned Reinforcement Learning	Jun 15, 2022	Contrastive LearningData Augmentation	—Unverified

Show:10 25 50

← PrevPage 21 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified