Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 755 papers

Title	Date	Tasks	Status
Boosting Offline Reinforcement Learning for Autonomous Driving with Hierarchical Latent Skills	Sep 24, 2023	Autonomous DrivingOffline RL	—Unverified
Boosting Offline Reinforcement Learning via Data Rebalancing	Oct 17, 2022	D4RLOffline RL	—Unverified
Boosting Offline Reinforcement Learning with Residual Generative Modeling	Jun 19, 2021	Offline RLQ-Learning	—Unverified
Bootstrapped Transformer for Offline Reinforcement Learning	Jun 17, 2022	Offline RLreinforcement-learning	—Unverified
BRAC+: Going Deeper with Behavior Regularized Offline Reinforcement Learning	Jan 1, 2021	Offline RLreinforcement-learning	—Unverified
Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism	Mar 22, 2021	Imitation LearningMulti-Armed Bandits	—Unverified
Bridging the Gap Between Offline and Online Reinforcement Learning Evaluation Methodologies	Dec 15, 2022	Offline RLreinforcement-learning	—Unverified
Budgeting Counterfactual for Offline RL	Jul 12, 2023	counterfactualCounterfactual Reasoning	—Unverified
Cache-Efficient Posterior Sampling for Reinforcement Learning with LLM-Derived Priors Across Discrete and Continuous Domains	May 12, 2025	continuous-controlContinuous Control	—Unverified
Enhancing Video Analytics Accuracy via Real-time Automated Camera Parameter Tuning	Jul 8, 2021	Face DetectionFace Recognition	—Unverified
Can Offline Reinforcement Learning Help Natural Language Understanding?	Sep 15, 2022	Language ModelingLanguage Modelling	—Unverified
Causal prompting model-based offline reinforcement learning	Jun 3, 2024	modelOffline RL	—Unverified
CDSA: Conservative Denoising Score-based Algorithm for Offline Reinforcement Learning	Jun 11, 2024	D4RLDenoising	—Unverified
Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic Settings	May 13, 2021	Offline RL	—Unverified
ChiPFormer: Transferable Chip Placement via Offline Decision Transformer	Jun 26, 2023	Offline RLReinforcement Learning (RL)	—Unverified
CLUE: Calibrated Latent Guidance for Offline Reinforcement Learning	Jun 23, 2023	Imitation LearningOffline RL	—Unverified
ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization	Oct 2, 2024	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Comparing Model-free and Model-based Algorithms for Offline Reinforcement Learning	Jan 14, 2022	modelMuJoCo	—Unverified
Confidence-Conditioned Value Functions for Offline Reinforcement Learning	Dec 8, 2022	Offline RLreinforcement-learning	—Unverified
Conservative Data Sharing for Multi-Task Offline Reinforcement Learning	Sep 16, 2021	Offline RLreinforcement-learning	—Unverified
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning	Jul 19, 2021	Offline RLQ-Learning	—Unverified
Context-Former: Stitching via Latent Conditioned Sequence Modeling	Jan 29, 2024	D4RLDecision Making	—Unverified
Contextual Transformer for Offline Meta Reinforcement Learning	Nov 15, 2022	D4RLMeta Reinforcement Learning	—Unverified
Contrastive Diffuser: Planning Towards High Return States via Contrastive Learning	Feb 5, 2024	Contrastive LearningD4RL	—Unverified
Contrastive Learning as Goal-Conditioned Reinforcement Learning	Jun 15, 2022	Contrastive LearningData Augmentation	—Unverified
Contrastive Value Learning: Implicit Models for Simple Offline RL	Nov 3, 2022	continuous-controlContinuous Control	—Unverified
Corruption-Robust Offline Reinforcement Learning	Jun 11, 2021	Adversarial RobustnessOffline RL	—Unverified
CrowdPlay: Crowdsourcing human demonstration data for offline learning in Atari games	Sep 29, 2021	Atari GamesDecision Making	—Unverified
CtRL-Sim: Reactive and Controllable Driving Agents with Offline Reinforcement Learning	Mar 29, 2024	counterfactualOffline RL	—Unverified
CUDC: A Curiosity-Driven Unsupervised Data Collection Method with Adaptive Temporal Distances for Offline Reinforcement Learning	Dec 19, 2023	NavigateOffline RL	—Unverified
Curriculum Offline Imitating Learning	Dec 1, 2021	continuous-controlContinuous Control	—Unverified
D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning	Aug 15, 2024	Deep Reinforcement LearningOffline RL	—Unverified
DARA: Dynamics-Aware Reward Augmentation in Offline Reinforcement Learning	Mar 13, 2022	Offline RLreinforcement-learning	—Unverified
Data Center Cooling System Optimization Using Offline Reinforcement Learning	Jan 25, 2025	Graph Neural NetworkOffline RL	—Unverified
Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data	Oct 16, 2022	Model SelectionOffline RL	—Unverified
Data Sharing without Rewards in Multi-Task Offline Reinforcement Learning	Sep 29, 2021	Multi-Task LearningOffline RL	—Unverified
Consistent time travel for realistic interactions with historical data: reinforcement learning for market making	Aug 5, 2024	Offline RL	—Unverified
Decision SpikeFormer: Spike-Driven Transformer for Decision Making	Apr 4, 2025	D4RLDecision Making	—Unverified
Deep Offline Reinforcement Learning for Real-world Treatment Optimization Applications	Feb 15, 2023	Decision MakingManagement	—Unverified
Deep RL with Hierarchical Action Exploration for Dialogue Generation	Mar 22, 2023	Dialogue GenerationOffline RL	—Unverified
DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning	Feb 23, 2021	Continuous ControlOffline RL	—Unverified
Delphic Offline Reinforcement Learning under Nonidentifiable Hidden Confounding	Jun 1, 2023	ManagementOffline RL	—Unverified
Deploying Offline Reinforcement Learning with Human Feedback	Mar 13, 2023	Decision MakingModel Selection	—Unverified
Design from Policies: Conservative Test-Time Adaptation for Offline Policy Optimization	Jun 26, 2023	Offline RLTest-time Adaptation	—Unverified
Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm	Sep 24, 2024	Offline RLOff-policy evaluation	—Unverified
Dialogue Evaluation with Offline Reinforcement Learning	Sep 2, 2022	Dialogue EvaluationOffline RL	—Unverified
DIAR: Diffusion-model-guided Implicit Q-learning with Adaptive Revaluation	Oct 15, 2024	Decision MakingOffline RL	—Unverified
DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning	Jun 13, 2024	D4RLOffline RL	—Unverified
DiffStitch: Boosting Offline Reinforcement Learning with Diffusion-based Trajectory Stitching	Feb 4, 2024	D4RLData Augmentation	—Unverified
Diffused Task-Agnostic Milestone Planner	Dec 6, 2023	Decision MakingOffline RL	—Unverified

Show:10 25 50

← PrevPage 8 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified