Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 755 papers

Title	Date	Tasks	Status	Hype
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning	Jul 29, 2024	Offline RLreinforcement-learning	—Unverified	0
A Simulation Benchmark for Autonomous Racing with Large-Scale Human Data	Jul 23, 2024	Autonomous DrivingAutonomous Racing	CodeCode Available	2
Diffusion Models as Optimizers for Efficient Planning in Offline RL	Jul 23, 2024	D4RLDecision Making	CodeCode Available	0
ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems	Jul 18, 2024	Offline RLRecommendation Systems	CodeCode Available	0
Sparsity-based Safety Conservatism for Constrained Offline Reinforcement Learning	Jul 17, 2024	Autonomous DrivingDecision Making	—Unverified	0
BECAUSE: Bilinear Causal Representation for Generalizable Offline Model-based Reinforcement Learning	Jul 15, 2024	Model-based Reinforcement LearningOffline RL	—Unverified	0
Pessimism Meets Risk: Risk-Sensitive Offline Reinforcement Learning	Jul 10, 2024	Decision MakingOffline RL	—Unverified	0
FOSP: Fine-tuning Offline Safe Policy through World Models	Jul 6, 2024	Model-based Reinforcement LearningOffline RL	—Unverified	0
Robust Decision Transformer: Tackling Data Corruption in Offline RL via Sequence Modeling	Jul 5, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0
To Switch or Not to Switch? Balanced Policy Switching in Offline Reinforcement Learning	Jul 1, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0
Benchmarks for Reinforcement Learning with Biased Offline Data and Imperfect Simulators	Jun 30, 2024	Autonomous VehiclesOffline RL	—Unverified	0
Model-based Offline Reinforcement Learning with Lower Expectile Q-Learning	Jun 30, 2024	D4RLOffline RL	—Unverified	0
Preference Elicitation for Offline Reinforcement Learning	Jun 26, 2024	Offline RLreinforcement-learning	—Unverified	0
Equivariant Offline Reinforcement Learning	Jun 20, 2024	Offline RLQ-Learning	—Unverified	0
Urban-Focused Multi-Task Offline Reinforcement Learning with Contrastive Data Sharing	Jun 20, 2024	Autonomous DrivingData Augmentation	—Unverified	0
Order-Optimal Instance-Dependent Bounds for Offline Reinforcement Learning with Preference Feedback	Jun 18, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0
The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation	Jun 17, 2024	Offline RL	—Unverified	0
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning	Jun 14, 2024	Offline RL	CodeCode Available	3
Binary Reward Labeling: Bridging Offline Preference and Reward-Based Reinforcement Learning	Jun 14, 2024	D4RLOffline RL	—Unverified	0
SeMOPO: Learning High-quality Model and Policy from Low-quality Offline Visual Datasets	Jun 13, 2024	D4RLOffline RL	—Unverified	0
DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning	Jun 13, 2024	D4RLOffline RL	—Unverified	0
Is Value Learning Really the Main Bottleneck in Offline RL?	Jun 13, 2024	Imitation LearningOffline RL	CodeCode Available	3
A Dual Approach to Imitation Learning from Observations with Offline Datasets	Jun 13, 2024	Imitation LearningOffline RL	—Unverified	0
Augmenting Offline RL with Unlabeled Data	Jun 11, 2024	Offline RLTransfer Learning	—Unverified	0
CDSA: Conservative Denoising Score-based Algorithm for Offline Reinforcement Learning	Jun 11, 2024	D4RLDenoising	—Unverified	0

Show:10 25 50

← PrevPage 7 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified