Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 376–400 of 755 papers

Title	Date	Tasks	Status	Hype
Policy Regularization with Dataset Constraint for Offline Reinforcement Learning	Jun 11, 2023	Offline RLreinforcement-learning	CodeCode Available	1
Iteratively Refined Behavior Regularization for Offline Reinforcement Learning	Jun 9, 2023	D4RLOffline RL	—Unverified	0
Instructed Diffuser with Temporal Condition Guidance for Offline Reinforcement Learning	Jun 8, 2023	Decision MakingOffline RL	—Unverified	0
Decoupled Prioritized Resampling for Offline RL	Jun 8, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL	Jun 7, 2023	Data AugmentationOffline RL	CodeCode Available	1
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning	Jun 6, 2023	D4RLMuJoCo	CodeCode Available	0
PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation	Jun 6, 2023	Offline RLReinforcement Learning (RL)	—Unverified	0
State Regularized Policy Optimization on Data with Dynamics Shift	Jun 6, 2023	Offline RLReinforcement Learning (RL)	—Unverified	0
Survival Instinct in Offline Reinforcement Learning	Jun 5, 2023	Offline RLreinforcement-learning	—Unverified	0
Delphic Offline Reinforcement Learning under Nonidentifiable Hidden Confounding	Jun 1, 2023	ManagementOffline RL	—Unverified	0
Improving and Benchmarking Offline Reinforcement Learning Algorithms	Jun 1, 2023	AttributeBenchmarking	CodeCode Available	1
Improving Offline RL by Blending Heuristics	Jun 1, 2023	D4RLOffline RL	—Unverified	0
IQL-TD-MPC: Implicit Q-Learning for Hierarchical Model Predictive Control	Jun 1, 2023	D4RLModel-based Reinforcement Learning	—Unverified	0
Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning	Jun 1, 2023	FairnessOffline RL	—Unverified	0
Efficient Diffusion Policies for Offline Reinforcement Learning	May 31, 2023	D4RLOffline RL	CodeCode Available	1
Primal-Attention: Self-attention through Asymmetric Kernel SVD in Primal Representation	May 31, 2023	D4RLLanguage Modelling	CodeCode Available	1
What is Essential for Unseen Goal Generalization of Offline Goal-conditioned RL?	May 30, 2023	Imitation LearningOffline RL	CodeCode Available	0
Robust Reinforcement Learning Objectives for Sequential Recommender Systems	May 30, 2023	Offline RLRecommendation Systems	CodeCode Available	0
Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism	May 29, 2023	Decision MakingEconometrics	—Unverified	0
MADiff: Offline Multi-agent Learning with Diffusion Models	May 27, 2023	Offline RLQ-Learning	CodeCode Available	1
The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement Learning	May 25, 2023	Distributional Reinforcement LearningOffline RL	CodeCode Available	0
Beyond Reward: Offline Preference-guided Policy Optimization	May 25, 2023	Offline RLreinforcement-learning	CodeCode Available	0
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning	May 24, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Leftover Lunch: Advantage-based Offline Reinforcement Learning for Language Models	May 24, 2023	Language ModellingOffline RL	CodeCode Available	1
When should we prefer Decision Transformers for Offline Reinforcement Learning?	May 23, 2023	D4RLImitation Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 16 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified