Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–525 of 755 papers

Title	Date	Tasks	Status
Iteratively Refined Behavior Regularization for Offline Reinforcement Learning	Jun 9, 2023	D4RLOffline RL	—Unverified
Instructed Diffuser with Temporal Condition Guidance for Offline Reinforcement Learning	Jun 8, 2023	Decision MakingOffline RL	—Unverified
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning	Jun 6, 2023	D4RLMuJoCo	CodeCode Available
PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation	Jun 6, 2023	Offline RLReinforcement Learning (RL)	—Unverified
State Regularized Policy Optimization on Data with Dynamics Shift	Jun 6, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Survival Instinct in Offline Reinforcement Learning	Jun 5, 2023	Offline RLreinforcement-learning	—Unverified
Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning	Jun 1, 2023	FairnessOffline RL	—Unverified
Improving Offline RL by Blending Heuristics	Jun 1, 2023	D4RLOffline RL	—Unverified
Delphic Offline Reinforcement Learning under Nonidentifiable Hidden Confounding	Jun 1, 2023	ManagementOffline RL	—Unverified
IQL-TD-MPC: Implicit Q-Learning for Hierarchical Model Predictive Control	Jun 1, 2023	D4RLModel-based Reinforcement Learning	—Unverified
What is Essential for Unseen Goal Generalization of Offline Goal-conditioned RL?	May 30, 2023	Imitation LearningOffline RL	CodeCode Available
Robust Reinforcement Learning Objectives for Sequential Recommender Systems	May 30, 2023	Offline RLRecommendation Systems	CodeCode Available
Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism	May 29, 2023	Decision MakingEconometrics	—Unverified
Beyond Reward: Offline Preference-guided Policy Optimization	May 25, 2023	Offline RLreinforcement-learning	CodeCode Available
The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement Learning	May 25, 2023	Distributional Reinforcement LearningOffline RL	CodeCode Available
Offline Primal-Dual Reinforcement Learning for Linear MDPs	May 22, 2023	Offline RLreinforcement-learning	—Unverified
Offline Reinforcement Learning with Additional Covering Distributions	May 22, 2023	Inductive BiasOffline RL	—Unverified
Bayesian Reparameterization of Reward-Conditioned Reinforcement Learning with Energy-based Models	May 18, 2023	MuJoCoOffline RL	—Unverified
SLiC-HF: Sequence Likelihood Calibration with Human Feedback	May 17, 2023	Language ModelingLanguage Modelling	—Unverified
Reward-agnostic Fine-tuning: Provable Statistical Benefits of Hybrid Reinforcement Learning	May 17, 2023	Offline RLreinforcement-learning	—Unverified
Double Pessimism is Provably Efficient for Distributionally Robust Offline Reinforcement Learning: Generic Algorithm and Robust Partial Coverage	May 16, 2023	Offline RL	—Unverified
Towards Generalizable Reinforcement Learning for Trade Execution	May 12, 2023	Offline RLreinforcement-learning	—Unverified
Explaining RL Decisions with Trajectories	May 6, 2023	Attributecontinuous-control	CodeCode Available
What can online reinforcement learning with function approximation benefit from general coverage conditions?	Apr 25, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Using Offline Data to Speed Up Reinforcement Learning in Procedurally Generated Environments	Apr 18, 2023	Imitation LearningOffline RL	CodeCode Available

Show:10 25 50

← PrevPage 21 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified