Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–375 of 755 papers

Title	Date	Tasks	Status	Hype
Alleviating Matthew Effect of Offline Reinforcement Learning in Interactive Recommendation	Jul 10, 2023	Decision MakingInteractive Recommendation	CodeCode Available	1
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning	Jul 10, 2023	continuous-controlContinuous Control	—Unverified	0
Goal-Conditioned Predictive Coding for Offline Reinforcement Learning	Jul 7, 2023	Decision MakingOffline RL	—Unverified	0
Offline Reinforcement Learning with Imbalanced Datasets	Jul 6, 2023	D4RLOffline RL	—Unverified	0
LLQL: Logistic Likelihood Q-Learning for Reinforcement Learning	Jul 5, 2023	Offline RLQ-Learning	—Unverified	0
Model-Bellman Inconsistency for Model-based Offline Reinforcement Learning	Jul 1, 2023	D4RLmodel	CodeCode Available	1
Prioritized Trajectory Replay: A Replay Memory for Data-driven Reinforcement Learning	Jun 27, 2023	D4RLOffline RL	—Unverified	0
Design from Policies: Conservative Test-Time Adaptation for Offline Policy Optimization	Jun 26, 2023	Offline RLTest-time Adaptation	—Unverified	0
ChiPFormer: Transferable Chip Placement via Offline Decision Transformer	Jun 26, 2023	Offline RLReinforcement Learning (RL)	—Unverified	0
Fighting Uncertainty with Gradients: Offline Reinforcement Learning via Diffusion Score Matching	Jun 24, 2023	Imitation LearningOffline RL	—Unverified	0
Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data	Jun 24, 2023	Offline RLreinforcement-learning	—Unverified	0
CLUE: Calibrated Latent Guidance for Offline Reinforcement Learning	Jun 23, 2023	Imitation LearningOffline RL	—Unverified	0
Beyond OOD State Actions: Supported Cross-Domain Offline Reinforcement Learning	Jun 22, 2023	Data AugmentationOffline RL	CodeCode Available	1
Harnessing Mixed Offline Reinforcement Learning Datasets via Trajectory Weighting	Jun 22, 2023	Offline RLreinforcement-learning	CodeCode Available	1
Warm-Start Actor-Critic: From Approximation Error to Sub-optimality Gap	Jun 20, 2023	Offline RLReinforcement Learning (RL)	—Unverified	0
2vec: Policy Representations with Successor Features	Jun 16, 2023	Offline RL	—Unverified	0
Automatic Trade-off Adaptation in Offline RL	Jun 16, 2023	Offline RL	—Unverified	0
Semi-Offline Reinforcement Learning for Optimized Text Generation	Jun 16, 2023	Offline RLreinforcement-learning	CodeCode Available	0
Offline Multi-Agent Reinforcement Learning with Coupled Value Factorization	Jun 15, 2023	ManagementMulti-agent Reinforcement Learning	—Unverified	0
Provably Efficient Offline Reinforcement Learning with Perturbed Data Sources	Jun 14, 2023	Offline RLreinforcement-learning	—Unverified	0
Off-policy Evaluation in Doubly Inhomogeneous Environments	Jun 14, 2023	Offline RLOff-policy evaluation	CodeCode Available	0
Unified Off-Policy Learning to Rank: a Reinforcement Learning Perspective	Jun 13, 2023	Learning-To-RankOffline RL	CodeCode Available	0
Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care	Jun 13, 2023	Offline RLQ-Learning	—Unverified	0
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning	Jun 13, 2023	D4RLEfficient Exploration	—Unverified	0
ENOTO: Improving Offline-to-Online Reinforcement Learning with Q-Ensembles	Jun 12, 2023	Offline RLreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 15 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified