Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 576–600 of 755 papers

Title	Date	Tasks	Status
ARMOR: A Model-based Framework for Improving Arbitrary Baseline Policies with Offline Data	Nov 8, 2022	Offline RL	—Unverified
Wall Street Tree Search: Risk-Aware Planning for Offline Reinforcement Learning	Nov 6, 2022	Decision MakingOffline RL	—Unverified
Contrastive Value Learning: Implicit Models for Simple Offline RL	Nov 3, 2022	continuous-controlContinuous Control	—Unverified
Oracle Inequalities for Model Selection in Offline Reinforcement Learning	Nov 3, 2022	Model SelectionOffline RL	—Unverified
Offline RL With Realistic Datasets: Heteroskedasticity and Support Constraints	Nov 2, 2022	Atari GamesOffline RL	—Unverified
Behavior Prior Representation learning for Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	CodeCode Available
Dual Generator Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	—Unverified
Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian	Nov 1, 2022	Decision MakingOffline RL	—Unverified
Implicit Offline Reinforcement Learning via Supervised Learning	Oct 21, 2022	Offline RLreinforcement-learning	—Unverified
The Pump Scheduling Problem: A Real-World Scenario for Reinforcement Learning	Oct 20, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available
Robust Offline Reinforcement Learning with Gradient Penalty and Constraint Relaxation	Oct 19, 2022	D4RLMuJoCo	—Unverified
Boosting Offline Reinforcement Learning via Data Rebalancing	Oct 17, 2022	D4RLOffline RL	—Unverified
Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data	Oct 16, 2022	Model SelectionOffline RL	—Unverified
Mutual Information Regularized Offline Reinforcement Learning	Oct 14, 2022	D4RLOffline RL	CodeCode Available
Model-Based Offline Reinforcement Learning with Pessimism-Modulated Dynamics Belief	Oct 13, 2022	D4RLOffline RL	CodeCode Available
State Advantage Weighting for Offline RL	Oct 9, 2022	D4RLOffline RL	—Unverified
The Role of Coverage in Online Reinforcement Learning	Oct 9, 2022	Efficient ExplorationOffline RL	—Unverified
Offline Reinforcement Learning with Differentiable Function Approximation is Provably Efficient	Oct 3, 2022	Decision MakingOffline RL	—Unverified
S2P: State-conditioned Image Synthesis for Data Augmentation in Offline Reinforcement Learning	Sep 30, 2022	Data AugmentationImage Generation	CodeCode Available
Offline Reinforcement Learning with Instrumental Variables in Confounded Markov Decision Processes	Sep 18, 2022	Offline RLreinforcement-learning	—Unverified
Can Offline Reinforcement Learning Help Natural Language Understanding?	Sep 15, 2022	Language ModelingLanguage Modelling	—Unverified
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation	Sep 14, 2022	Offline RLreinforcement-learning	—Unverified
Task-Agnostic Learning to Accomplish New Tasks	Sep 9, 2022	Imitation LearningOffline RL	—Unverified
Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL	Sep 8, 2022	D4RLOffline RL	—Unverified
Dialogue Evaluation with Offline Reinforcement Learning	Sep 2, 2022	Dialogue EvaluationOffline RL	—Unverified

Show:10 25 50

← PrevPage 24 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified