Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 755 papers

Title	Date	Tasks	Status	Hype
Don't Change the Algorithm, Change the Data: Exploratory Data for Offline Reinforcement Learning	Jan 31, 2022	DiversityOffline RL	CodeCode Available	1
Can Wikipedia Help Offline Reinforcement Learning?	Jan 28, 2022	Offline RLreinforcement-learning	CodeCode Available	1
RvS: What is Essential for Offline RL via Supervised Learning?	Dec 20, 2021	Offline RL	CodeCode Available	1
Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks	Dec 6, 2021	AllMulti-agent Reinforcement Learning	CodeCode Available	1
Plan Better Amid Conservatism: Offline Multi-Agent Reinforcement Learning with Actor Rectification	Nov 22, 2021	Continuous ControlMulti-agent Reinforcement Learning	CodeCode Available	1
A Dataset Perspective on Offline Reinforcement Learning	Nov 8, 2021	Offline RLreinforcement-learning	CodeCode Available	1
RLDS: an Ecosystem to Generate, Share and Use Datasets in Reinforcement Learning	Nov 4, 2021	Decision MakingImitation Learning	CodeCode Available	1
Curriculum Offline Imitation Learning	Nov 3, 2021	continuous-controlContinuous Control	CodeCode Available	1
False Correlation Reduction for Offline Reinforcement Learning	Oct 24, 2021	D4RLDecision Making	CodeCode Available	1
Offline Reinforcement Learning with Value-based Episodic Memory	Oct 19, 2021	D4RLOffline RL	CodeCode Available	1
Safe Driving via Expert Guided Policy Optimization	Oct 13, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Offline Reinforcement Learning with Implicit Q-Learning	Oct 12, 2021	D4RLOffline RL	CodeCode Available	1
StARformer: Transformer with State-Action-Reward Representations for Visual Reinforcement Learning	Oct 12, 2021	Imitation LearningInductive Bias	CodeCode Available	1
Beyond Pick-and-Place: Tackling Robotic Stacking of Diverse Shapes	Oct 12, 2021	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Planning from Pixels in Environments with Combinatorially Hard Search Spaces	Oct 12, 2021	continuous-controlContinuous Control	CodeCode Available	1
Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble	Oct 4, 2021	Adroid door-clonedAdroid door-human	CodeCode Available	1
Offline Reinforcement Learning with Reverse Model-based Imagination	Oct 1, 2021	Data Augmentationmodel	CodeCode Available	1
Offline Reinforcement Learning with In-sample Q-Learning	Sep 29, 2021	D4RLOffline RL	CodeCode Available	1
A Workflow for Offline Model-Free Robotic Reinforcement Learning	Sep 22, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings	Jul 23, 2021	Computational EfficiencyDecision Making	CodeCode Available	1
Conservative Offline Distributional Reinforcement Learning	Jul 12, 2021	D4RLDistributional Reinforcement Learning	CodeCode Available	1
Offline Meta-Reinforcement Learning with Online Self-Supervision	Jul 8, 2021	Meta Reinforcement LearningOffline RL	CodeCode Available	1
Offline-to-Online Reinforcement Learning via Balanced Replay and Pessimistic Q-Ensemble	Jul 1, 2021	Offline RLreinforcement-learning	CodeCode Available	1
OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation	Jun 21, 2021	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Offline RL Without Off-Policy Evaluation	Jun 16, 2021	D4RLOffline RL	CodeCode Available	1

Show:10 25 50

← PrevPage 7 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified