Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 755 papers

Title	Date	Tasks	Status	Hype
Can Wikipedia Help Offline Reinforcement Learning?	Jan 28, 2022	Offline RLreinforcement-learning	CodeCode Available	1
The Challenges of Exploration for Offline Reinforcement Learning	Jan 27, 2022	Model Predictive ControlOffline RL	—Unverified	0
Comparing Model-free and Model-based Algorithms for Offline Reinforcement Learning	Jan 14, 2022	modelMuJoCo	—Unverified	0
Offline Reinforcement Learning for Road Traffic Control	Jan 7, 2022	Offline RLreinforcement-learning	—Unverified	0
Single-Shot Pruning for Offline Reinforcement Learning	Dec 31, 2021	continuous-controlContinuous Control	—Unverified	0
Importance of Empirical Sample Complexity Analysis for Offline Reinforcement Learning	Dec 31, 2021	Offline RLreinforcement-learning	—Unverified	0
RvS: What is Essential for Offline RL via Supervised Learning?	Dec 20, 2021	Offline RL	CodeCode Available	1
A Validation Tool for Designing Reinforcement Learning Environments	Dec 10, 2021	Offline RLreinforcement-learning	—Unverified	0
DR3: Value-Based Deep Reinforcement Learning Requires Explicit Regularization	Dec 9, 2021	Atari GamesD4RL	—Unverified	0
Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks	Dec 6, 2021	AllMulti-agent Reinforcement Learning	CodeCode Available	1
Curriculum Offline Imitating Learning	Dec 1, 2021	continuous-controlContinuous Control	—Unverified	0
Robust On-Policy Sampling for Data-Efficient Policy Evaluation in Reinforcement Learning	Nov 29, 2021	Offline RLreinforcement-learning	CodeCode Available	0
Improving Zero-shot Generalization in Offline Reinforcement Learning using Generalized Similarity Functions	Nov 29, 2021	Contrastive LearningDecision Making	—Unverified	0
Plan Better Amid Conservatism: Offline Multi-Agent Reinforcement Learning with Actor Rectification	Nov 22, 2021	Continuous ControlMulti-agent Reinforcement Learning	CodeCode Available	1
UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning Leveraging Planning	Nov 22, 2021	Decision MakingOffline RL	—Unverified	0
Offline Reinforcement Learning: Fundamental Barriers for Value Function Approximation	Nov 21, 2021	Decision MakingOffline RL	—Unverified	0
A Survey of Zero-shot Generalisation in Deep Reinforcement Learning	Nov 18, 2021	Deep Reinforcement LearningOffline RL	—Unverified	0
A Dataset Perspective on Offline Reinforcement Learning	Nov 8, 2021	Offline RLreinforcement-learning	CodeCode Available	1
d3rlpy: An Offline Deep Reinforcement Learning Library	Nov 6, 2021	D4RLDeep Reinforcement Learning	CodeCode Available	0
RLDS: an Ecosystem to Generate, Share and Use Datasets in Reinforcement Learning	Nov 4, 2021	Decision MakingImitation Learning	CodeCode Available	1
Curriculum Offline Imitation Learning	Nov 3, 2021	continuous-controlContinuous Control	CodeCode Available	1
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics	Nov 2, 2021	D4RLData Augmentation	—Unverified	0
False Correlation Reduction for Offline Reinforcement Learning	Oct 24, 2021	D4RLDecision Making	CodeCode Available	1
Offline Reinforcement Learning with Value-based Episodic Memory	Oct 19, 2021	D4RLOffline RL	CodeCode Available	1
Towards Instance-Optimal Offline Reinforcement Learning with Pessimism	Oct 17, 2021	Offline RLreinforcement-learning	—Unverified	0
Value Penalized Q-Learning for Recommender Systems	Oct 15, 2021	Offline RLQ-Learning	—Unverified	0
Safe Driving via Expert Guided Policy Optimization	Oct 13, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Planning from Pixels in Environments with Combinatorially Hard Search Spaces	Oct 12, 2021	continuous-controlContinuous Control	CodeCode Available	1
Offline Reinforcement Learning with Implicit Q-Learning	Oct 12, 2021	D4RLOffline RL	CodeCode Available	1
Beyond Pick-and-Place: Tackling Robotic Stacking of Diverse Shapes	Oct 12, 2021	Offline RLReinforcement Learning (RL)	CodeCode Available	1
StARformer: Transformer with State-Action-Reward Representations for Visual Reinforcement Learning	Oct 12, 2021	Imitation LearningInductive Bias	CodeCode Available	1
Representation Learning for Online and Offline RL in Low-rank MDPs	Oct 9, 2021	Offline RLRepresentation Learning	—Unverified	0
Showing Your Offline Reinforcement Learning Work: Online Evaluation Budget Matters	Oct 8, 2021	Decision Makingenergy management	—Unverified	0
Offline RL With Resource Constrained Online Deployment	Oct 7, 2021	D4RLOffline RL	CodeCode Available	0
You Only Evaluate Once: a Simple Baseline Algorithm for Offline RL	Oct 5, 2021	D4RLOffline RL	—Unverified	0
Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble	Oct 4, 2021	Adroid door-clonedAdroid door-human	CodeCode Available	1
BRAC+: Improved Behavior Regularized Actor Critic for Offline Reinforcement Learning	Oct 2, 2021	Offline RLreinforcement-learning	CodeCode Available	0
Offline Reinforcement Learning with Reverse Model-based Imagination	Oct 1, 2021	Data Augmentationmodel	CodeCode Available	1
Reward Shifting for Optimistic Exploration and Conservative Exploitation	Sep 29, 2021	continuous-controlContinuous Control	—Unverified	0
Particle Based Stochastic Policy Optimization	Sep 29, 2021	Deep Reinforcement LearningMuJoCo Games	—Unverified	0
Variational oracle guiding for reinforcement learning	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Uncertainty Regularized Policy Learning for Offline Reinforcement Learning	Sep 29, 2021	D4RLOffline RL	—Unverified	0
Semi-supervised Offline Reinforcement Learning with Pre-trained Decision Transformers	Sep 29, 2021	D4RLOffline RL	—Unverified	0
Offline Reinforcement Learning with Resource Constrained Online Deployment	Sep 29, 2021	D4RLOffline RL	—Unverified	0
Offline Reinforcement Learning with In-sample Q-Learning	Sep 29, 2021	D4RLOffline RL	CodeCode Available	1
Adaptive Q-learning for Interaction-Limited Reinforcement Learning	Sep 29, 2021	Offline RLQ-Learning	—Unverified	0
Offline Reinforcement Learning for Large Scale Language Action Spaces	Sep 29, 2021	Language ModelingLanguage Modelling	—Unverified	0
Pareto Policy Pool for Model-based Offline Reinforcement Learning	Sep 29, 2021	D4RLOffline RL	—Unverified	0
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified	0
Data Sharing without Rewards in Multi-Task Offline Reinforcement Learning	Sep 29, 2021	Multi-Task LearningOffline RL	—Unverified	0

Show:10 25 50

← PrevPage 13 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified