Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 676–700 of 755 papers

Title	Date	Tasks	Status
Should I Run Offline Reinforcement Learning or Behavioral Cloning?	Sep 29, 2021	Atari GamesDiagnostic	—Unverified
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified
Targeted Environment Design from Offline Data	Sep 29, 2021	Offline RLReinforcement Learning (RL)	—Unverified
The Essential Elements of Offline RL via Supervised Learning	Sep 29, 2021	Offline RLreinforcement-learning	—Unverified
CrowdPlay: Crowdsourcing human demonstration data for offline learning in Atari games	Sep 29, 2021	Atari GamesDecision Making	—Unverified
Particle Based Stochastic Policy Optimization	Sep 29, 2021	Deep Reinforcement LearningMuJoCo Games	—Unverified
Pareto Policy Pool for Model-based Offline Reinforcement Learning	Sep 29, 2021	D4RLOffline RL	—Unverified
Uncertainty Regularized Policy Learning for Offline Reinforcement Learning	Sep 29, 2021	D4RLOffline RL	—Unverified
Variational oracle guiding for reinforcement learning	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Adaptive Q-learning for Interaction-Limited Reinforcement Learning	Sep 29, 2021	Offline RLQ-Learning	—Unverified
Data Sharing without Rewards in Multi-Task Offline Reinforcement Learning	Sep 29, 2021	Multi-Task LearningOffline RL	—Unverified
Offline Reinforcement Learning with Resource Constrained Online Deployment	Sep 29, 2021	D4RLOffline RL	—Unverified
Why so pessimistic? Estimating uncertainties for offline RL through ensembles, and why their independence matters.	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Accelerating Offline Reinforcement Learning Application in Real-Time Bidding and Recommendation: Potential Use of Simulation	Sep 17, 2021	Decision MakingOffline RL	—Unverified
Conservative Data Sharing for Multi-Task Offline Reinforcement Learning	Sep 16, 2021	Offline RLreinforcement-learning	—Unverified
DCUR: Data Curriculum for Teaching via Samples with Reinforcement Learning	Sep 15, 2021	Deep Reinforcement LearningOffline RL	CodeCode Available
Policy Gradients Incorporating the Future	Aug 4, 2021	Offline RLReinforcement Learning (RL)	—Unverified
Offline Preference-Based Apprenticeship Learning	Jul 20, 2021	Active LearningOffline RL	—Unverified
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning	Jul 19, 2021	Offline RLQ-Learning	—Unverified
Pessimistic Model-based Offline Reinforcement Learning under Partial Coverage	Jul 13, 2021	Offline RLreinforcement-learning	—Unverified
Enhancing Video Analytics Accuracy via Real-time Automated Camera Parameter Tuning	Jul 8, 2021	Face DetectionFace Recognition	—Unverified
The Least Restriction for Offline Reinforcement Learning	Jul 5, 2021	Offline RLQ-Learning	—Unverified
Optimality Inductive Biases and Agnostic Guidelines for Offline Reinforcement Learning	Jul 3, 2021	AttributeInductive Bias	CodeCode Available
Provably Efficient Representation Selection in Low-rank Markov Decision Processes: From Online to Offline RL	Jun 22, 2021	Deep Reinforcement LearningOffline RL	—Unverified
Boosting Offline Reinforcement Learning with Residual Generative Modeling	Jun 19, 2021	Offline RLQ-Learning	—Unverified

Show:10 25 50

← PrevPage 28 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified