Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 755 papers

Title	Date	Tasks	Status
Skill Decision Transformer	Jan 31, 2023	D4RLDescriptive	CodeCode Available
Identifying Expert Behavior in Offline Training Datasets Improves Behavioral Cloning of Robotic Manipulation Policies	Jan 30, 2023	Data AugmentationFeature Engineering	CodeCode Available
Learning to View: Decision Transformers for Active Object Detection	Jan 23, 2023	Active Object DetectionMotion Planning	—Unverified
Benchmarks and Algorithms for Offline Preference-Based Reward Learning	Jan 3, 2023	Active LearningOffline RL	—Unverified
Offline Evaluation for Reinforcement Learning-based Recommendation: A Critical Issue and Some Alternatives	Jan 3, 2023	Offline RLRecommendation Systems	—Unverified
Offline Policy Optimization in RL with Variance Regularizaton	Dec 29, 2022	continuous-controlContinuous Control	—Unverified
Offline Reinforcement Learning via Linear-Programming with Error-Bound Induced Constraints	Dec 28, 2022	Decision MakingOffline RL	—Unverified
Representation Learning in Deep RL via Discrete Information Bottleneck	Dec 28, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Bridging the Gap Between Offline and Online Reinforcement Learning Evaluation Methodologies	Dec 15, 2022	Offline RLreinforcement-learning	—Unverified
Confidence-Conditioned Value Functions for Offline Reinforcement Learning	Dec 8, 2022	Offline RLreinforcement-learning	—Unverified
Benchmarking Offline Reinforcement Learning Algorithms for E-Commerce Order Fraud Evaluation	Dec 5, 2022	BenchmarkingBinary Classification	—Unverified
TD3 with Reverse KL Regularizer for Offline Reinforcement Learning from Mixed Datasets	Dec 5, 2022	D4RLMuJoCo	CodeCode Available
Launchpad: Learning to Schedule Using Offline and Online RL Methods	Dec 1, 2022	Deep Reinforcement LearningOffline RL	—Unverified
Offline Policy Evaluation and Optimization under Confounding	Nov 29, 2022	Offline RLOff-policy evaluation	—Unverified
Offline Reinforcement Learning with Closed-Form Policy Improvement Operators	Nov 29, 2022	D4RLForm	—Unverified
Behavior Estimation from Multi-Source Data for Offline Reinforcement Learning	Nov 29, 2022	Offline RLreinforcement-learning	CodeCode Available
Is Conditional Generative Modeling all you need for Decision-Making?	Nov 28, 2022	AllDecision Making	—Unverified
State-Aware Proximal Pessimistic Algorithms for Offline Reinforcement Learning	Nov 28, 2022	Offline RLQ-Learning	—Unverified
Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes	Nov 28, 2022	Offline RLQ-Learning	—Unverified
Domain Generalization for Robust Model-Based Offline Reinforcement Learning	Nov 27, 2022	Domain GeneralizationOffline RL	—Unverified
On Instance-Dependent Bounds for Offline Reinforcement Learning with Linear Function Approximation	Nov 23, 2022	Offline RLreinforcement-learning	—Unverified
A Low Latency Adaptive Coding Spiking Framework for Deep Reinforcement Learning	Nov 21, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available
Offline Reinforcement Learning with Adaptive Behavior Regularization	Nov 15, 2022	D4RLOffline RL	—Unverified
Contextual Transformer for Offline Meta Reinforcement Learning	Nov 15, 2022	D4RLMeta Reinforcement Learning	—Unverified
Leveraging Offline Data in Online Reinforcement Learning	Nov 9, 2022	Offline RLreinforcement-learning	—Unverified
ARMOR: A Model-based Framework for Improving Arbitrary Baseline Policies with Offline Data	Nov 8, 2022	Offline RL	—Unverified
Wall Street Tree Search: Risk-Aware Planning for Offline Reinforcement Learning	Nov 6, 2022	Decision MakingOffline RL	—Unverified
Contrastive Value Learning: Implicit Models for Simple Offline RL	Nov 3, 2022	continuous-controlContinuous Control	—Unverified
Oracle Inequalities for Model Selection in Offline Reinforcement Learning	Nov 3, 2022	Model SelectionOffline RL	—Unverified
Offline RL With Realistic Datasets: Heteroskedasticity and Support Constraints	Nov 2, 2022	Atari GamesOffline RL	—Unverified
Behavior Prior Representation learning for Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	CodeCode Available
Dual Generator Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	—Unverified
Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian	Nov 1, 2022	Decision MakingOffline RL	—Unverified
Implicit Offline Reinforcement Learning via Supervised Learning	Oct 21, 2022	Offline RLreinforcement-learning	—Unverified
The Pump Scheduling Problem: A Real-World Scenario for Reinforcement Learning	Oct 20, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available
Robust Offline Reinforcement Learning with Gradient Penalty and Constraint Relaxation	Oct 19, 2022	D4RLMuJoCo	—Unverified
Boosting Offline Reinforcement Learning via Data Rebalancing	Oct 17, 2022	D4RLOffline RL	—Unverified
Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data	Oct 16, 2022	Model SelectionOffline RL	—Unverified
Mutual Information Regularized Offline Reinforcement Learning	Oct 14, 2022	D4RLOffline RL	CodeCode Available
Model-Based Offline Reinforcement Learning with Pessimism-Modulated Dynamics Belief	Oct 13, 2022	D4RLOffline RL	CodeCode Available
State Advantage Weighting for Offline RL	Oct 9, 2022	D4RLOffline RL	—Unverified
The Role of Coverage in Online Reinforcement Learning	Oct 9, 2022	Efficient ExplorationOffline RL	—Unverified
Offline Reinforcement Learning with Differentiable Function Approximation is Provably Efficient	Oct 3, 2022	Decision MakingOffline RL	—Unverified
S2P: State-conditioned Image Synthesis for Data Augmentation in Offline Reinforcement Learning	Sep 30, 2022	Data AugmentationImage Generation	CodeCode Available
Offline Reinforcement Learning with Instrumental Variables in Confounded Markov Decision Processes	Sep 18, 2022	Offline RLreinforcement-learning	—Unverified
Can Offline Reinforcement Learning Help Natural Language Understanding?	Sep 15, 2022	Language ModelingLanguage Modelling	—Unverified
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation	Sep 14, 2022	Offline RLreinforcement-learning	—Unverified
Task-Agnostic Learning to Accomplish New Tasks	Sep 9, 2022	Imitation LearningOffline RL	—Unverified
Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL	Sep 8, 2022	D4RLOffline RL	—Unverified
Dialogue Evaluation with Offline Reinforcement Learning	Sep 2, 2022	Dialogue EvaluationOffline RL	—Unverified

Show:10 25 50

← PrevPage 12 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified