Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 626–650 of 755 papers

Title	Date	Tasks	Status
PROGRESSOR: A Perceptually Guided Reward Estimator with Self-Supervised Online Refinement	Nov 26, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Prompting Decision Transformer for Few-Shot Policy Generalization	Jun 27, 2022	Few-Shot LearningInductive Bias	—Unverified
Provable Benefit of Multitask Representation Learning in Reinforcement Learning	Jun 13, 2022	Offline RLreinforcement-learning	—Unverified
What can online reinforcement learning with function approximation benefit from general coverage conditions?	Apr 25, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Gauss-Newton Temporal Difference Learning with Nonlinear Function Approximation	Feb 25, 2023	Offline RLQ-Learning	—Unverified
Provably Efficient Offline Reinforcement Learning with Trajectory-Wise Reward	Jun 13, 2022	Offline RLreinforcement-learning	—Unverified
Provably Efficient Offline Reinforcement Learning with Perturbed Data Sources	Jun 14, 2023	Offline RLreinforcement-learning	—Unverified
Provably Efficient Representation Selection in Low-rank Markov Decision Processes: From Online to Offline RL	Jun 22, 2021	Deep Reinforcement LearningOffline RL	—Unverified
Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care	Jun 13, 2023	Offline RLQ-Learning	—Unverified
Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL	Sep 8, 2022	D4RLOffline RL	—Unverified
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified
Q-Transformer: Scalable Offline Reinforcement Learning via Autoregressive Q-Functions	Sep 18, 2023	Imitation LearningOffline RL	—Unverified
Q-value Regularized Decision ConvFormer for Offline Reinforcement Learning	Sep 12, 2024	D4RLOffline RL	—Unverified
Real Robot Challenge 2022: Learning Dexterous Manipulation from Offline Data in the Real World	Aug 15, 2023	Offline RLreinforcement-learning	—Unverified
The Smart Buildings Control Suite: A Diverse Open Source Benchmark to Evaluate and Scale HVAC Control Policies for Sustainability	Oct 2, 2024	Model Predictive ControlOffline RL	—Unverified
Real-World Fluid Directed Rigid Body Control via Deep Reinforcement Learning	Feb 8, 2024	Deep Reinforcement LearningOffline RL	—Unverified
Real-World Offline Reinforcement Learning from Vision Language Model Feedback	Nov 8, 2024	Language ModelingLanguage Modelling	—Unverified
Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage	Feb 5, 2023	Offline RLQ-Learning	—Unverified
Regularized Behavior Value Estimation	Mar 17, 2021	Offline RL	—Unverified
Reinforced Self-Training (ReST) for Language Modeling	Aug 17, 2023	Language ModelingLanguage Modelling	—Unverified
Reinforcement Learning: An Overview	Dec 6, 2024	Decision MakingDeep Reinforcement Learning	—Unverified
Reinforcement Learning-based Recommender Systems with Large Language Models for State Reward and Action Modeling	Mar 25, 2024	Offline RLRecommendation Systems	—Unverified
Reinforcement Learning for Individual Optimal Policy from Heterogeneous Data	May 14, 2025	Offline RLreinforcement-learning	—Unverified
Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism	May 29, 2023	Decision MakingEconometrics	—Unverified
Reliable validation of Reinforcement Learning Benchmarks	Mar 2, 2022	BenchmarkingData Compression	—Unverified

Show:10 25 50

← PrevPage 26 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified