Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 426–450 of 755 papers

Title	Date	Tasks	Status
Uncertainty-Aware Decision Transformer for Stochastic Driving Environments	Sep 28, 2023	Autonomous DrivingOffline RL	—Unverified
Uncertainty-aware Distributional Offline Reinforcement Learning	Mar 26, 2024	Offline RLreinforcement-learning	—Unverified
Uncertainty Regularized Policy Learning for Offline Reinforcement Learning	Sep 29, 2021	D4RLOffline RL	—Unverified
Uncertainty Weighted Offline Reinforcement Learning	Jan 1, 2021	Offline RLQ-Learning	—Unverified
Understanding Reinforcement Learning Algorithms: The Progress from Basic Q-learning to Proximal Policy Optimization	Mar 31, 2023	Offline RLQ-Learning	—Unverified
Unearthing Gems from Stones: Policy Optimization with Negative Sample Augmentation for LLM Reasoning	May 20, 2025	MathOffline RL	—Unverified
Unified Emulation-Simulation Training Environment for Autonomous Cyber Agents	Apr 3, 2023	Deep Reinforcement LearningOffline RL	—Unverified
Unsupervised-to-Online Reinforcement Learning	Aug 27, 2024	Offline RLreinforcement-learning	—Unverified
Urban-Focused Multi-Task Offline Reinforcement Learning with Contrastive Data Sharing	Jun 20, 2024	Autonomous DrivingData Augmentation	—Unverified
User-Interactive Offline Reinforcement Learning	May 21, 2022	Offline RLreinforcement-learning	—Unverified
Adaptive Q-Aid for Conditional Supervised Learning in Offline Reinforcement Learning	Feb 3, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Value Penalized Q-Learning for Recommender Systems	Oct 15, 2021	Offline RLQ-Learning	—Unverified
Variational oracle guiding for reinforcement learning	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Video-Enhanced Offline Reinforcement Learning: A Model-Based Approach	May 10, 2025	Autonomous DrivingOffline RL	—Unverified
VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning	Apr 16, 2025	D4RLOffline RL	—Unverified
Wall Street Tree Search: Risk-Aware Planning for Offline Reinforcement Learning	Nov 6, 2022	Decision MakingOffline RL	—Unverified
Warm-Start Actor-Critic: From Approximation Error to Sub-optimality Gap	Jun 20, 2023	Offline RLReinforcement Learning (RL)	—Unverified
What are the Statistical Limits of Offline RL with Linear Function Approximation?	Oct 22, 2020	Decision MakingOffline RL	—Unverified
What Matters for Batch Online Reinforcement Learning in Robotics?	May 12, 2025	Imitation LearningOffline RL	—Unverified
When Should We Prefer Offline Reinforcement Learning Over Behavioral Cloning?	Apr 12, 2022	Atari GamesDiagnostic	—Unverified
Which Features are Best for Successor Features?	Feb 15, 2025	Offline RL	—Unverified
Why Online Reinforcement Learning is Causal	Mar 7, 2024	counterfactualOffline RL	—Unverified
Why so pessimistic? Estimating uncertainties for offline RL through ensembles, and why their independence matters.	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Why So Pessimistic? Estimating Uncertainties for Offline RL through Ensembles, and Why Their Independence Matters	May 27, 2022	D4RLOffline RL	—Unverified
Yes, Q-learning Helps Offline In-Context RL	Feb 24, 2025	In-Context Reinforcement LearningMuJoCo	—Unverified

Show:10 25 50

← PrevPage 18 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified