Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 726–750 of 755 papers

Title	Date	Tasks	Status
Offline RL Policies Should be Trained to be Adaptive	Jul 5, 2022	Offline RL	—Unverified
Offline RL via Feature-Occupancy Gradient Ascent	May 22, 2024	Offline RL	—Unverified
Offline RL with Observation Histories: Analyzing and Improving Sample Complexity	Oct 31, 2023	Autonomous NavigationOffline RL	—Unverified
Offline RL With Realistic Datasets: Heteroskedasticity and Support Constraints	Nov 2, 2022	Atari GamesOffline RL	—Unverified
Offline Robotic World Model: Learning Robotic Policies without a Physics Simulator	Apr 23, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Offline Trajectory Generalization for Offline Reinforcement Learning	Apr 16, 2024	D4RLData Augmentation	—Unverified
OffRIPP: Offline RL-based Informative Path Planning	Sep 25, 2024	Offline RLreinforcement-learning	—Unverified
OmniRL: In-Context Reinforcement Learning by Large-Scale Meta-Training in Randomized Worlds	Feb 5, 2025	Few-Shot LearningImitation Learning	—Unverified
Sample Complexity of Offline Reinforcement Learning with Deep ReLU Networks	Mar 11, 2021	Offline RLreinforcement-learning	—Unverified
On Instance-Dependent Bounds for Offline Reinforcement Learning with Linear Function Approximation	Nov 23, 2022	Offline RLreinforcement-learning	—Unverified
On Multi-objective Policy Optimization as a Tool for Reinforcement Learning: Case Studies in Offline RL and Finetuning	Jun 15, 2021	Deep Reinforcement LearningMixture-of-Experts	—Unverified
On Sample-Efficient Offline Reinforcement Learning: Data Diversity, Posterior Sampling, and Beyond	Jan 6, 2024	Decision MakingDiversity	—Unverified
On the Role of Discount Factor in Offline Reinforcement Learning	Jun 7, 2022	D4RLOffline RL	—Unverified
On the Sample Complexity of Vanilla Model-Based Offline Reinforcement Learning with Dependent Samples	Mar 7, 2023	Offline RLOff-policy evaluation	—Unverified
On the Statistical Complexity for Offline and Low-Adaptive Reinforcement Learning with Structures	Jan 3, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Offline Preference-Based Apprenticeship Learning	Jul 20, 2021	Active LearningOffline RL	—Unverified
OPAL: Offline Primitive Discovery for Accelerating Offline Reinforcement Learning	Oct 26, 2020	Few-Shot Imitation LearningImitation Learning	—Unverified
OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators	May 27, 2024	Decision MakingOffline RL	—Unverified
Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian	Nov 1, 2022	Decision MakingOffline RL	—Unverified
Binary Reward Labeling: Bridging Offline Preference and Reward-Based Reinforcement Learning	Jun 14, 2024	D4RLOffline RL	—Unverified
Optimal Single-Policy Sample Complexity and Transient Coverage for Average-Reward Offline RL	Jun 26, 2025	Offline RL	—Unverified
Optimistic Model Rollouts for Pessimistic Offline Policy Optimization	Jan 11, 2024	modelOffline RL	—Unverified
Optimization Solution Functions as Deterministic Policies for Offline Reinforcement Learning	Aug 27, 2024	Offline RLreinforcement-learning	—Unverified
Optimizing Trajectories for Highway Driving with Offline Reinforcement Learning	Mar 21, 2022	Autonomous DrivingOffline RL	—Unverified
Oracle Inequalities for Model Selection in Offline Reinforcement Learning	Nov 3, 2022	Model SelectionOffline RL	—Unverified

Show:10 25 50

← PrevPage 30 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified