Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 426–450 of 755 papers

Title	Date	Tasks	Status
Advancing RAN Slicing with Offline Reinforcement Learning	Dec 16, 2023	ManagementOffline RL	—Unverified
A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning	Dec 12, 2023	MuJoCoOffline RL	—Unverified
Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization	Dec 7, 2023	Model-based Reinforcement LearningOffline RL	—Unverified
MICRO: Model-Based Offline Reinforcement Learning with a Conservative Bellman Operator	Dec 7, 2023	Offline RLreinforcement-learning	CodeCode Available
Diffused Task-Agnostic Milestone Planner	Dec 6, 2023	Decision MakingOffline RL	—Unverified
Evaluation of Active Feature Acquisition Methods for Static Feature Settings	Dec 6, 2023	Offline RLreinforcement-learning	—Unverified
H-GAP: Humanoid Control with a Generalist Planner	Dec 5, 2023	Humanoid ControlModel Predictive Control	—Unverified
Is Inverse Reinforcement Learning Harder than Standard Reinforcement Learning? A Theoretical Perspective	Nov 29, 2023	Offline RLreinforcement-learning	—Unverified
Self-Driving Telescopes: Autonomous Scheduling of Astronomical Observation Campaigns with Offline Reinforcement Learning	Nov 29, 2023	AstronomyOffline RL	—Unverified
A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning	Nov 27, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Offline Reinforcement Learning for Wireless Network Optimization with Mixture Datasets	Nov 19, 2023	ManagementOffline RL	—Unverified
Offline Data Enhanced On-Policy Policy Gradient with Provable Guarantees	Nov 14, 2023	Offline RL	CodeCode Available
Rethinking Decision Transformer via Hierarchical Reinforcement Learning	Nov 1, 2023	Decision MakingHierarchical Reinforcement Learning	—Unverified
Offline RL with Observation Histories: Analyzing and Improving Sample Complexity	Oct 31, 2023	Autonomous NavigationOffline RL	—Unverified
Safety-aware Causal Representation for Trustworthy Offline Reinforcement Learning in Autonomous Driving	Oct 31, 2023	Autonomous DrivingAutonomous Vehicles	—Unverified
A Tractable Inference Perspective of Offline RL	Oct 31, 2023	MuJoCoOffline RL	—Unverified
Robust Offline Reinforcement learning with Heavy-Tailed Rewards	Oct 28, 2023	Offline RLOff-policy evaluation	CodeCode Available
Bridging Distributionally Robust Learning and Offline RL: An Approach to Mitigate Distribution Shift and Partial Data Coverage	Oct 27, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available
Guided Data Augmentation for Offline Reinforcement Learning and Imitation Learning	Oct 27, 2023	Autonomous DrivingD4RL	—Unverified
Model-enhanced Contrastive Reinforcement Learning for Sequential Recommendation	Oct 25, 2023	Contrastive Learningmodel	—Unverified
Finetuning Offline World Models in the Real World	Oct 24, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Corruption-Robust Offline Reinforcement Learning with General Function Approximation	Oct 23, 2023	Offline RLreinforcement-learning	CodeCode Available
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning	Oct 18, 2023	Offline RLQuantization	—Unverified
Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning	Oct 16, 2023	ChatbotOffline RL	CodeCode Available
End-to-end Offline Reinforcement Learning for Glycemia Control	Oct 16, 2023	Offline RLreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 18 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified