Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 755 papers

Title	Date	Tasks	Status
Federated Offline Reinforcement Learning: Collaborative Single-Policy Coverage Suffices	Feb 8, 2024	Federated LearningOffline RL	—Unverified
Offline Actor-Critic Reinforcement Learning Scales to Large Models	Feb 8, 2024	continuous-controlContinuous Control	—Unverified
Real-World Fluid Directed Rigid Body Control via Deep Reinforcement Learning	Feb 8, 2024	Deep Reinforcement LearningOffline RL	—Unverified
A Primal-Dual Algorithm for Offline Constrained Reinforcement Learning with Linear MDPs	Feb 7, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Contrastive Diffuser: Planning Towards High Return States via Contrastive Learning	Feb 5, 2024	Contrastive LearningD4RL	—Unverified
The Virtues of Pessimism in Inverse Reinforcement Learning	Feb 4, 2024	Offline RLreinforcement-learning	—Unverified
DiffStitch: Boosting Offline Reinforcement Learning with Diffusion-based Trajectory Stitching	Feb 4, 2024	D4RLData Augmentation	—Unverified
Adaptive Q-Aid for Conditional Supervised Learning in Offline Reinforcement Learning	Feb 3, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Context-Former: Stitching via Latent Conditioned Sequence Modeling	Jan 29, 2024	D4RLDecision Making	—Unverified
Multi-Object Navigation in real environments using hybrid policies	Jan 24, 2024	Imitation LearningObject	—Unverified
MoMA: Model-based Mirror Ascent for Offline Reinforcement Learning	Jan 21, 2024	Decision MakingOffline RL	—Unverified
Solving Offline Reinforcement Learning with Decision Tree Regression	Jan 21, 2024	D4RLFeature Importance	CodeCode Available
Harnessing Density Ratios for Online Reinforcement Learning	Jan 18, 2024	Offline RLreinforcement-learning	—Unverified
DiffClone: Enhanced Behaviour Cloning in Robotics with Diffusion-Driven Policy Learning	Jan 17, 2024	Offline RLRobot Manipulation	CodeCode Available
Learning from Sparse Offline Datasets via Conservative Density Estimation	Jan 16, 2024	D4RLDensity Estimation	CodeCode Available
Solving Continual Offline Reinforcement Learning with Decision Transformer	Jan 16, 2024	Offline RLreinforcement-learning	—Unverified
Optimistic Model Rollouts for Pessimistic Offline Policy Optimization	Jan 11, 2024	modelOffline RL	—Unverified
On Sample-Efficient Offline Reinforcement Learning: Data Diversity, Posterior Sampling, and Beyond	Jan 6, 2024	Decision MakingDiversity	—Unverified
MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning	Jan 6, 2024	Offline RLRobot Manipulation	—Unverified
SPQR: Controlling Q-ensemble Independence with Spiked Random Model for Reinforcement Learning	Jan 6, 2024	Deep Reinforcement LearningDiversity	CodeCode Available
Policy-regularized Offline Multi-objective Reinforcement Learning	Jan 4, 2024	Multi-Objective Reinforcement LearningOffline RL	CodeCode Available
POCE: Primal Policy Optimization with Conservative Estimation for Multi-constraint Offline Reinforcement Learning	Jan 1, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available
Adversarially Trained Weighted Actor-Critic for Safe Offline Reinforcement Learning	Jan 1, 2024	continuous-controlContinuous Control	—Unverified
Neural Network Approximation for Pessimistic Offline Reinforcement Learning	Dec 19, 2023	Deep Reinforcement LearningOffline RL	—Unverified
CUDC: A Curiosity-Driven Unsupervised Data Collection Method with Adaptive Temporal Distances for Offline Reinforcement Learning	Dec 19, 2023	NavigateOffline RL	—Unverified
Advancing RAN Slicing with Offline Reinforcement Learning	Dec 16, 2023	ManagementOffline RL	—Unverified
A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning	Dec 12, 2023	MuJoCoOffline RL	—Unverified
Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization	Dec 7, 2023	Model-based Reinforcement LearningOffline RL	—Unverified
MICRO: Model-Based Offline Reinforcement Learning with a Conservative Bellman Operator	Dec 7, 2023	Offline RLreinforcement-learning	CodeCode Available
Diffused Task-Agnostic Milestone Planner	Dec 6, 2023	Decision MakingOffline RL	—Unverified
Evaluation of Active Feature Acquisition Methods for Static Feature Settings	Dec 6, 2023	Offline RLreinforcement-learning	—Unverified
H-GAP: Humanoid Control with a Generalist Planner	Dec 5, 2023	Humanoid ControlModel Predictive Control	—Unverified
Is Inverse Reinforcement Learning Harder than Standard Reinforcement Learning? A Theoretical Perspective	Nov 29, 2023	Offline RLreinforcement-learning	—Unverified
Self-Driving Telescopes: Autonomous Scheduling of Astronomical Observation Campaigns with Offline Reinforcement Learning	Nov 29, 2023	AstronomyOffline RL	—Unverified
A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning	Nov 27, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Offline Reinforcement Learning for Wireless Network Optimization with Mixture Datasets	Nov 19, 2023	ManagementOffline RL	—Unverified
Offline Data Enhanced On-Policy Policy Gradient with Provable Guarantees	Nov 14, 2023	Offline RL	CodeCode Available
Rethinking Decision Transformer via Hierarchical Reinforcement Learning	Nov 1, 2023	Decision MakingHierarchical Reinforcement Learning	—Unverified
Offline RL with Observation Histories: Analyzing and Improving Sample Complexity	Oct 31, 2023	Autonomous NavigationOffline RL	—Unverified
Safety-aware Causal Representation for Trustworthy Offline Reinforcement Learning in Autonomous Driving	Oct 31, 2023	Autonomous DrivingAutonomous Vehicles	—Unverified
A Tractable Inference Perspective of Offline RL	Oct 31, 2023	MuJoCoOffline RL	—Unverified
Robust Offline Reinforcement learning with Heavy-Tailed Rewards	Oct 28, 2023	Offline RLOff-policy evaluation	CodeCode Available
Bridging Distributionally Robust Learning and Offline RL: An Approach to Mitigate Distribution Shift and Partial Data Coverage	Oct 27, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available
Guided Data Augmentation for Offline Reinforcement Learning and Imitation Learning	Oct 27, 2023	Autonomous DrivingD4RL	—Unverified
Model-enhanced Contrastive Reinforcement Learning for Sequential Recommendation	Oct 25, 2023	Contrastive Learningmodel	—Unverified
Finetuning Offline World Models in the Real World	Oct 24, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Corruption-Robust Offline Reinforcement Learning with General Function Approximation	Oct 23, 2023	Offline RLreinforcement-learning	CodeCode Available
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning	Oct 18, 2023	Offline RLQuantization	—Unverified
Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning	Oct 16, 2023	ChatbotOffline RL	CodeCode Available
End-to-end Offline Reinforcement Learning for Glycemia Control	Oct 16, 2023	Offline RLreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 9 of 16Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified