D4RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 226 papers

Title	Date	Tasks	Status
Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL	Sep 8, 2022	D4RLOffline RL	—Unverified
Quantile Filtered Imitation Learning	Dec 2, 2021	D4RLImitation Learning	—Unverified
Q-value Regularized Decision ConvFormer for Offline Reinforcement Learning	Sep 12, 2024	D4RLOffline RL	—Unverified
Reducing Conservativeness Oriented Offline Reinforcement Learning	Feb 27, 2021	D4RLreinforcement-learning	—Unverified
Regularized Conditional Diffusion Model for Multi-Task Preference Alignment	Apr 7, 2024	D4RLDecision Making	—Unverified
Rethinking Optimal Transport in Offline Reinforcement Learning	Oct 17, 2024	continuous-controlContinuous Control	—Unverified
Return Augmented Decision Transformer for Off-Dynamics Reinforcement Learning	Oct 30, 2024	D4RLreinforcement-learning	—Unverified
Reward-Consistent Dynamics Models are Strongly Generalizable for Offline Reinforcement Learning	Oct 9, 2023	D4RLModel-based Reinforcement Learning	—Unverified
RGMDT: Return-Gap-Minimizing Decision Tree Extraction in Non-Euclidean Metric Space	Oct 21, 2024	ClusteringD4RL	—Unverified
Robust Offline Reinforcement Learning with Gradient Penalty and Constraint Relaxation	Oct 19, 2022	D4RLMuJoCo	—Unverified
S4RL: Surprisingly Simple Self-Supervision for Offline Reinforcement Learning	Mar 10, 2021	Autonomous DrivingD4RL	—Unverified
SALE-Based Offline Reinforcement Learning with Ensemble Q-Networks	Jan 7, 2025	D4RLDiversity	—Unverified
SAMG: State-Action-Aware Offline-to-Online Reinforcement Learning with Offline Model Guidance	Oct 24, 2024	D4RLreinforcement-learning	—Unverified
Semi-supervised Offline Reinforcement Learning with Pre-trained Decision Transformers	Sep 29, 2021	D4RLOffline RL	—Unverified
SeMOPO: Learning High-quality Model and Policy from Low-quality Offline Visual Datasets	Jun 13, 2024	D4RLOffline RL	—Unverified
Simple Ingredients for Offline Reinforcement Learning	Mar 19, 2024	D4RLreinforcement-learning	—Unverified
SR-Reward: Taking The Path More Traveled	Jan 4, 2025	D4RLImitation Learning	—Unverified
State-Action Joint Regularized Implicit Policy for Offline Reinforcement Learning	Sep 29, 2021	D4RLreinforcement-learning	—Unverified
State Advantage Weighting for Offline RL	Oct 9, 2022	D4RLOffline RL	—Unverified
State-Constrained Offline Reinforcement Learning	May 23, 2024	D4RLreinforcement-learning	—Unverified
Statistically Efficient Variance Reduction with Double Policy Estimation for Off-Policy Evaluation in Sequence-Modeled Reinforcement Learning	Aug 28, 2023	D4RLOff-policy evaluation	—Unverified
STITCH-OPE: Trajectory Stitching with Guided Diffusion for Off-Policy Evaluation	May 27, 2025	D4RLDenoising	—Unverified
SUMO: Search-Based Uncertainty Estimation for Model-Based Offline Reinforcement Learning	Aug 23, 2024	D4RLOffline RL	—Unverified
Model-based Offline Reinforcement Learning with Lower Expectile Q-Learning	Jun 30, 2024	D4RLOffline RL	—Unverified
Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach	May 8, 2025	D4RLDecision Making	—Unverified
Task-agnostic Decision Transformer for Multi-type Agent Control with Federated Split Training	May 22, 2024	AI AgentAutonomous Driving	—Unverified
Temporal Distance-aware Transition Augmentation for Offline Model-based Reinforcement Learning	May 19, 2025	D4RLModel-based Reinforcement Learning	—Unverified
Towards Robust Policy: Enhancing Offline Reinforcement Learning with Adversarial Attacks and Defenses	May 18, 2024	D4RLOffline RL	—Unverified
UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning	Jun 5, 2024	D4RLOffline RL	—Unverified
Uncertainty Regularized Policy Learning for Offline Reinforcement Learning	Sep 29, 2021	D4RLOffline RL	—Unverified
VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning	Apr 16, 2025	D4RLOffline RL	—Unverified
Why so pessimistic? Estimating uncertainties for offline RL through ensembles, and why their independence matters.	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Why So Pessimistic? Estimating Uncertainties for Offline RL through Ensembles, and Why Their Independence Matters	May 27, 2022	D4RLOffline RL	—Unverified
Offline Trajectory Generalization for Offline Reinforcement Learning	Apr 16, 2024	D4RLData Augmentation	—Unverified
On the Role of Discount Factor in Offline Reinforcement Learning	Jun 7, 2022	D4RLOffline RL	—Unverified
Binary Reward Labeling: Bridging Offline Preference and Reward-Based Reinforcement Learning	Jun 14, 2024	D4RLOffline RL	—Unverified
Pareto Policy Pool for Model-based Offline Reinforcement Learning	Sep 29, 2021	D4RLOffline RL	—Unverified
Planning Transformer: Long-Horizon Offline Reinforcement Learning with Planning Tokens	Sep 14, 2024	D4RLreinforcement-learning	—Unverified
Offline Behavior Distillation	Oct 30, 2024	D4RLReinforcement Learning (RL)	CodeCode Available
NetworkGym: Reinforcement Learning Environments for Multi-Access Traffic Management in Network Simulation	Oct 30, 2024	D4RLManagement	CodeCode Available
Mutual Information Regularized Offline Reinforcement Learning	Oct 14, 2022	D4RLOffline RL	CodeCode Available
Offline RL With Resource Constrained Online Deployment	Oct 7, 2021	D4RLOffline RL	CodeCode Available
Offline RL with Smooth OOD Generalization in Convex Hull and its Neighborhood	Jun 10, 2025	Computational EfficiencyD4RL	CodeCode Available
Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning	Oct 15, 2024	D4RLModel-based Reinforcement Learning	CodeCode Available
Model-based Offline Reinforcement Learning with Count-based Conservatism	Jul 21, 2023	D4RLOffline RL	CodeCode Available
Conservative Bayesian Model-Based Value Expansion for Offline Policy Optimization	Oct 7, 2022	continuous-controlContinuous Control	CodeCode Available
Compositional Conservatism: A Transductive Approach in Offline Reinforcement Learning	Apr 6, 2024	D4RLOffline RL	CodeCode Available
Model-Based Offline Reinforcement Learning with Pessimism-Modulated Dynamics Belief	Oct 13, 2022	D4RLOffline RL	CodeCode Available
Conservative State Value Estimation for Offline Reinforcement Learning	Feb 14, 2023	D4RLreinforcement-learning	CodeCode Available
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning	Jun 6, 2023	D4RLMuJoCo	CodeCode Available

Show:10 25 50

← PrevPage 4 of 5Next →

No leaderboard results yet.