D4RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 226 papers

Title	Date	Tasks	Status	Hype
Offline Reinforcement Learning via High-Fidelity Generative Behavior Modeling	Sep 29, 2022	Computational EfficiencyD4RL	CodeCode Available	1
Value Memory Graph: A Graph-Structured World Model for Offline Reinforcement Learning	Jun 9, 2022	D4RLModel-based Reinforcement Learning	CodeCode Available	1
Mildly Conservative Q-Learning for Offline Reinforcement Learning	Jun 9, 2022	D4RLQ-Learning	CodeCode Available	1
When does return-conditioned supervised learning work for offline reinforcement learning?	Jun 2, 2022	D4RLreinforcement-learning	CodeCode Available	1
When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning	May 23, 2022	D4RLOffline RL	CodeCode Available	1
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning	Feb 23, 2022	D4RLOffline RL	CodeCode Available	1
cosFormer: Rethinking Softmax in Attention	Feb 17, 2022	D4RLLanguage Modeling	CodeCode Available	1
Adversarially Trained Actor Critic for Offline Reinforcement Learning	Feb 5, 2022	continuous-controlContinuous Control	CodeCode Available	1
False Correlation Reduction for Offline Reinforcement Learning	Oct 24, 2021	D4RLDecision Making	CodeCode Available	1
Offline Reinforcement Learning with Value-based Episodic Memory	Oct 19, 2021	D4RLOffline RL	CodeCode Available	1
Offline Reinforcement Learning with Implicit Q-Learning	Oct 12, 2021	D4RLOffline RL	CodeCode Available	1
Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble	Oct 4, 2021	Adroid door-clonedAdroid door-human	CodeCode Available	1
Offline Reinforcement Learning with In-sample Q-Learning	Sep 29, 2021	D4RLOffline RL	CodeCode Available	1
Implicit Behavioral Cloning	Sep 1, 2021	D4RL	CodeCode Available	1
Conservative Offline Distributional Reinforcement Learning	Jul 12, 2021	D4RLDistributional Reinforcement Learning	CodeCode Available	1
Offline RL Without Off-Policy Evaluation	Jun 16, 2021	D4RLOffline RL	CodeCode Available	1
Decision Transformer: Reinforcement Learning via Sequence Modeling	Jun 2, 2021	Atari GamesD4RL	CodeCode Available	1
Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention	Jun 29, 2020	D4RLLanguage Modelling	CodeCode Available	1
From Novelty to Imitation: Self-Distilled Rewards for Offline Reinforcement Learning	Jul 17, 2025	D4RLOffline RL	—Unverified	0
Accelerating Residual Reinforcement Learning with Uncertainty Estimation	Jun 21, 2025	D4RLreinforcement-learning	—Unverified	0
CAWR: Corruption-Averse Advantage-Weighted Regression for Robust Policy Optimization	Jun 18, 2025	D4RLOffline RL	CodeCode Available	0
MOORL: A Framework for Integrating Offline-Online Reinforcement Learning	Jun 11, 2025	D4RLDeep Reinforcement Learning	—Unverified	0
Policy-Based Trajectory Clustering in Offline Reinforcement Learning	Jun 10, 2025	ClusteringD4RL	—Unverified	0
Offline RL with Smooth OOD Generalization in Convex Hull and its Neighborhood	Jun 10, 2025	Computational EfficiencyD4RL	CodeCode Available	0
STITCH-OPE: Trajectory Stitching with Guided Diffusion for Off-Policy Evaluation	May 27, 2025	D4RLDenoising	—Unverified	0
Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL	May 26, 2025	D4RLOffline RL	CodeCode Available	0
Temporal Distance-aware Transition Augmentation for Offline Model-based Reinforcement Learning	May 19, 2025	D4RLModel-based Reinforcement Learning	—Unverified	0
Policy-Driven World Model Adaptation for Robust Offline Model-based Reinforcement Learning	May 19, 2025	D4RLmodel	—Unverified	0
Imagination-Limited Q-Learning for Offline Reinforcement Learning	May 18, 2025	D4RLQ-Learning	—Unverified	0
Beyond the Known: Decision Making with Counterfactual Reasoning Decision Transformer	May 14, 2025	counterfactualCounterfactual Reasoning	CodeCode Available	0
Pretraining a Shared Q-Network for Data-Efficient Offline Reinforcement Learning	May 9, 2025	D4RLOffline RL	—Unverified	0
Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach	May 8, 2025	D4RLDecision Making	—Unverified	0
Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning	May 3, 2025	D4RLOffline RL	—Unverified	0
Directly Forecasting Belief for Reinforcement Learning with Delays	May 1, 2025	D4RLMuJoCo	CodeCode Available	0
An Optimal Discriminator Weighted Imitation Perspective for Reinforcement Learning	Apr 17, 2025	D4RLreinforcement-learning	—Unverified	0
VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning	Apr 16, 2025	D4RLOffline RL	—Unverified	0
Decision SpikeFormer: Spike-Driven Transformer for Decision Making	Apr 4, 2025	D4RLDecision Making	—Unverified	0
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation	Mar 26, 2025	D4RLData Augmentation	—Unverified	0
Diverse Transformer Decoding for Offline Reinforcement Learning Using Financial Algorithmic Approaches	Feb 13, 2025	D4RLOffline RL	—Unverified	0
Behavior-Regularized Diffusion Policy Optimization for Offline Reinforcement Learning	Feb 7, 2025	continuous-controlContinuous Control	—Unverified	0
Learning from Suboptimal Data in Continuous Control via Auto-Regressive Soft Q-Network	Feb 1, 2025	continuous-controlContinuous Control	—Unverified	0
Projection Implicit Q-Learning with Support Constraint for Offline Reinforcement Learning	Jan 15, 2025	D4RLQ-Learning	—Unverified	0
DRDT3: Diffusion-Refined Decision Test-Time Training Model	Jan 12, 2025	D4RLOffline RL	—Unverified	0
SALE-Based Offline Reinforcement Learning with Ensemble Q-Networks	Jan 7, 2025	D4RLDiversity	—Unverified	0
SR-Reward: Taking The Path More Traveled	Jan 4, 2025	D4RLImitation Learning	—Unverified	0
Goal-Conditioned Data Augmentation for Offline Reinforcement Learning	Dec 29, 2024	D4RLData Augmentation	—Unverified	0
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning	Dec 22, 2024	D4RLQ-Learning	—Unverified	0
Finer Behavioral Foundation Models via Auto-Regressive Features and Advantage Weighting	Dec 5, 2024	D4RLOffline RL	—Unverified	0
Learning on One Mode: Addressing Multi-Modality in Offline Reinforcement Learning	Dec 4, 2024	D4RLImitation Learning	CodeCode Available	0
Enhancing Decision Transformer with Diffusion-Based Trajectory Branch Generation	Nov 18, 2024	D4RLReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 2 of 5Next →

No leaderboard results yet.