D4RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 226 papers

Title	Date	Tasks	Status	Hype
DiffuserLite: Towards Real-time Diffusion Planning	Jan 27, 2024	D4RLDecision Making	—Unverified	0
Solving Offline Reinforcement Learning with Decision Tree Regression	Jan 21, 2024	D4RLFeature Importance	CodeCode Available	0
Exploration and Anti-Exploration with Distributional Random Network Distillation	Jan 18, 2024	D4RLDeep Reinforcement Learning	CodeCode Available	1
Learning from Sparse Offline Datasets via Conservative Density Estimation	Jan 16, 2024	D4RLDensity Estimation	CodeCode Available	0
Critic-Guided Decision Transformer for Offline Reinforcement Learning	Dec 21, 2023	D4RLOffline RL	CodeCode Available	1
Train Once, Get a Family: State-Adaptive Balances for Offline-to-Online Reinforcement Learning	Oct 27, 2023	D4RLReinforcement Learning (RL)	CodeCode Available	1
Guided Data Augmentation for Offline Reinforcement Learning and Imitation Learning	Oct 27, 2023	Autonomous DrivingD4RL	—Unverified	0
CROP: Conservative Reward for Model-based Offline Policy Optimization	Oct 26, 2023	D4RLOffline RL	CodeCode Available	1
Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias	Oct 12, 2023	D4RLOffline RL	CodeCode Available	1
Score Regularized Policy Optimization through Diffusion Behavior	Oct 11, 2023	D4RL	CodeCode Available	1
DiffCPS: Diffusion Model based Constrained Policy Search for Offline Reinforcement Learning	Oct 9, 2023	D4RLOffline RL	CodeCode Available	0
Reward-Consistent Dynamics Models are Strongly Generalizable for Offline Reinforcement Learning	Oct 9, 2023	D4RLModel-based Reinforcement Learning	—Unverified	0
Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets	Oct 6, 2023	D4RLDecision Making	CodeCode Available	1
Pre-training with Synthetic Data Helps Offline Reinforcement Learning	Oct 1, 2023	D4RLDeep Reinforcement Learning	CodeCode Available	0
DOMAIN: MilDly COnservative Model-BAsed OfflINe Reinforcement Learning	Sep 16, 2023	D4RLmodel	—Unverified	0
Reasoning with Latent Diffusion in Offline Reinforcement Learning	Sep 12, 2023	D4RLOffline RL	CodeCode Available	1
Multi-Objective Decision Transformers for Offline Reinforcement Learning	Aug 31, 2023	D4RLOffline RL	—Unverified	0
Statistically Efficient Variance Reduction with Double Policy Estimation for Off-Policy Evaluation in Sequence-Modeled Reinforcement Learning	Aug 28, 2023	D4RLOff-policy evaluation	—Unverified	0
Learning Computational Efficient Bots with Costly Features	Aug 18, 2023	Computational EfficiencyD4RL	—Unverified	0
Offline Reinforcement Learning with On-Policy Q-Function Regularization	Jul 25, 2023	D4RLreinforcement-learning	—Unverified	0
Model-based Offline Reinforcement Learning with Count-based Conservatism	Jul 21, 2023	D4RLOffline RL	CodeCode Available	0
Offline Diversity Maximization Under Imitation Constraints	Jul 21, 2023	D4RLDiversity	—Unverified	0
Budgeting Counterfactual for Offline RL	Jul 12, 2023	counterfactualCounterfactual Reasoning	—Unverified	0
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning	Jul 10, 2023	continuous-controlContinuous Control	—Unverified	0
Offline Reinforcement Learning with Imbalanced Datasets	Jul 6, 2023	D4RLOffline RL	—Unverified	0
Elastic Decision Transformer	Jul 5, 2023	Atari GamesD4RL	—Unverified	0
Model-Bellman Inconsistency for Model-based Offline Reinforcement Learning	Jul 1, 2023	D4RLmodel	CodeCode Available	1
Prioritized Trajectory Replay: A Replay Memory for Data-driven Reinforcement Learning	Jun 27, 2023	D4RLOffline RL	—Unverified	0
CEIL: Generalized Contextual Imitation Learning	Jun 26, 2023	D4RLImitation Learning	—Unverified	0
Datasets and Benchmarks for Offline Safe Reinforcement Learning	Jun 15, 2023	Autonomous DrivingBenchmarking	CodeCode Available	2
Katakomba: Tools and Benchmarks for Data-Driven NetHack	Jun 14, 2023	D4RLNetHack	CodeCode Available	1
Curricular Subgoals for Inverse Reinforcement Learning	Jun 14, 2023	Autonomous DrivingD4RL	CodeCode Available	1
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning	Jun 13, 2023	D4RLEfficient Exploration	—Unverified	0
HIPODE: Enhancing Offline Reinforcement Learning with High-Quality Synthetic Data from a Policy-Decoupled Approach	Jun 10, 2023	D4RLData Augmentation	—Unverified	0
Iteratively Refined Behavior Regularization for Offline Reinforcement Learning	Jun 9, 2023	D4RLOffline RL	—Unverified	0
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning	Jun 6, 2023	D4RLMuJoCo	CodeCode Available	0
Boosting Offline Reinforcement Learning with Action Preference Query	Jun 6, 2023	Autonomous DrivingD4RL	—Unverified	0
Improving Offline RL by Blending Heuristics	Jun 1, 2023	D4RLOffline RL	—Unverified	0
IQL-TD-MPC: Implicit Q-Learning for Hierarchical Model Predictive Control	Jun 1, 2023	D4RLModel-based Reinforcement Learning	—Unverified	0
Improving and Benchmarking Offline Reinforcement Learning Algorithms	Jun 1, 2023	AttributeBenchmarking	CodeCode Available	1
Efficient Diffusion Policies for Offline Reinforcement Learning	May 31, 2023	D4RLOffline RL	CodeCode Available	1
Primal-Attention: Self-attention through Asymmetric Kernel SVD in Primal Representation	May 31, 2023	D4RLLanguage Modelling	CodeCode Available	1
Emergent Agentic Transformer from Chain of Hindsight Experience	May 26, 2023	D4RLImitation Learning	—Unverified	0
When should we prefer Decision Transformers for Offline Reinforcement Learning?	May 23, 2023	D4RLImitation Learning	CodeCode Available	1
Revisiting the Minimalist Approach to Offline Reinforcement Learning	May 16, 2023	D4RLOffline RL	CodeCode Available	1
Contrastive Energy Prediction for Exact Energy-Guided Diffusion Sampling in Offline Reinforcement Learning	Apr 25, 2023	D4RLImage Generation	CodeCode Available	1
Uncertainty-driven Trajectory Truncation for Data Augmentation in Offline Reinforcement Learning	Apr 10, 2023	D4RLData Augmentation	CodeCode Available	0
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization	Mar 28, 2023	D4RLOffline RL	CodeCode Available	1
Optimal Transport for Offline Imitation Learning	Mar 24, 2023	D4RLDecision Making	CodeCode Available	1
Behavior Proximal Policy Optimization	Feb 22, 2023	D4RLOffline RL	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 5Next →

No leaderboard results yet.