Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 755 papers

Title	Date	Tasks	Status	Hype
OffRIPP: Offline RL-based Informative Path Planning	Sep 25, 2024	Offline RLreinforcement-learning	—Unverified	0
Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm	Sep 24, 2024	Offline RLOff-policy evaluation	—Unverified	0
KAN v.s. MLP for Offline Reinforcement Learning	Sep 15, 2024	D4RLKolmogorov-Arnold Networks	—Unverified	0
Q-value Regularized Decision ConvFormer for Offline Reinforcement Learning	Sep 12, 2024	D4RLOffline RL	—Unverified	0
Enhancing Cross-domain Pre-Trained Decision Transformers with Adaptive Attention	Sep 11, 2024	Offline RL	—Unverified	0
The Role of Deep Learning Regularizations on Actors in Offline RL	Sep 11, 2024	D4RLOffline RL	CodeCode Available	0
Tractable Offline Learning of Regular Decision Processes	Sep 4, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0
Enhancing Sample Efficiency and Exploration in Reinforcement Learning through the Integration of Diffusion Models and Proximal Policy Optimization	Sep 2, 2024	DiversityOffline RL	CodeCode Available	2
Skills Regularized Task Decomposition for Multi-task Offline Reinforcement Learning	Aug 28, 2024	Drone navigationOffline RL	—Unverified	0
Optimization Solution Functions as Deterministic Policies for Offline Reinforcement Learning	Aug 27, 2024	Offline RLreinforcement-learning	—Unverified	0
Unsupervised-to-Online Reinforcement Learning	Aug 27, 2024	Offline RLreinforcement-learning	—Unverified	0
SUMO: Search-Based Uncertainty Estimation for Model-Based Offline Reinforcement Learning	Aug 23, 2024	D4RLOffline RL	—Unverified	0
Leveraging Unlabeled Data Sharing through Kernel Function Approximation in Offline Reinforcement Learning	Aug 22, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	0
Domain Adaptation for Offline Reinforcement Learning with Limited Samples	Aug 22, 2024	Domain AdaptationOffline RL	—Unverified	0
Preference-Guided Reflective Sampling for Aligning Language Models	Aug 22, 2024	Document SummarizationInstruction Following	CodeCode Available	0
Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks	Aug 20, 2024	Multi-agent Reinforcement LearningMulti-Task Learning	CodeCode Available	2
Offline Model-Based Reinforcement Learning with Anti-Exploration	Aug 20, 2024	D4RLmodel	—Unverified	0
Integrating Multi-Modal Input Token Mixer Into Mamba-Based Decision Models: Decision MetaMamba	Aug 20, 2024	MambaOffline RL	—Unverified	0
Enhancing Reinforcement Learning Through Guided Search	Aug 19, 2024	Offline RLreinforcement-learning	—Unverified	0
Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds	Aug 16, 2024	Model-based Reinforcement LearningOffline RL	—Unverified	0
D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning	Aug 15, 2024	Deep Reinforcement LearningOffline RL	—Unverified	0
Experimental evaluation of offline reinforcement learning for HVAC control in buildings	Aug 15, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	0
Hybrid Reinforcement Learning Breaks Sample Size Barriers in Linear MDPs	Aug 8, 2024	Offline RLreinforcement-learning	—Unverified	0
Consistent time travel for realistic interactions with historical data: reinforcement learning for market making	Aug 5, 2024	Offline RL	—Unverified	0
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning	Jul 29, 2024	Offline RLreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 6 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified