Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 476–500 of 755 papers

Title	Date	Tasks	Status
An Offline Reinforcement Learning Algorithm Customized for Multi-Task Fusion in Large-Scale Recommender Systems	Apr 19, 2024	Efficient ExplorationMulti-Task Learning	—Unverified
A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning	Dec 12, 2023	MuJoCoOffline RL	—Unverified
A Primal-Dual Algorithm for Offline Constrained Reinforcement Learning with Linear MDPs	Feb 7, 2024	Offline RLReinforcement Learning (RL)	—Unverified
ARMOR: A Model-based Framework for Improving Arbitrary Baseline Policies with Offline Data	Nov 8, 2022	Offline RL	—Unverified
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning	Jun 13, 2023	D4RLEfficient Exploration	—Unverified
A Strong Baseline for Batch Imitation Learning	Feb 6, 2023	continuous-controlContinuous Control	—Unverified
A Survey of Zero-shot Generalisation in Deep Reinforcement Learning	Nov 18, 2021	Deep Reinforcement LearningOffline RL	—Unverified
A Survey on Model-based Reinforcement Learning	Jun 19, 2022	Decision Makingmodel	—Unverified
A Fast Convergence Theory for Offline Decision Making	Jun 3, 2024	Decision MakingOffline RL	—Unverified
Augmenting Offline RL with Unlabeled Data	Jun 11, 2024	Offline RLTransfer Learning	—Unverified
Automatic Trade-off Adaptation in Offline RL	Jun 16, 2023	Offline RL	—Unverified
A Validation Tool for Designing Reinforcement Learning Environments	Dec 10, 2021	Offline RLreinforcement-learning	—Unverified
Batch-Constrained Distributional Reinforcement Learning for Session-based Recommendation	Dec 16, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Bayesian Reparameterization of Reward-Conditioned Reinforcement Learning with Energy-based Models	May 18, 2023	MuJoCoOffline RL	—Unverified
BCRLSP: An Offline Reinforcement Learning Framework for Sequential Targeted Promotion	Jul 16, 2022	Offline RLreinforcement-learning	—Unverified
BECAUSE: Bilinear Causal Representation for Generalizable Offline Model-based Reinforcement Learning	Jul 15, 2024	Model-based Reinforcement LearningOffline RL	—Unverified
Behavioral Entropy-Guided Dataset Generation for Offline Reinforcement Learning	Feb 6, 2025	Dataset GenerationMuJoCo	—Unverified
Behavioral Priors and Dynamics Models: Improving Performance and Domain Transfer in Offline RL	Jun 16, 2021	D4RLDomain Generalization	—Unverified
Behavior Regularized Offline Reinforcement Learning	Nov 26, 2019	continuous-controlContinuous Control	—Unverified
Behaviour Discovery and Attribution for Explainable Reinforcement Learning	Mar 19, 2025	Offline RLreinforcement-learning	—Unverified
Bellman Residual Orthogonalization for Offline Reinforcement Learning	Mar 24, 2022	Offline RLOff-policy evaluation	—Unverified
Benchmarking Offline Reinforcement Learning Algorithms for E-Commerce Order Fraud Evaluation	Dec 5, 2022	BenchmarkingBinary Classification	—Unverified
Benchmarks and Algorithms for Offline Preference-Based Reward Learning	Jan 3, 2023	Active LearningOffline RL	—Unverified
Benchmarks for Reinforcement Learning with Biased Offline Data and Imperfect Simulators	Jun 30, 2024	Autonomous VehiclesOffline RL	—Unverified
Bi-Level Offline Policy Optimization with Limited Exploration	Oct 10, 2023	Offline RLReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 20 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified