SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 281–290 of 755 papers

Title	Date	Tasks	Status	Hype
PROGRESSOR: A Perceptually Guided Reward Estimator with Self-Supervised Online Refinement	Nov 26, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0
Continual Task Learning through Adaptive Policy Self-Composition	Nov 18, 2024	Continual LearningOffline RL	CodeCode Available	0
Preserving Expert-Level Privacy in Offline Reinforcement Learning	Nov 18, 2024	Offline RLreinforcement-learning	—Unverified	0
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified	0
Streetwise Agents: Empowering Offline RL Policies to Outsmart Exogenous Stochastic Disturbances in RTC	Nov 11, 2024	Offline RL	—Unverified	0
OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control	Nov 10, 2024	Multi-agent Reinforcement LearningOffline RL	—Unverified	0
Real-World Offline Reinforcement Learning from Vision Language Model Feedback	Nov 8, 2024	Language ModelingLanguage Modelling	—Unverified	0
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified	0
Uncertainty-based Offline Variational Bayesian Reinforcement Learning for Robustness under Diverse Data Corruptions	Nov 1, 2024	Bayesian InferenceOffline RL	CodeCode Available	0
NetworkGym: Reinforcement Learning Environments for Multi-Access Traffic Management in Network Simulation	Oct 30, 2024	D4RLManagement	CodeCode Available	0

Show:10 25 50

← PrevPage 29 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified