SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 755 papers

Title	Date	Tasks	Status	Hype
Doubly Mild Generalization for Offline Reinforcement Learning	Nov 12, 2024	MuJoCoOffline RL	CodeCode Available	1
Streetwise Agents: Empowering Offline RL Policies to Outsmart Exogenous Stochastic Disturbances in RTC	Nov 11, 2024	Offline RL	—Unverified	0
OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control	Nov 10, 2024	Multi-agent Reinforcement LearningOffline RL	—Unverified	0
Real-World Offline Reinforcement Learning from Vision Language Model Feedback	Nov 8, 2024	Language ModelingLanguage Modelling	—Unverified	0
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified	0
Uncertainty-based Offline Variational Bayesian Reinforcement Learning for Robustness under Diverse Data Corruptions	Nov 1, 2024	Bayesian InferenceOffline RL	CodeCode Available	0
NetworkGym: Reinforcement Learning Environments for Multi-Access Traffic Management in Network Simulation	Oct 30, 2024	D4RLManagement	CodeCode Available	0
Offline Reinforcement Learning and Sequence Modeling for Downlink Link Adaptation	Oct 30, 2024	Offline RLQ-Learning	—Unverified	0
LongReward: Improving Long-context Large Language Models with AI Feedback	Oct 28, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	2
Offline Reinforcement Learning with OOD State Correction and OOD Action Suppression	Oct 25, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 11 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified