SOTAVerified|Agents Browse Leaderboard About

Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 211–220 of 755 papers

Title	Date	Tasks	Status	Hype
Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning	Jun 26, 2025	Action GenerationDecision Making	—Unverified	0
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning	Jul 19, 2021	Offline RLQ-Learning	—Unverified	0
Align Your Intents: Offline Imitation Learning via Optimal Transport	Feb 20, 2024	D4RLDecision Making	—Unverified	0
Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning	Jun 1, 2023	FairnessOffline RL	—Unverified	0
Conservative Data Sharing for Multi-Task Offline Reinforcement Learning	Sep 16, 2021	Offline RLreinforcement-learning	—Unverified	0
Batch-Constrained Distributional Reinforcement Learning for Session-based Recommendation	Dec 16, 2020	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
Finetuning from Offline Reinforcement Learning: Challenges, Trade-offs and Practical Solutions	Mar 30, 2023	DiversityOffline RL	—Unverified	0
Confidence-Conditioned Value Functions for Offline Reinforcement Learning	Dec 8, 2022	Offline RLreinforcement-learning	—Unverified	0
Enhancing Pre-Trained Decision Transformers with Prompt-Tuning Bandits	Feb 7, 2025	InformativenessOffline RL	—Unverified	0
A Validation Tool for Designing Reinforcement Learning Environments	Dec 10, 2021	Offline RLreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 22 of 76Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified