Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 755 papers

Title	Date	Tasks	Status	Hype
Doubly Mild Generalization for Offline Reinforcement Learning	Nov 12, 2024	MuJoCoOffline RL	CodeCode Available	1
Streetwise Agents: Empowering Offline RL Policies to Outsmart Exogenous Stochastic Disturbances in RTC	Nov 11, 2024	Offline RL	—Unverified	0
OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control	Nov 10, 2024	Multi-agent Reinforcement LearningOffline RL	—Unverified	0
Real-World Offline Reinforcement Learning from Vision Language Model Feedback	Nov 8, 2024	Language ModelingLanguage Modelling	—Unverified	0
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified	0
Uncertainty-based Offline Variational Bayesian Reinforcement Learning for Robustness under Diverse Data Corruptions	Nov 1, 2024	Bayesian InferenceOffline RL	CodeCode Available	0
NetworkGym: Reinforcement Learning Environments for Multi-Access Traffic Management in Network Simulation	Oct 30, 2024	D4RLManagement	CodeCode Available	0
Offline Reinforcement Learning and Sequence Modeling for Downlink Link Adaptation	Oct 30, 2024	Offline RLQ-Learning	—Unverified	0
LongReward: Improving Long-context Large Language Models with AI Feedback	Oct 28, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	2
Offline Reinforcement Learning with OOD State Correction and OOD Action Suppression	Oct 25, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Learning Versatile Skills with Curriculum Masking	Oct 23, 2024	Decision MakingOffline RL	CodeCode Available	0
Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces	Oct 21, 2024	Continual LearningLifelong learning	—Unverified	0
Offline reinforcement learning for job-shop scheduling problems	Oct 21, 2024	Combinatorial OptimizationDeep Learning	—Unverified	0
Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance	Oct 17, 2024	Offline RLRe-Ranking	CodeCode Available	1
Off-dynamics Conditional Diffusion Planners	Oct 16, 2024	Offline RLReinforcement Learning (RL)	—Unverified	0
Multi-Objective-Optimization Multi-AUV Assisted Data Collection Framework for IoUT Based on Offline Reinforcement Learning	Oct 15, 2024	Collision AvoidanceOffline RL	—Unverified	0
Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning	Oct 15, 2024	D4RLModel-based Reinforcement Learning	CodeCode Available	0
DIAR: Diffusion-model-guided Implicit Q-learning with Adaptive Revaluation	Oct 15, 2024	Decision MakingOffline RL	—Unverified	0
Diffusion-Based Offline RL for Improved Decision-Making in Augmented ARC Task	Oct 15, 2024	ARCDecision Making	—Unverified	0
Integrating Reinforcement Learning and Large Language Models for Crop Production Process Management Optimization and Control through A New Knowledge-Based Deep Learning Paradigm	Oct 13, 2024	ManagementOffline RL	—Unverified	0
Offline Inverse Constrained Reinforcement Learning for Safe-Critical Decision Making in Healthcare	Oct 10, 2024	Common Sense ReasoningData Augmentation	—Unverified	0
The Smart Buildings Control Suite: A Diverse Open Source Benchmark to Evaluate and Scale HVAC Control Policies for Sustainability	Oct 2, 2024	Model Predictive ControlOffline RL	—Unverified	0
ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization	Oct 2, 2024	MuJoCoMulti-agent Reinforcement Learning	—Unverified	0
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining	Oct 1, 2024	Atari Gamesmodel	CodeCode Available	1
DMC-VB: A Benchmark for Representation Learning for Control with Visual Distractors	Sep 26, 2024	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 5 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified