Offline RL

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 526–550 of 755 papers

Title	Date	Tasks	Status
Minimax-Optimal Reward-Agnostic Exploration in Reinforcement Learning	Apr 14, 2023	Offline RLreinforcement-learning	—Unverified
Uncertainty-driven Trajectory Truncation for Data Augmentation in Offline Reinforcement Learning	Apr 10, 2023	D4RLData Augmentation	CodeCode Available
Unified Emulation-Simulation Training Environment for Autonomous Cyber Agents	Apr 3, 2023	Deep Reinforcement LearningOffline RL	—Unverified
Enabling A Network AI Gym for Autonomous Cyber Agents	Apr 3, 2023	Deep Reinforcement LearningOffline RL	—Unverified
Understanding Reinforcement Learning Algorithms: The Progress from Basic Q-learning to Proximal Policy Optimization	Mar 31, 2023	Offline RLQ-Learning	—Unverified
MAHALO: Unifying Offline Reinforcement Learning and Imitation Learning from Observations	Mar 30, 2023	Decision MakingImitation Learning	CodeCode Available
Finetuning from Offline Reinforcement Learning: Challenges, Trade-offs and Practical Solutions	Mar 30, 2023	DiversityOffline RL	—Unverified
Deep RL with Hierarchical Action Exploration for Dialogue Generation	Mar 22, 2023	Dialogue GenerationOffline RL	—Unverified
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning	Mar 14, 2023	continuous-controlContinuous Control	—Unverified
Deploying Offline Reinforcement Learning with Human Feedback	Mar 13, 2023	Decision MakingModel Selection	—Unverified
Graph Decision Transformer	Mar 7, 2023	Offline RLOpenAI Gym	—Unverified
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified
On the Sample Complexity of Vanilla Model-Based Offline Reinforcement Learning with Dependent Samples	Mar 7, 2023	Offline RLOff-policy evaluation	—Unverified
Learning to Influence Human Behavior with Offline Reinforcement Learning	Mar 3, 2023	Autonomous DrivingOffline RL	—Unverified
Decision Transformer under Random Frame Dropping	Mar 3, 2023	Deep Reinforcement LearningMuJoCo	CodeCode Available
Learning to Control Autonomous Fleets from Observation via Offline Reinforcement Learning	Feb 28, 2023	Offline RLreinforcement-learning	CodeCode Available
The Provable Benefits of Unsupervised Data Sharing for Offline Reinforcement Learning	Feb 27, 2023	Offline RLreinforcement-learning	—Unverified
Gauss-Newton Temporal Difference Learning with Nonlinear Function Approximation	Feb 25, 2023	Offline RLQ-Learning	—Unverified
VIPeR: Provably Efficient Algorithm for Offline RL with Neural Function Approximation	Feb 24, 2023	Computational EfficiencyOffline RL	CodeCode Available
Deep Offline Reinforcement Learning for Real-world Treatment Optimization Applications	Feb 15, 2023	Decision MakingManagement	—Unverified
Language Decision Transformers with Exponential Tilt for Interactive Text Environments	Feb 10, 2023	Offline RL	—Unverified
A Strong Baseline for Batch Imitation Learning	Feb 6, 2023	continuous-controlContinuous Control	—Unverified
Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage	Feb 5, 2023	Offline RLQ-Learning	—Unverified
Selective Uncertainty Propagation in Offline RL	Feb 1, 2023	Offline RLreinforcement-learning	—Unverified
Revisiting Bellman Errors for Offline Model Selection	Jan 31, 2023	Atari Gamesmodel	CodeCode Available

Show:10 25 50

← PrevPage 22 of 31Next →

All datasets D4RL Walker2d

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	KFC	Average Reward	81.8	—	Unverified
2	ADMPO	Average Reward	81	—	Unverified
3	Decision Transformer (DT)	Average Reward	73.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ParPI	D4RL Normalized Score	151.4	—	Unverified