SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 161–170 of 265 papers

Title	Date	Tasks	Status	Hype
Online Learning for Recommendations at Grubhub	Jul 15, 2021	Incremental LearningOff-policy evaluation	—Unverified	0
A Unified Off-Policy Evaluation Approach for General Value Function	Jul 6, 2021	Anomaly DetectionOff-policy evaluation	—Unverified	0
Supervised Off-Policy Ranking	Jul 3, 2021	Off-policy evaluation	CodeCode Available	0
Unifying Gradient Estimators for Meta-Reinforcement Learning via Off-Policy Evaluation	Jun 24, 2021	Meta Reinforcement LearningOff-policy evaluation	CodeCode Available	1
Variance-Aware Off-Policy Evaluation with Linear Function Approximation	Jun 22, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Active Offline Policy Selection	Jun 18, 2021	Bayesian OptimizationOff-policy evaluation	CodeCode Available	1
Offline RL Without Off-Policy Evaluation	Jun 16, 2021	D4RLOffline RL	CodeCode Available	1
Control Variates for Slate Off-Policy Evaluation	Jun 15, 2021	Off-policy evaluationRecommendation Systems	CodeCode Available	0
A Deep Reinforcement Learning Approach to Marginalized Importance Sampling with the Successor Representation	Jun 12, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Robust Generalization despite Distribution Shift via Minimum Discriminating Information	Jun 8, 2021	Generalization BoundsOff-policy evaluation	CodeCode Available	0

Show:10 25 50

← PrevPage 17 of 27Next →

No leaderboard results yet.