SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 191–200 of 265 papers

Title	Date	Tasks	Status
Off-Policy Evaluation of Slate Policies under Bayes Risk	Jan 5, 2021	Off-policy evaluation	—Unverified
Practical Marginalized Importance Sampling with the Successor Representation	Jan 1, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Optimal Mixture Weights for Off-Policy Evaluation with Multiple Behavior Policies	Nov 29, 2020	Off-policy evaluationRecommendation Systems	—Unverified
Reliable Off-policy Evaluation for Reinforcement Learning	Nov 8, 2020	Decision MakingOff-policy evaluation	—Unverified
Harnessing Distribution Ratio Estimators for Learning Agents with Quality and Diversity	Nov 5, 2020	DiversityOff-policy evaluation	CodeCode Available
Off-Policy Interval Estimation with Lipschitz Value Iteration	Oct 29, 2020	Decision MakingMedical Diagnosis	—Unverified
Deep Jump Learning for Off-Policy Evaluation in Continuous Treatment Settings	Oct 29, 2020	Change Point DetectionOff-policy evaluation	CodeCode Available
A Practical Guide of Off-Policy Evaluation for Bandit Problems	Oct 23, 2020	Off-policy evaluation	—Unverified
Off-Policy Evaluation of Bandit Algorithm from Dependent Samples under Batch Update Policy	Oct 23, 2020	Off-policy evaluation	—Unverified
CoinDICE: Off-Policy Confidence Interval Estimation	Oct 22, 2020	Off-policy evaluationReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 20 of 27Next →

No leaderboard results yet.