SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 211–220 of 265 papers

Title	Date	Tasks	Status
Efficient Evaluation of Natural Stochastic Policies in Offline Reinforcement Learning	Jun 6, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Causality and Batch Reinforcement Learning: Complementary Approaches To Planning In Unknown Domains	Jun 3, 2020	Autonomous DrivingCausal Inference	—Unverified
Taylor Expansion Policy Optimization	Mar 13, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Batch Stationary Distribution Estimation	Mar 2, 2020	Off-policy evaluation	CodeCode Available
Off-Policy Evaluation and Learning for External Validity under a Covariate Shift	Feb 26, 2020	Off-policy evaluation	CodeCode Available
Minimax-Optimal Off-Policy Evaluation with Linear Function Approximation	Feb 21, 2020	Off-policy evaluationReinforcement Learning	—Unverified
Debiased Off-Policy Evaluation for Recommendation Systems	Feb 20, 2020	counterfactualOff-policy evaluation	—Unverified
Adaptive Estimator Selection for Off-Policy Evaluation	Feb 18, 2020	Multi-Armed BanditsOff-policy evaluation	CodeCode Available
Double/Debiased Machine Learning for Dynamic Treatment Effects via g-Estimation	Feb 17, 2020	BIG-bench Machine LearningModel Selection	—Unverified
Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning	Feb 11, 2020	Off-policy evaluationreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 22 of 27Next →

No leaderboard results yet.