SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 131–140 of 265 papers

Title	Date	Tasks	Status
Optimal Mixture Weights for Off-Policy Evaluation with Multiple Behavior Policies	Nov 29, 2020	Off-policy evaluationRecommendation Systems	—Unverified
Towards Optimal Off-Policy Evaluation for Reinforcement Learning with Marginalized Importance Sampling	Jun 8, 2019	Off-policy evaluationreinforcement-learning	—Unverified
Practical Marginalized Importance Sampling with the Successor Representation	Jan 1, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Primal-Dual Spectral Representation for Off-policy Evaluation	Oct 23, 2024	Off-policy evaluationReinforcement Learning (RL)	—Unverified
Privacy Preserving Off-Policy Evaluation	Feb 1, 2019	Off-policy evaluationPrivacy Preserving	—Unverified
Probabilistic Offline Policy Ranking with Approximate Bayesian Computation	Dec 17, 2023	Off-policy evaluation	—Unverified
Quantile Off-Policy Evaluation via Deep Conditional Generative Learning	Dec 29, 2022	Decision MakingOff-policy evaluation	—Unverified
Reliable Off-policy Evaluation for Reinforcement Learning	Nov 8, 2020	Decision MakingOff-policy evaluation	—Unverified
RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation	Jun 3, 2024	LEMMAOff-policy evaluation	—Unverified
Debiased Off-Policy Evaluation for Recommendation Systems	Feb 20, 2020	counterfactualOff-policy evaluation	—Unverified

Show:10 25 50

← PrevPage 14 of 27Next →

No leaderboard results yet.