SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 131–140 of 265 papers

Title	Date	Tasks	Status
Understanding the Curse of Horizon in Off-Policy Evaluation via Conditional Importance Sampling	Oct 15, 2019	Off-policy evaluationReinforcement Learning	—Unverified
Variance-Aware Off-Policy Evaluation with Linear Function Approximation	Jun 22, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified
Wasserstein Distributionally Robust Policy Evaluation and Learning for Contextual Bandits	Sep 15, 2023	Multi-Armed BanditsOff-policy evaluation	—Unverified
Weighted model estimation for offline model-based reinforcement learning	Dec 1, 2021	Density Ratio Estimationmodel	—Unverified
Why Should I Trust You, Bellman? Evaluating the Bellman Objective with Off-Policy Data	Sep 29, 2021	Deep Reinforcement LearningOff-policy evaluation	—Unverified
Data-Driven Off-Policy Estimator Selection: An Application in User Marketing on An Online Content Delivery Service	Sep 17, 2021	Decision MakingMarketing	—Unverified
Data Poisoning Attacks on Off-Policy Policy Evaluation Methods	Apr 6, 2024	Data PoisoningOff-policy evaluation	—Unverified
Debiasing Samples from Online Learning Using Bootstrap	Jul 31, 2021	Off-policy evaluationThompson Sampling	—Unverified
Deep Jump Q-Evaluation for Offline Policy Evaluation in Continuous Action Space	Sep 28, 2020	Off-policy evaluationQ-Learning	—Unverified
Defining Admissible Rewards for High Confidence Policy Evaluation	May 30, 2019	Off-policy evaluationReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 14 of 27Next →

No leaderboard results yet.