SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 161–170 of 265 papers

Title	Date	Tasks	Status
Towards Hyperparameter-free Policy Selection for Offline Reinforcement Learning	Oct 26, 2021	Off-policy evaluationOpen-Ended Question Answering	CodeCode Available
Off-Policy Evaluation in Partially Observed Markov Decision Processes under Sequential Ignorability	Oct 24, 2021	Off-policy evaluation	—Unverified
Stateful Offline Contextual Policy Evaluation and Learning	Oct 19, 2021	ManagementMulti-Armed Bandits	—Unverified
Why Should I Trust You, Bellman? Evaluating the Bellman Objective with Off-Policy Data	Sep 29, 2021	Deep Reinforcement LearningOff-policy evaluation	—Unverified
A Spectral Approach to Off-Policy Evaluation for POMDPs	Sep 22, 2021	Causal IdentificationOff-policy evaluation	—Unverified
Accelerating Offline Reinforcement Learning Application in Real-Time Bidding and Recommendation: Potential Use of Simulation	Sep 17, 2021	Decision MakingOffline RL	—Unverified
Data-Driven Off-Policy Estimator Selection: An Application in User Marketing on An Online Content Delivery Service	Sep 17, 2021	Decision MakingMarketing	—Unverified
State Relevance for Off-Policy Evaluation	Sep 13, 2021	Off-policy evaluation	CodeCode Available
Debiasing Samples from Online Learning Using Bootstrap	Jul 31, 2021	Off-policy evaluationThompson Sampling	—Unverified
Online Learning for Recommendations at Grubhub	Jul 15, 2021	Incremental LearningOff-policy evaluation	—Unverified

Show:10 25 50

← PrevPage 17 of 27Next →

No leaderboard results yet.