Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 265 papers

Title	Date	Tasks	Status	Hype
Off-Policy Evaluation in Partially Observed Markov Decision Processes under Sequential Ignorability	Oct 24, 2021	Off-policy evaluation	—Unverified	0
Stateful Offline Contextual Policy Evaluation and Learning	Oct 19, 2021	ManagementMulti-Armed Bandits	—Unverified	0
Why Should I Trust You, Bellman? Evaluating the Bellman Objective with Off-Policy Data	Sep 29, 2021	Deep Reinforcement LearningOff-policy evaluation	—Unverified	0
A Spectral Approach to Off-Policy Evaluation for POMDPs	Sep 22, 2021	Causal IdentificationOff-policy evaluation	—Unverified	0
Data-Driven Off-Policy Estimator Selection: An Application in User Marketing on An Online Content Delivery Service	Sep 17, 2021	Decision MakingMarketing	—Unverified	0
Accelerating Offline Reinforcement Learning Application in Real-Time Bidding and Recommendation: Potential Use of Simulation	Sep 17, 2021	Decision MakingOffline RL	—Unverified	0
State Relevance for Off-Policy Evaluation	Sep 13, 2021	Off-policy evaluation	CodeCode Available	0
Evaluating the Robustness of Off-Policy Evaluation	Aug 31, 2021	Off-policy evaluationRecommendation Systems	CodeCode Available	1
Debiasing Samples from Online Learning Using Bootstrap	Jul 31, 2021	Off-policy evaluationThompson Sampling	—Unverified	0
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings	Jul 23, 2021	Computational EfficiencyDecision Making	CodeCode Available	1
Online Learning for Recommendations at Grubhub	Jul 15, 2021	Incremental LearningOff-policy evaluation	—Unverified	0
A Unified Off-Policy Evaluation Approach for General Value Function	Jul 6, 2021	Anomaly DetectionOff-policy evaluation	—Unverified	0
Supervised Off-Policy Ranking	Jul 3, 2021	Off-policy evaluation	CodeCode Available	0
Unifying Gradient Estimators for Meta-Reinforcement Learning via Off-Policy Evaluation	Jun 24, 2021	Meta Reinforcement LearningOff-policy evaluation	CodeCode Available	1
Variance-Aware Off-Policy Evaluation with Linear Function Approximation	Jun 22, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Active Offline Policy Selection	Jun 18, 2021	Bayesian OptimizationOff-policy evaluation	CodeCode Available	1
Offline RL Without Off-Policy Evaluation	Jun 16, 2021	D4RLOffline RL	CodeCode Available	1
Control Variates for Slate Off-Policy Evaluation	Jun 15, 2021	Off-policy evaluationRecommendation Systems	CodeCode Available	0
A Deep Reinforcement Learning Approach to Marginalized Importance Sampling with the Successor Representation	Jun 12, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Robust Generalization despite Distribution Shift via Minimum Discriminating Information	Jun 8, 2021	Generalization BoundsOff-policy evaluation	CodeCode Available	0
Deep Proxy Causal Learning and its Application to Confounded Bandit Policy Evaluation	Jun 7, 2021	Off-policy evaluation	CodeCode Available	0
Off-Policy Evaluation via Adaptive Weighting with Data from Contextual Bandits	Jun 3, 2021	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	1
Deeply-Debiased Off-Policy Interval Estimation	May 10, 2021	Off-policy evaluation	CodeCode Available	0
Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization	Apr 28, 2021	continuous-controlContinuous Control	—Unverified	0
Universal Off-Policy Evaluation	Apr 26, 2021	counterfactualDecision Making	CodeCode Available	0

Show:10 25 50

← PrevPage 7 of 11Next →

No leaderboard results yet.