Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 265 papers

Title	Date	Tasks	Status
Consistent On-Line Off-Policy Evaluation	Feb 23, 2017	Off-policy evaluation	—Unverified
Offline Policy Evaluation and Optimization under Confounding	Nov 29, 2022	Offline RLOff-policy evaluation	—Unverified
Loss Functions for Discrete Contextual Pricing with Observational Data	Nov 18, 2021	ManagementOff-policy evaluation	—Unverified
Generalizing Off-Policy Evaluation From a Causal Perspective For Sequential Decision-Making	Jan 20, 2022	counterfactualDecision Making	—Unverified
A Principled Path to Fitted Distributional Evaluation	Jun 24, 2025	Atari GamesOff-policy evaluation	—Unverified
Off-policy estimation with adaptively collected data: the power of online learning	Nov 19, 2024	Causal InferenceMulti-Armed Bandits	—Unverified
Counterfactual Analysis in Dynamic Latent State Models	May 27, 2022	counterfactualEpidemiology	—Unverified
HOPE: Human-Centric Off-Policy Evaluation for E-Learning and Healthcare	Feb 18, 2023	Off-policy evaluationReinforcement Learning (RL)	—Unverified
Balancing Immediate Revenue and Future Off-Policy Evaluation in Coupon Allocation	Jul 6, 2024	Off-policy evaluation	—Unverified
Hybrid Value Estimation for Off-policy Evaluation and Offline Reinforcement Learning	Jun 4, 2022	MuJoCoOff-policy evaluation	—Unverified
Beyond the Return: Off-policy Function Estimation under User-specified Error-measuring Distributions	Oct 27, 2022	Off-policy evaluation	—Unverified
Hyperparameter Optimization Can Even be Harmful in Off-Policy Learning and How to Deal with It	Apr 23, 2024	counterfactualDecision Making	—Unverified
Logarithmic Neyman Regret for Adaptive Estimation of the Average Treatment Effect	Nov 21, 2024	Causal InferenceOff-policy evaluation	—Unverified
Infinite-Horizon Offline Reinforcement Learning with Linear Function Approximation: Curse of Dimensionality and Algorithm	Mar 17, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified
Interpretable Off-Policy Evaluation in Reinforcement Learning by Highlighting Influential Transitions	Feb 10, 2020	Off-policy evaluationreinforcement-learning	—Unverified
IntOPE: Off-Policy Evaluation in the Presence of Interference	Aug 24, 2024	Off-policy evaluationRecommendation Systems	—Unverified
Bayesian Counterfactual Mean Embeddings and Off-Policy Evaluation	Nov 2, 2022	counterfactualOff-policy evaluation	—Unverified
Off-policy evaluation for learning-to-rank via interpolating the item-position model and the position-based model	Oct 15, 2022	Learning-To-Rankmodel	—Unverified
Marginalized Operators for Off-policy Reinforcement Learning	Mar 30, 2022	Off-policy evaluationreinforcement-learning	—Unverified
Large-scale Validation of Counterfactual Learning Methods: A Test-Bed	Dec 1, 2016	counterfactualOff-policy evaluation	—Unverified
Bayesian Off-Policy Evaluation and Learning for Large Action Spaces	Feb 22, 2024	Computational EfficiencyOff-policy evaluation	—Unverified
Off-Policy Evaluation with Online Adaptation for Robot Exploration in Challenging Environments	Apr 7, 2022	Off-policy evaluation	—Unverified
Deep Jump Q-Evaluation for Offline Policy Evaluation in Continuous Action Space	Sep 28, 2020	Off-policy evaluationQ-Learning	—Unverified
Limit Order Book Simulation and Trade Evaluation with K-Nearest-Neighbor Resampling	Sep 10, 2024	Off-policy evaluation	—Unverified
Debiasing Samples from Online Learning Using Bootstrap	Jul 31, 2021	Off-policy evaluationThompson Sampling	—Unverified

Show:10 25 50

← PrevPage 5 of 11Next →

No leaderboard results yet.