Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 265 papers

Title	Date	Tasks	Status	Score
From Importance Sampling to Doubly Robust Policy Gradient	Oct 20, 2019	Off-policy evaluation	CodeCode Available	5
Future-Dependent Value-Based Off-Policy Evaluation in POMDPs	Jul 26, 2022	Off-policy evaluation	CodeCode Available	5
Limit Order Book Simulation and Trade Evaluation with K-Nearest-Neighbor Resampling	Sep 10, 2024	Off-policy evaluation	—Unverified	0
Data-Driven Off-Policy Estimator Selection: An Application in User Marketing on An Online Content Delivery Service	Sep 17, 2021	Decision MakingMarketing	—Unverified	0
Off-Policy Evaluation with Online Adaptation for Robot Exploration in Challenging Environments	Apr 7, 2022	Off-policy evaluation	—Unverified	0
Large-scale Validation of Counterfactual Learning Methods: A Test-Bed	Dec 1, 2016	counterfactualOff-policy evaluation	—Unverified	0
Bayesian Off-Policy Evaluation and Learning for Large Action Spaces	Feb 22, 2024	Computational EfficiencyOff-policy evaluation	—Unverified	0
Interpretable Off-Policy Evaluation in Reinforcement Learning by Highlighting Influential Transitions	Feb 10, 2020	Off-policy evaluationreinforcement-learning	—Unverified	0
Counterfactual Learning with General Data-generating Policies	Dec 4, 2022	counterfactualDecision Making	—Unverified	0
Infinite-Horizon Offline Reinforcement Learning with Linear Function Approximation: Curse of Dimensionality and Algorithm	Mar 17, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Inference on Time Series Nonparametric Conditional Moment Restrictions Using General Sieves	Dec 31, 2022	Off-policy evaluationTime Series	—Unverified	0
Hyperparameter Optimization Can Even be Harmful in Off-Policy Learning and How to Deal with It	Apr 23, 2024	counterfactualDecision Making	—Unverified	0
Bayesian Counterfactual Mean Embeddings and Off-Policy Evaluation	Nov 2, 2022	counterfactualOff-policy evaluation	—Unverified	0
Adaptive Trade-Offs in Off-Policy Learning	Oct 16, 2019	Off-policy evaluationreinforcement-learning	—Unverified	0
Hybrid Value Estimation for Off-policy Evaluation and Offline Reinforcement Learning	Jun 4, 2022	MuJoCoOff-policy evaluation	—Unverified	0
IntOPE: Off-Policy Evaluation in the Presence of Interference	Aug 24, 2024	Off-policy evaluationRecommendation Systems	—Unverified	0
HOPE: Human-Centric Off-Policy Evaluation for E-Learning and Healthcare	Feb 18, 2023	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Counterfactual Analysis in Dynamic Latent State Models	May 27, 2022	counterfactualEpidemiology	—Unverified	0
Generalizing Off-Policy Evaluation From a Causal Perspective For Sequential Decision-Making	Jan 20, 2022	counterfactualDecision Making	—Unverified	0
Generalized Emphatic Temporal Difference Learning: Bias-Variance Analysis	Sep 17, 2015	Off-policy evaluation	—Unverified	0
Balancing Immediate Revenue and Future Off-Policy Evaluation in Coupon Allocation	Jul 6, 2024	Off-policy evaluation	—Unverified	0
Consistent On-Line Off-Policy Evaluation	Feb 23, 2017	Off-policy evaluation	—Unverified	0
Finite Sample Analysis of Minimax Offline Reinforcement Learning: Completeness, Fast Rates and First-Order Efficiency	Feb 5, 2021	Off-policy evaluationreinforcement-learning	—Unverified	0
Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning	Feb 11, 2020	Off-policy evaluationreinforcement-learning	—Unverified	0
Expected Sarsa(λ) with Control Variate for Variance Reduction	Jun 25, 2019	Off-policy evaluationReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 5 of 11Next →

No leaderboard results yet.