Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 265 papers

Title	Date	Tasks	Status
STITCH-OPE: Trajectory Stitching with Guided Diffusion for Off-Policy Evaluation	May 27, 2025	D4RLDenoising	—Unverified
Characterization of Efficient Influence Function for Off-Policy Evaluation Under Optimal Policies	May 20, 2025	counterfactualOff-policy evaluation	—Unverified
Stabilizing Temporal Difference Learning via Implicit Stochastic Recursion	May 2, 2025	Computational EfficiencyOff-policy evaluation	—Unverified
DOLCE: Decomposing Off-Policy Evaluation/Learning into Lagged and Current Effects	May 2, 2025	ImputationOff-policy evaluation	CodeCode Available
Off-Policy Evaluation for Sequential Persuasion Process with Unobserved Confounding	Apr 1, 2025	Decision MakingOff-policy evaluation	—Unverified
Enhancing Offline Model-Based RL via Active Model Selection: A Bayesian Optimization Perspective	Feb 17, 2025	Bayesian Optimizationmodel	—Unverified
Off-Policy Evaluation for Recommendations with Missing-Not-At-Random Rewards	Feb 13, 2025	Off-policy evaluationPosition	—Unverified
Model Selection for Off-policy Evaluation: New Algorithms and Experimental Protocol	Feb 11, 2025	Model SelectionOff-policy evaluation	—Unverified
Off-policy Evaluation for Payments at Adyen	Jan 15, 2025	BenchmarkingDecision Making	—Unverified
Off-Policy Evaluation and Counterfactual Methods in Dynamic Auction Environments	Jan 9, 2025	counterfactualDecision Making	—Unverified
CANDOR: Counterfactual ANnotated DOubly Robust Off-Policy Evaluation	Dec 11, 2024	counterfactualOff-policy evaluation	—Unverified
Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement Learning	Dec 8, 2024	Off-policy evaluation	CodeCode Available
Concept-driven Off Policy Evaluation	Nov 28, 2024	Off-policy evaluation	—Unverified
Logarithmic Neyman Regret for Adaptive Estimation of the Average Treatment Effect	Nov 21, 2024	Causal InferenceOff-policy evaluation	—Unverified
Off-policy estimation with adaptively collected data: the power of online learning	Nov 19, 2024	Causal InferenceMulti-Armed Bandits	—Unverified
Minimum Empirical Divergence for Sub-Gaussian Linear Bandits	Oct 31, 2024	Multi-Armed BanditsOff-policy evaluation	CodeCode Available
Primal-Dual Spectral Representation for Off-policy Evaluation	Oct 23, 2024	Off-policy evaluationReinforcement Learning (RL)	—Unverified
Abstract Reward Processes: Leveraging State Abstraction for Consistent Off-Policy Evaluation	Oct 3, 2024	Autonomous DrivingOff-policy evaluation	CodeCode Available
Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm	Sep 24, 2024	Offline RLOff-policy evaluation	—Unverified
Designing an Interpretable Interface for Contextual Bandits	Sep 23, 2024	Multi-Armed BanditsOff-policy evaluation	—Unverified
Limit Order Book Simulation and Trade Evaluation with K-Nearest-Neighbor Resampling	Sep 10, 2024	Off-policy evaluation	—Unverified
IntOPE: Off-Policy Evaluation in the Presence of Interference	Aug 24, 2024	Off-policy evaluationRecommendation Systems	—Unverified
Effective Off-Policy Evaluation and Learning in Contextual Combinatorial Bandits	Aug 20, 2024	Off-policy evaluationRecommendation Systems	—Unverified
Empowering Clinicians with Medical Decision Transformers: A Framework for Sepsis Treatment	Jul 28, 2024	Off-policy evaluationreinforcement-learning	—Unverified
Causal Deepsets for Off-policy Evaluation under Spatial or Spatio-temporal Interferences	Jul 25, 2024	Off-policy evaluation	CodeCode Available

Show:10 25 50

← PrevPage 2 of 11Next →

No leaderboard results yet.