SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–60 of 265 papers

Title	Date	Tasks	Status
An Instrumental Variable Approach to Confounded Off-Policy Evaluation	Dec 29, 2022	Decision MakingOff-policy evaluation	—Unverified
Asymptotically Efficient Off-Policy Evaluation for Tabular Reinforcement Learning	Jan 29, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Counterfactual Analysis in Dynamic Latent State Models	May 27, 2022	counterfactualEpidemiology	—Unverified
Balancing Immediate Revenue and Future Off-Policy Evaluation in Coupon Allocation	Jul 6, 2024	Off-policy evaluation	—Unverified
Data Poisoning Attacks on Off-Policy Policy Evaluation Methods	Apr 6, 2024	Data PoisoningOff-policy evaluation	—Unverified
Causality and Batch Reinforcement Learning: Complementary Approaches To Planning In Unknown Domains	Jun 3, 2020	Autonomous DrivingCausal Inference	—Unverified
Counterfactual Learning with General Data-generating Policies	Dec 4, 2022	counterfactualDecision Making	—Unverified
Bayesian Counterfactual Mean Embeddings and Off-Policy Evaluation	Nov 2, 2022	counterfactualOff-policy evaluation	—Unverified
A Spectral Approach to Off-Policy Evaluation for POMDPs	Sep 22, 2021	Causal IdentificationOff-policy evaluation	—Unverified
A Review of Off-Policy Evaluation in Reinforcement Learning	Dec 13, 2022	Off-policy evaluationreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 6 of 27Next →

No leaderboard results yet.