SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 265 papers

Title	Date	Tasks	Status
Consistent On-Line Off-Policy Evaluation	Feb 23, 2017	Off-policy evaluation	—Unverified
Minimax Model Learning	Mar 2, 2021	modelModel-based Reinforcement Learning	—Unverified
Hybrid Value Estimation for Off-policy Evaluation and Offline Reinforcement Learning	Jun 4, 2022	MuJoCoOff-policy evaluation	—Unverified
Generalizing Off-Policy Evaluation From a Causal Perspective For Sequential Decision-Making	Jan 20, 2022	counterfactualDecision Making	—Unverified
Inference on Time Series Nonparametric Conditional Moment Restrictions Using General Sieves	Dec 31, 2022	Off-policy evaluationTime Series	—Unverified
An Instrumental Variable Approach to Confounded Off-Policy Evaluation	Dec 29, 2022	Decision MakingOff-policy evaluation	—Unverified
Counterfactual Analysis in Dynamic Latent State Models	May 27, 2022	counterfactualEpidemiology	—Unverified
HOPE: Human-Centric Off-Policy Evaluation for E-Learning and Healthcare	Feb 18, 2023	Off-policy evaluationReinforcement Learning (RL)	—Unverified
Balancing Immediate Revenue and Future Off-Policy Evaluation in Coupon Allocation	Jul 6, 2024	Off-policy evaluation	—Unverified
Deep Jump Q-Evaluation for Offline Policy Evaluation in Continuous Action Space	Sep 28, 2020	Off-policy evaluationQ-Learning	—Unverified

Show:10 25 50

← PrevPage 11 of 27Next →

No leaderboard results yet.