SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 171–180 of 265 papers

Title	Date	Tasks	Status
A Unified Off-Policy Evaluation Approach for General Value Function	Jul 6, 2021	Anomaly DetectionOff-policy evaluation	—Unverified
Supervised Off-Policy Ranking	Jul 3, 2021	Off-policy evaluation	CodeCode Available
Variance-Aware Off-Policy Evaluation with Linear Function Approximation	Jun 22, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified
Control Variates for Slate Off-Policy Evaluation	Jun 15, 2021	Off-policy evaluationRecommendation Systems	CodeCode Available
Robust Generalization despite Distribution Shift via Minimum Discriminating Information	Jun 8, 2021	Generalization BoundsOff-policy evaluation	CodeCode Available
Deep Proxy Causal Learning and its Application to Confounded Bandit Policy Evaluation	Jun 7, 2021	Off-policy evaluation	CodeCode Available
Deeply-Debiased Off-Policy Interval Estimation	May 10, 2021	Off-policy evaluation	CodeCode Available
Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization	Apr 28, 2021	continuous-controlContinuous Control	—Unverified
Universal Off-Policy Evaluation	Apr 26, 2021	counterfactualDecision Making	CodeCode Available
Discovering an Aid Policy to Minimize Student Evasion Using Offline Reinforcement Learning	Apr 20, 2021	ClusteringDecision Making	—Unverified

Show:10 25 50

← PrevPage 18 of 27Next →

No leaderboard results yet.