SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 221–230 of 265 papers

Title	Date	Tasks	Status
Off-Policy Evaluation with Out-of-Sample Guarantees	Jan 20, 2023	Off-policy evaluationvalid	CodeCode Available
Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement Learning	Dec 8, 2024	Off-policy evaluation	CodeCode Available
Control Variates for Slate Off-Policy Evaluation	Jun 15, 2021	Off-policy evaluationRecommendation Systems	CodeCode Available
Robust Generalization despite Distribution Shift via Minimum Discriminating Information	Jun 8, 2021	Generalization BoundsOff-policy evaluation	CodeCode Available
Robust Offline Reinforcement learning with Heavy-Tailed Rewards	Oct 28, 2023	Offline RLOff-policy evaluation	CodeCode Available
State Relevance for Off-Policy Evaluation	Sep 13, 2021	Off-policy evaluation	CodeCode Available
Off-Policy Evaluation and Learning for External Validity under a Covariate Shift	Feb 26, 2020	Off-policy evaluation	CodeCode Available
Counterfactual Evaluation of Peer-Review Assignment Policies	May 27, 2023	counterfactualOff-policy evaluation	CodeCode Available
A Multi-Agent Reinforcement Learning Framework for Off-Policy Evaluation in Two-sided Markets	Feb 21, 2022	ManagementMulti-agent Reinforcement Learning	CodeCode Available
Safe Exploration for Optimizing Contextual Bandits	Feb 2, 2020	counterfactualInformation Retrieval	CodeCode Available

Show:10 25 50

← PrevPage 23 of 27Next →

No leaderboard results yet.