SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 265 papers

Title	Date	Tasks	Status	Hype
Offline RL Without Off-Policy Evaluation	Jun 16, 2021	D4RLOffline RL	CodeCode Available	1
Optimal Off-Policy Evaluation from Multiple Logging Policies	Oct 21, 2020	Off-policy evaluation	CodeCode Available	1
Bayesian Off-Policy Evaluation and Learning for Large Action Spaces	Feb 22, 2024	Computational EfficiencyOff-policy evaluation	—Unverified	0
Adaptive Trade-Offs in Off-Policy Learning	Oct 16, 2019	Off-policy evaluationreinforcement-learning	—Unverified	0
Bootstrapping Fitted Q-Evaluation for Off-Policy Inference	Feb 6, 2021	Off-policy evaluation	—Unverified	0
Balancing Immediate Revenue and Future Off-Policy Evaluation in Coupon Allocation	Jul 6, 2024	Off-policy evaluation	—Unverified	0
An Instrumental Variable Approach to Confounded Off-Policy Evaluation	Dec 29, 2022	Decision MakingOff-policy evaluation	—Unverified	0
Bayesian Counterfactual Mean Embeddings and Off-Policy Evaluation	Nov 2, 2022	counterfactualOff-policy evaluation	—Unverified	0
Accountable Off-Policy Evaluation via a Kernelized Bellman Statistics	Jan 1, 2020	Off-policy evaluation	—Unverified	0
Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization	Apr 28, 2021	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 3 of 27Next →

No leaderboard results yet.