SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 265 papers

Title	Date	Tasks	Status	Hype
Open Bandit Dataset and Pipeline: Towards Realistic and Reproducible Off-Policy Evaluation	Aug 17, 2020	Off-policy evaluation	CodeCode Available	1
Counterfactual Evaluation of Slate Recommendations with Sequential Reward Interactions	Jul 25, 2020	counterfactualNews Recommendation	CodeCode Available	1
Off-Policy Evaluation and Learning for the Future under Non-Stationarity	Jun 25, 2025	Off-policy evaluation	—Unverified	0
A Principled Path to Fitted Distributional Evaluation	Jun 24, 2025	Atari GamesOff-policy evaluation	—Unverified	0
Semi-gradient DICE for Offline Constrained Reinforcement Learning	Jun 10, 2025	Offline RLOff-policy evaluation	—Unverified	0
STITCH-OPE: Trajectory Stitching with Guided Diffusion for Off-Policy Evaluation	May 27, 2025	D4RLDenoising	—Unverified	0
Characterization of Efficient Influence Function for Off-Policy Evaluation Under Optimal Policies	May 20, 2025	counterfactualOff-policy evaluation	—Unverified	0
Stabilizing Temporal Difference Learning via Implicit Stochastic Recursion	May 2, 2025	Computational EfficiencyOff-policy evaluation	—Unverified	0
DOLCE: Decomposing Off-Policy Evaluation/Learning into Lagged and Current Effects	May 2, 2025	ImputationOff-policy evaluation	CodeCode Available	0
Off-Policy Evaluation for Sequential Persuasion Process with Unobserved Confounding	Apr 1, 2025	Decision MakingOff-policy evaluation	—Unverified	0

Show:10 25 50

← PrevPage 3 of 27Next →

No leaderboard results yet.