SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 181–190 of 265 papers

Title	Date	Tasks	Status
Minimax Weight and Q-Function Learning for Off-Policy Evaluation	Oct 28, 2019	Off-policy evaluationReinforcement Learning	—Unverified
Robust Multi-Agent Reinforcement Learning by Mutual Information Regularization	Oct 15, 2023	Multi-agent Reinforcement LearningOff-policy evaluation	—Unverified
Model Selection for Off-policy Evaluation: New Algorithms and Experimental Protocol	Feb 11, 2025	Model SelectionOff-policy evaluation	—Unverified
More Efficient Off-Policy Evaluation through Regularized Targeted Learning	Dec 13, 2019	Causal InferenceOff-policy evaluation	—Unverified
More Robust Doubly Robust Off-policy Evaluation	Feb 10, 2018	Multi-Armed BanditsOff-policy evaluation	—Unverified
Non-asymptotic Confidence Intervals of Off-policy Evaluation: Primal and Dual Bounds	Mar 9, 2021	Off-policy evaluationOpen-Ended Question Answering	—Unverified
Offline Comparison of Ranking Functions using Randomized Data	Oct 11, 2018	Off-policy evaluation	—Unverified
Offline Policy Evaluation and Optimization under Confounding	Nov 29, 2022	Offline RLOff-policy evaluation	—Unverified
Offline Reinforcement Learning for Human-Guided Human-Machine Interaction with Private Information	Dec 23, 2022	Decision MakingOff-policy evaluation	—Unverified
Off-policy Confidence Sequences	Feb 18, 2021	Off-policy evaluationvalid	—Unverified

Show:10 25 50

← PrevPage 19 of 27Next →

No leaderboard results yet.