SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 265 papers

Title	Date	Tasks	Status
Bootstrapping Fitted Q-Evaluation for Off-Policy Inference	Feb 6, 2021	Off-policy evaluation	—Unverified
Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm	Sep 24, 2024	Offline RLOff-policy evaluation	—Unverified
Discovering an Aid Policy to Minimize Student Evasion Using Offline Reinforcement Learning	Apr 20, 2021	ClusteringDecision Making	—Unverified
CANDOR: Counterfactual ANnotated DOubly Robust Off-Policy Evaluation	Dec 11, 2024	counterfactualOff-policy evaluation	—Unverified
A Spectral Approach to Off-Policy Evaluation for POMDPs	Sep 22, 2021	Causal IdentificationOff-policy evaluation	—Unverified
Distributional Shift-Aware Off-Policy Interval Estimation: A Unified Error Quantification Framework	Sep 23, 2023	Off-policy evaluation	—Unverified
Causality and Batch Reinforcement Learning: Complementary Approaches To Planning In Unknown Domains	Jun 3, 2020	Autonomous DrivingCausal Inference	—Unverified
Double/Debiased Machine Learning for Dynamic Treatment Effects via g-Estimation	Feb 17, 2020	BIG-bench Machine LearningModel Selection	—Unverified
Doubly Robust Bias Reduction in Infinite Horizon Off-Policy Estimation	Oct 16, 2019	Density Ratio EstimationOff-policy evaluation	—Unverified
A Principled Path to Fitted Distributional Evaluation	Jun 24, 2025	Atari GamesOff-policy evaluation	—Unverified

Show:10 25 50

← PrevPage 8 of 27Next →

No leaderboard results yet.