SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 141–150 of 265 papers

Title	Date	Tasks	Status
Designing an Interpretable Interface for Contextual Bandits	Sep 23, 2024	Multi-Armed BanditsOff-policy evaluation	—Unverified
Development and Validation of Heparin Dosing Policies Using an Offline Reinforcement Learning Algorithm	Sep 24, 2024	Offline RLOff-policy evaluation	—Unverified
Discovering an Aid Policy to Minimize Student Evasion Using Offline Reinforcement Learning	Apr 20, 2021	ClusteringDecision Making	—Unverified
Distributional Shift-Aware Off-Policy Interval Estimation: A Unified Error Quantification Framework	Sep 23, 2023	Off-policy evaluation	—Unverified
Double/Debiased Machine Learning for Dynamic Treatment Effects via g-Estimation	Feb 17, 2020	BIG-bench Machine LearningModel Selection	—Unverified
Double Reinforcement Learning for Efficient and Robust Off-Policy Evaluation	Jan 1, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Doubly Robust Bias Reduction in Infinite Horizon Off-Policy Estimation	Oct 16, 2019	Density Ratio EstimationOff-policy evaluation	—Unverified
Doubly robust off-policy evaluation with shrinkage	Jul 22, 2019	Model SelectionMulti-Armed Bandits	—Unverified
Doubly-Robust Off-Policy Evaluation with Estimated Logging Policy	Apr 2, 2024	Multi-Armed BanditsOff-policy evaluation	—Unverified
Effective Off-Policy Evaluation and Learning in Contextual Combinatorial Bandits	Aug 20, 2024	Off-policy evaluationRecommendation Systems	—Unverified

Show:10 25 50

← PrevPage 15 of 27Next →

No leaderboard results yet.