SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 171–180 of 265 papers

Title	Date	Tasks	Status	Hype
Deep Proxy Causal Learning and its Application to Confounded Bandit Policy Evaluation	Jun 7, 2021	Off-policy evaluation	CodeCode Available	0
Off-Policy Evaluation via Adaptive Weighting with Data from Contextual Bandits	Jun 3, 2021	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	1
Deeply-Debiased Off-Policy Interval Estimation	May 10, 2021	Off-policy evaluation	CodeCode Available	0
Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization	Apr 28, 2021	continuous-controlContinuous Control	—Unverified	0
Universal Off-Policy Evaluation	Apr 26, 2021	counterfactualDecision Making	CodeCode Available	0
Discovering an Aid Policy to Minimize Student Evasion Using Offline Reinforcement Learning	Apr 20, 2021	ClusteringDecision Making	—Unverified	0
Off-Policy Risk Assessment in Contextual Bandits	Apr 18, 2021	Multi-Armed BanditsOff-policy evaluation	—Unverified	0
Benchmarks for Deep Off-Policy Evaluation	Mar 30, 2021	Benchmarkingcontinuous-control	CodeCode Available	1
Infinite-Horizon Offline Reinforcement Learning with Linear Function Approximation: Curse of Dimensionality and Algorithm	Mar 17, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Non-asymptotic Confidence Intervals of Off-policy Evaluation: Primal and Dual Bounds	Mar 9, 2021	Off-policy evaluationOpen-Ended Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 18 of 27Next →

No leaderboard results yet.