SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 265 papers

Title	Date	Tasks	Status	Hype
BCORLE(): An Offline Reinforcement Learning and Evaluation Framework for Coupons Allocation in E-commerce Market	Dec 1, 2021	Off-policy evaluationreinforcement-learning	CodeCode Available	1
Evaluating the Robustness of Off-Policy Evaluation	Aug 31, 2021	Off-policy evaluationRecommendation Systems	CodeCode Available	1
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings	Jul 23, 2021	Computational EfficiencyDecision Making	CodeCode Available	1
Unifying Gradient Estimators for Meta-Reinforcement Learning via Off-Policy Evaluation	Jun 24, 2021	Meta Reinforcement LearningOff-policy evaluation	CodeCode Available	1
Active Offline Policy Selection	Jun 18, 2021	Bayesian OptimizationOff-policy evaluation	CodeCode Available	1
Offline RL Without Off-Policy Evaluation	Jun 16, 2021	D4RLOffline RL	CodeCode Available	1
A Deep Reinforcement Learning Approach to Marginalized Importance Sampling with the Successor Representation	Jun 12, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Off-Policy Evaluation via Adaptive Weighting with Data from Contextual Bandits	Jun 3, 2021	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	1
Benchmarks for Deep Off-Policy Evaluation	Mar 30, 2021	Benchmarkingcontinuous-control	CodeCode Available	1
Optimal Off-Policy Evaluation from Multiple Logging Policies	Oct 21, 2020	Off-policy evaluation	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 27Next →

No leaderboard results yet.