SOTAVerified|Agents Browse Leaderboard About

Off-policy evaluation

Off-policy Evaluation (OPE), or offline evaluation in general, evaluates the performance of hypothetical policies leveraging only offline log data. It is particularly useful in applications where the online interaction involves high stakes and expensive setting such as precision medicine and recommender systems.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 131–140 of 265 papers

Title	Date	Tasks	Status	Hype
Bellman Residual Orthogonalization for Offline Reinforcement Learning	Mar 24, 2022	Offline RLOff-policy evaluation	—Unverified	0
Off-Policy Evaluation in Embedded Spaces	Mar 5, 2022	Density Ratio EstimationOff-policy evaluation	—Unverified	0
Off-Policy Evaluation with Policy-Dependent Optimization Response	Feb 25, 2022	Causal InferenceDecision Making	—Unverified	0
A Multi-Agent Reinforcement Learning Framework for Off-Policy Evaluation in Two-sided Markets	Feb 21, 2022	ManagementMulti-agent Reinforcement Learning	CodeCode Available	0
Doubly Robust Distributionally Robust Off-Policy Evaluation and Learning	Feb 19, 2022	Off-policy evaluation	CodeCode Available	1
Off-Policy Evaluation for Large Action Spaces via Embeddings	Feb 13, 2022	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	2
Off-Policy Fitted Q-Evaluation with Differentiable Function Approximators: Z-Estimation and Inference Theory	Feb 10, 2022	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Doubly Robust Off-Policy Evaluation for Ranking Policies under the Cascade Behavior Model	Feb 3, 2022	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	2
Generalizing Off-Policy Evaluation From a Causal Perspective For Sequential Decision-Making	Jan 20, 2022	counterfactualDecision Making	—Unverified	0
On Well-posedness and Minimax Optimal Rates of Nonparametric Q-function Estimation in Off-policy Evaluation	Jan 17, 2022	Off-policy evaluation	—Unverified	0

Show:10 25 50

← PrevPage 14 of 27Next →

No leaderboard results yet.