Sequential Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1025 of 1210 papers

Title	Date	Tasks	Status
Thompson Sampling for Contextual Bandit Problems with Auxiliary Safety Constraints	Nov 2, 2019	Bayesian OptimizationDecision Making	—Unverified
Thompson Sampling via Local Uncertainty	Oct 30, 2019	Decision MakingMulti-Armed Bandits	CodeCode Available
Policy Learning for Malaria Control	Oct 20, 2019	Bayesian OptimizationDecision Making	CodeCode Available
Adaptive Exploration in Linear Contextual Bandit	Oct 15, 2019	Decision MakingMulti-Armed Bandits	—Unverified
Deep Q-Network for Angry Birds	Oct 4, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
MABWiser: A Parallelizable Contextual Multi-Armed Bandit Library for Python	Oct 4, 2019	Decision MakingSequential Decision Making	CodeCode Available
The Choice Function Framework for Online Policy Improvement	Oct 1, 2019	Decision MakingSequential Decision Making	—Unverified
Reinforcement Learning for Multi-Objective Optimization of Online Decisions in High-Dimensional Systems	Oct 1, 2019	Decision MakingManagement	—Unverified
Generalizing Reinforcement Learning to Unseen Actions	Sep 25, 2019	Decision Makingreinforcement-learning	—Unverified
Collaborative Inter-agent Knowledge Distillation for Reinforcement Learning	Sep 25, 2019	Decision MakingKnowledge Distillation	—Unverified
Learning Functionally Decomposed Hierarchies for Continuous Navigation Tasks	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
PROVABLY BENEFITS OF DEEP HIERARCHICAL RL	Sep 25, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified
Selective Network Discovery via Deep Reinforcement Learning on Embedded Spaces	Sep 16, 2019	AttributeDecision Making	—Unverified
Back to the Future -- Sequential Alignment of Text Representations	Sep 8, 2019	Decision MakingRumour Detection	CodeCode Available
Classification with Costly Features as a Sequential Decision-Making Problem	Sep 5, 2019	ClassificationClassification with Costly Features	CodeCode Available
An Arm-Wise Randomization Approach to Combinatorial Linear Semi-Bandits	Sep 5, 2019	Decision MakingRecommendation Systems	—Unverified
Prediction, Consistency, Curvature: Representation Learning for Locally-Linear Control	Sep 4, 2019	Decision MakingOpen-Ended Question Answering	CodeCode Available
Can A User Anticipate What Her Followers Want?	Sep 1, 2019	Decision MakingSequential Decision Making	—Unverified
Interactive Machine Comprehension with Information Seeking Agents	Aug 27, 2019	Decision MakingInformation Retrieval	CodeCode Available
Reinforcement Learning in Healthcare: A Survey	Aug 22, 2019	Decision MakingMedical Diagnosis	—Unverified
Exploring Offline Policy Evaluation for the Continuous-Armed Bandit Problem	Aug 21, 2019	Decision MakingSequential Decision Making	—Unverified
Online Planning for Decentralized Stochastic Control with Partial History Sharing	Aug 6, 2019	Decision MakingSequential Decision Making	—Unverified
Bridging Commonsense Reasoning and Probabilistic Planning via a Probabilistic Action Language	Jul 31, 2019	Decision MakingSequential Decision Making	—Unverified
Reward Learning for Efficient Reinforcement Learning in Extractive Document Summarisation	Jul 30, 2019	Decision MakingLearning-To-Rank	CodeCode Available
Bandit Convex Optimization in Non-stationary Environments	Jul 29, 2019	Decision MakingSequential Decision Making	—Unverified

Show:10 25 50

← PrevPage 41 of 49Next →

No leaderboard results yet.