Sequential Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 1210 papers

Title	Date	Tasks	Status
Thompson Sampling for Contextual Bandit Problems with Auxiliary Safety Constraints	Nov 2, 2019	Bayesian OptimizationDecision Making	—Unverified
Thompson Sampling via Local Uncertainty	Oct 30, 2019	Decision MakingMulti-Armed Bandits	CodeCode Available
Policy Learning for Malaria Control	Oct 20, 2019	Bayesian OptimizationDecision Making	CodeCode Available
Adaptive Exploration in Linear Contextual Bandit	Oct 15, 2019	Decision MakingMulti-Armed Bandits	—Unverified
Deep Q-Network for Angry Birds	Oct 4, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
MABWiser: A Parallelizable Contextual Multi-Armed Bandit Library for Python	Oct 4, 2019	Decision MakingSequential Decision Making	CodeCode Available
The Choice Function Framework for Online Policy Improvement	Oct 1, 2019	Decision MakingSequential Decision Making	—Unverified
Reinforcement Learning for Multi-Objective Optimization of Online Decisions in High-Dimensional Systems	Oct 1, 2019	Decision MakingManagement	—Unverified
Generalizing Reinforcement Learning to Unseen Actions	Sep 25, 2019	Decision Makingreinforcement-learning	—Unverified
Collaborative Inter-agent Knowledge Distillation for Reinforcement Learning	Sep 25, 2019	Decision MakingKnowledge Distillation	—Unverified
Learning Functionally Decomposed Hierarchies for Continuous Navigation Tasks	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
PROVABLY BENEFITS OF DEEP HIERARCHICAL RL	Sep 25, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified
Selective Network Discovery via Deep Reinforcement Learning on Embedded Spaces	Sep 16, 2019	AttributeDecision Making	—Unverified
Back to the Future -- Sequential Alignment of Text Representations	Sep 8, 2019	Decision MakingRumour Detection	CodeCode Available
Classification with Costly Features as a Sequential Decision-Making Problem	Sep 5, 2019	ClassificationClassification with Costly Features	CodeCode Available
An Arm-Wise Randomization Approach to Combinatorial Linear Semi-Bandits	Sep 5, 2019	Decision MakingRecommendation Systems	—Unverified
Prediction, Consistency, Curvature: Representation Learning for Locally-Linear Control	Sep 4, 2019	Decision MakingOpen-Ended Question Answering	CodeCode Available
Can A User Anticipate What Her Followers Want?	Sep 1, 2019	Decision MakingSequential Decision Making	—Unverified
Interactive Machine Comprehension with Information Seeking Agents	Aug 27, 2019	Decision MakingInformation Retrieval	CodeCode Available
Reinforcement Learning in Healthcare: A Survey	Aug 22, 2019	Decision MakingMedical Diagnosis	—Unverified
Exploring Offline Policy Evaluation for the Continuous-Armed Bandit Problem	Aug 21, 2019	Decision MakingSequential Decision Making	—Unverified
Online Planning for Decentralized Stochastic Control with Partial History Sharing	Aug 6, 2019	Decision MakingSequential Decision Making	—Unverified
Bridging Commonsense Reasoning and Probabilistic Planning via a Probabilistic Action Language	Jul 31, 2019	Decision MakingSequential Decision Making	—Unverified
Reward Learning for Efficient Reinforcement Learning in Extractive Document Summarisation	Jul 30, 2019	Decision MakingLearning-To-Rank	CodeCode Available
Bandit Convex Optimization in Non-stationary Environments	Jul 29, 2019	Decision MakingSequential Decision Making	—Unverified
Scaling Multi-Armed Bandit Algorithms	Jul 25, 2019	Multi-Armed BanditsSequential Decision Making	—Unverified
IR-VIC: Unsupervised Discovery of Sub-goals for Transfer in RL	Jul 24, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified
A Sufficient Statistic for Influence in Structured Multiagent Environments	Jul 22, 2019	Decision MakingSequential Decision Making	—Unverified
Reward Advancement: Transforming Policy under Maximum Causal Entropy Principle	Jul 11, 2019	Decision MakingSequential Decision Making	—Unverified
A Scheme for Dynamic Risk-Sensitive Sequential Decision Making	Jul 9, 2019	Decision MakingSequential Decision Making	—Unverified
Thompson Sampling on Symmetric α-Stable Bandits	Jul 8, 2019	Bayesian InferenceDecision Making	—Unverified
Co-training for Policy Learning	Jul 3, 2019	Combinatorial Optimizationcontinuous-control	CodeCode Available
Bridging by Word: Image Grounded Vocabulary Construction for Visual Captioning	Jul 1, 2019	Decision MakingImage Captioning	CodeCode Available
Exploiting Relevance for Online Decision-Making in High-Dimensions	Jul 1, 2019	Decision MakingSequential Decision Making	—Unverified
Learning Markov models via low-rank optimization	Jun 28, 2019	Decision MakingSequential Decision Making	—Unverified
A Theoretical Connection Between Statistical Physics and Reinforcement Learning	Jun 24, 2019	Decision Makingreinforcement-learning	—Unverified
A Hierarchical Architecture for Sequential Decision-Making in Autonomous Driving using Deep Reinforcement Learning	Jun 20, 2019	Autonomous DrivingDecision Making	CodeCode Available
Macro-action Multi-time scale Dynamic Programming for Energy Management in Buildings with Phase Change Materials	Jun 11, 2019	Decision Makingenergy management	—Unverified
Neural Heterogeneous Scheduler	Jun 9, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Non-Stationary Reinforcement Learning: The Blessing of (More) Optimism	Jun 7, 2019	Decision Makingreinforcement-learning	—Unverified
Lifelong Learning with a Changing Action Set	Jun 5, 2019	Decision MakingLifelong learning	CodeCode Available
Reinforcement Learning When All Actions are Not Always Available	Jun 5, 2019	AllDecision Making	CodeCode Available
Learning NP-Hard Multi-Agent Assignment Planning using GNN: Inference on a Random Graph and Provable Auction-Fitted Q-learning	May 29, 2019	Combinatorial OptimizationDecision Making	—Unverified
Learning to Discretize: Solving 1D Scalar Conservation Laws via Deep Reinforcement Learning	May 27, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Multi-hop Reading Comprehension via Deep Reinforcement Learning based Document Traversal	May 23, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Knowledge-Based Sequential Decision-Making Under Uncertainty	May 16, 2019	Decision MakingDecision Making Under Uncertainty	—Unverified
Tight Regret Bounds for Infinite-armed Linear Contextual Bandits	May 4, 2019	Decision MakingMulti-Armed Bandits	—Unverified
Group Retention when Using Machine Learning in Sequential Decision Making: the Interplay between User Dynamics and Fairness	May 2, 2019	Decision MakingFairness	—Unverified
Understanding & Generalizing AlphaGo Zero	May 1, 2019	Decision Makingreinforcement-learning	—Unverified
Soft Q-Learning with Mutual-Information Regularization	May 1, 2019	Decision MakingQ-Learning	—Unverified

Show:10 25 50

← PrevPage 21 of 25Next →

No leaderboard results yet.