Sequential Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 1210 papers

Title	Date	Tasks	Status
Bandits in Matching Markets: Ideas and Proposals for Peer Lending	Oct 30, 2020	Decision MakingFairness	—Unverified
Towards Safe Policy Improvement for Non-Stationary MDPs	Oct 23, 2020	Decision Makingreinforcement-learning	CodeCode Available
What are the Statistical Limits of Offline RL with Linear Function Approximation?	Oct 22, 2020	Decision MakingOffline RL	—Unverified
Deep Q-Network-based Adaptive Alert Threshold Selection Policy for Payment Fraud Systems in Retail Banking	Oct 21, 2020	Decision MakingFraud Detection	—Unverified
DBA bandits: Self-driving index tuning under ad-hoc, analytical workloads with safety guarantees	Oct 19, 2020	AttributeDecision Making	—Unverified
Learning to Generalize for Sequential Decision Making	Oct 5, 2020	Decision MakingImitation Learning	CodeCode Available
A Generative Machine Learning Approach to Policy Optimization in Pursuit-Evasion Games	Oct 4, 2020	BIG-bench Machine LearningDecision Making	—Unverified
Mean-Variance Efficient Reinforcement Learning with Applications to Dynamic Financial Investment	Oct 3, 2020	Decision MakingDecision Making Under Uncertainty	—Unverified
Is Reinforcement Learning More Difficult Than Bandits? A Near-optimal Algorithm Escaping the Curse of Horizon	Sep 28, 2020	Decision MakingMulti-Armed Bandits	—Unverified
A Sample-Efficient Algorithm for Episodic Finite-Horizon MDP with Constraints	Sep 23, 2020	Decision MakingSequential Decision Making	—Unverified
Transfer Learning in Deep Reinforcement Learning: A Survey	Sep 16, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Causal Bandits without prior knowledge using separating sets	Sep 16, 2020	Causal DiscoveryDecision Making	—Unverified
Toward the Fundamental Limits of Imitation Learning	Sep 13, 2020	Decision MakingImitation Learning	—Unverified
Optimal Inspection and Maintenance Planning for Deteriorating Structural Components through Dynamic Bayesian Networks and Markov Decision Processes	Sep 9, 2020	Decision MakingSequential Decision Making	—Unverified
Inverse Policy Evaluation for Value-based Sequential Decision-making	Aug 26, 2020	Decision MakingQ-Learning	—Unverified
Spatial Privacy Pricing: The Interplay between Privacy, Utility and Price in Geo-Marketplaces	Aug 25, 2020	Decision MakingSequential Decision Making	—Unverified
A Survey of Knowledge-based Sequential Decision Making under Uncertainty	Aug 19, 2020	Decision MakingDecision Making Under Uncertainty	—Unverified
Deep Model-Based Reinforcement Learning for High-Dimensional Problems, a Survey	Aug 11, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
A Machine of Few Words -- Interactive Speaker Recognition with Reinforcement Learning	Aug 7, 2020	Decision Makingreinforcement-learning	—Unverified
Tracking the Race Between Deep Reinforcement Learning and Imitation Learning -- Extended Version	Aug 3, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Dynamics Generalization via Information Bottleneck in Deep Reinforcement Learning	Aug 3, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Compare and Select: Video Summarization with Multi-Agent Reinforcement Learning	Jul 29, 2020	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Data-efficient visuomotor policy training using reinforcement learning and generative models	Jul 26, 2020	Decision MakingDisentanglement	—Unverified
AirCapRL: Autonomous Aerial Human Motion Capture using Deep Reinforcement Learning	Jul 13, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Text-based RL Agents with Commonsense Knowledge: New Challenges, Environments and Approaches	Jul 12, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Fast reinforcement learning with generalized policy updates	Jul 9, 2020	Decision MakingProblem Decomposition	—Unverified
GraphOpt: Learning Optimization Models of Graph Formation	Jul 7, 2020	Decision MakingLink Prediction	—Unverified
Learning "What-if" Explanations for Sequential Decision-Making	Jul 2, 2020	counterfactualCounterfactual Reasoning	—Unverified
Convex Regularization in Monte-Carlo Tree Search	Jul 1, 2020	Atari GamesDecision Making	—Unverified
Falsification-Based Robust Adversarial Reinforcement Learning	Jul 1, 2020	Autonomous VehiclesDecision Making	—Unverified
Model-based Reinforcement Learning: A Survey	Jun 30, 2020	Decision Makingmodel	—Unverified
Enforcing Almost-Sure Reachability in POMDPs	Jun 30, 2020	Decision Makingreinforcement-learning	CodeCode Available
On Bellman's Optimality Principle for zs-POSGs	Jun 29, 2020	Decision MakingHeuristic Search	—Unverified
A Unifying Framework for Reinforcement Learning and Planning	Jun 26, 2020	Decision Makingreinforcement-learning	—Unverified
Circuit Routing Using Monte Carlo Tree Search and Deep Neural Networks	Jun 24, 2020	Decision MakingSequential Decision Making	—Unverified
Risk-Sensitive Reinforcement Learning: a Martingale Approach to Reward Uncertainty	Jun 23, 2020	Decision MakingPortfolio Optimization	—Unverified
Towards Tractable Optimism in Model-Based Reinforcement Learning	Jun 21, 2020	continuous-controlContinuous Control	—Unverified
Frequentist Uncertainty in Recurrent Neural Networks via Blockwise Influence Functions	Jun 20, 2020	Decision MakingSequential Decision Making	CodeCode Available
Counterfactually Guided Off-policy Transfer in Clinical Settings	Jun 20, 2020	counterfactualDecision Making	—Unverified
Learning by Repetition: Stochastic Multi-armed Bandits under Priming Effect	Jun 18, 2020	Decision MakingMulti-Armed Bandits	—Unverified
Parameterized MDPs and Reinforcement Learning Problems -- A Maximum Entropy Principle Based Framework	Jun 17, 2020	Decision MakingQ-Learning	—Unverified
Mutual Information Based Knowledge Transfer Under State-Action Dimension Mismatch	Jun 12, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available
On the Relationship Between Structure in Natural Language and Models of Sequential Decision Processes	Jun 12, 2020	Decision MakingSequential Decision Making	—Unverified
Recurrent Sum-Product-Max Networks for Decision Making in Perfectly-Observed Environments	Jun 12, 2020	Decision Makingreinforcement-learning	CodeCode Available
Group-Fair Online Allocation in Continuous Time	Jun 11, 2020	Cloud ComputingDecision Making	—Unverified
When is Particle Filtering Efficient for Planning in Partially Observed Linear Dynamical Systems?	Jun 10, 2020	Decision MakingSequential Decision Making	—Unverified
Modeling Human Driving Behavior through Generative Adversarial Imitation Learning	Jun 10, 2020	Decision MakingDisentanglement	—Unverified
Stealing Deep Reinforcement Learning Models for Fun and Profit	Jun 9, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Sharp Thresholds of the Information Cascade Fragility Under a Mismatched Model	Jun 7, 2020	Decision MakingSequential Decision Making	—Unverified
When Does MAML Objective Have Benign Landscape?	May 31, 2020	Decision MakingMeta-Learning	—Unverified

Show:10 25 50

← PrevPage 19 of 25Next →

No leaderboard results yet.