Sequential Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–375 of 1210 papers

Title	Date	Tasks	Status
Optimistic Query Routing in Clustering-based Approximate Maximum Inner Product Search	May 20, 2024	ClusteringSequential Decision Making	CodeCode Available
A Unified Linear Programming Framework for Offline Reward Learning from Human Demonstrations and Feedback	May 20, 2024	Decision Makingreinforcement-learning	—Unverified
CPS-LLM: Large Language Model based Safe Usage Plan Generator for Human-in-the-Loop Human-in-the-Plant Cyber-Physical System	May 19, 2024	ChatbotLanguage Modeling	—Unverified
Human-Modeling in Sequential Decision-Making: An Analysis through the Lens of Human-Aware AI	May 13, 2024	Decision MakingSequential Decision Making	—Unverified
AgentClinic: a multimodal agent benchmark to evaluate AI in simulated clinical environments	May 13, 2024	Decision MakingDiagnostic	—Unverified
Learning Planning Abstractions from Language	May 6, 2024	Decision MakingSequential Decision Making	—Unverified
Out-of-Distribution Adaptation in Offline RL: Counterfactual Reasoning via Causal Normalizing Flows	May 6, 2024	Causal Inferencecounterfactual	—Unverified
Enhancing Q-Learning with Large Language Model Heuristics	May 6, 2024	Decision MakingLanguage Modeling	—Unverified
MEXGEN: An Effective and Efficient Information Gain Approximation for Information Gathering Path Planning	May 4, 2024	Decision MakingSequential Decision Making	—Unverified
Mathematics of statistical sequential decision-making: concentration, risk-awareness and modelling in stochastic bandits, with applications to bariatric surgery	May 3, 2024	Decision MakingInterpretable Machine Learning	—Unverified
Provably Efficient Reinforcement Learning for Adversarial Restless Multi-Armed Bandits with Unknown Transitions and Bandit Feedback	May 2, 2024	Multi-Armed BanditsSequential Decision Making	—Unverified
Scalable Bayesian Inference in the Era of Deep Learning: From Gaussian Processes to Deep Neural Networks	Apr 29, 2024	Bayesian InferenceGaussian Processes	—Unverified
Q-learning with temporal memory to navigate turbulence	Apr 26, 2024	Decision MakingNavigate	—Unverified
Digital Twins for forecasting and decision optimisation with machine learning: applications in wastewater treatment	Apr 23, 2024	Decision MakingSequential Decision Making	—Unverified
What Hides behind Unfairness? Exploring Dynamics Fairness in Reinforcement Learning	Apr 16, 2024	Attributecounterfactual	CodeCode Available
Do LLMs Play Dice? Exploring Probability Distribution Sampling in Large Language Models for Behavioral Simulation	Apr 13, 2024	Decision MakingSequential Decision Making	—Unverified
Rethinking Out-of-Distribution Detection for Reinforcement Learning: Advancing Methods for Evaluation and Detection	Apr 10, 2024	Out-of-Distribution DetectionOut of Distribution (OOD) Detection	CodeCode Available
Multi-Agent Soft Actor-Critic with Coordinated Loss for Autonomous Mobility-on-Demand Fleet Control	Apr 10, 2024	Decision MakingSequential Decision Making	CodeCode Available
Reward Learning from Suboptimal Demonstrations with Applications in Surgical Electrocautery	Apr 10, 2024	Decision MakingImitation Learning	—Unverified
Sequential Decision Making with Expert Demonstrations under Unobserved Heterogeneity	Apr 10, 2024	Decision MakingMeta Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Personalized Diagnostic Decision Pathways Using Electronic Health Records: A Comparative Study on Anemia and Systemic Lupus Erythematosus	Apr 9, 2024	Decision MakingDeep Reinforcement Learning	CodeCode Available
Regularized Conditional Diffusion Model for Multi-Task Preference Alignment	Apr 7, 2024	D4RLDecision Making	—Unverified
Composite Bayesian Optimization In Function Spaces Using NEON -- Neural Epistemic Operator Networks	Apr 3, 2024	Bayesian OptimizationDecision Making	—Unverified
Multi-granular Adversarial Attacks against Black-box Neural Ranking Models	Apr 2, 2024	Adversarial AttackDecision Making	—Unverified
Retentive Decision Transformer with Adaptive Masking for Reinforcement Learning based Recommendation Systems	Mar 26, 2024	Computational EfficiencyDecision Making	—Unverified

Show:10 25 50

← PrevPage 15 of 49Next →

No leaderboard results yet.