Sequential Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 1210 papers

Title	Date	Tasks	Status	Hype
"Give Me an Example Like This": Episodic Active Reinforcement Learning from Demonstrations	Jun 5, 2024	Active LearningReinforcement Learning (RL)	CodeCode Available	0
Sound Heuristic Search Value Iteration for Undiscounted POMDPs with Reachability Objectives	Jun 5, 2024	Decision MakingEfficient Exploration	CodeCode Available	0
Rectifying Reinforcement Learning for Reward Matching	Jun 4, 2024	Decision Makingreinforcement-learning	—Unverified	0
Re-ReST: Reflection-Reinforced Self-Training for Language Agents	Jun 3, 2024	Code GenerationImage Generation	CodeCode Available	1
Combining Experimental and Historical Data for Policy Evaluation	Jun 1, 2024	Data IntegrationDecision Making	CodeCode Available	0
Reward Machines for Deep RL in Noisy and Uncertain Environments	May 31, 2024	counterfactualDecision Making	CodeCode Available	0
Pursuing Overall Welfare in Federated Learning through Sequential Decision Making	May 31, 2024	Decision MakingFairness	CodeCode Available	1
Low-rank finetuning for LLMs: A fairness perspective	May 28, 2024	Decision MakingFairness	—Unverified	0
OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators	May 27, 2024	Decision MakingOffline RL	—Unverified	0
Leveraging Offline Data in Linear Latent Bandits	May 27, 2024	Decision MakingMovie Recommendation	—Unverified	0
Rethinking Transformers in Solving POMDPs	May 27, 2024	Decision MakingReinforcement Learning (RL)	CodeCode Available	1
Variational Offline Multi-agent Skill Discovery	May 26, 2024	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Inference of Utilities and Time Preference in Sequential Decision-Making	May 24, 2024	Decision MakingSequential Decision Making	—Unverified	0
Inverse-RLignment: Large Language Model Alignment from Demonstrations through Inverse Reinforcement Learning	May 24, 2024	Decision MakingLanguage Modeling	—Unverified	0
Reinforcing Language Agents via Policy Optimization with Action Decomposition	May 23, 2024	Sequential Decision Making	—Unverified	0
Efficiently Training Deep-Learning Parametric Policies using Lagrangian Duality	May 23, 2024	Decision MakingDecision Making Under Uncertainty	—Unverified	0
Understanding the Training and Generalization of Pretrained Transformer for Sequential Decision Making	May 23, 2024	Decision MakingSequential Decision Making	—Unverified	0
A finite time analysis of distributed Q-learning	May 23, 2024	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
FLIPHAT: Joint Differential Privacy for High Dimensional Sparse Linear Bandits	May 22, 2024	Decision MakingSequential Decision Making	CodeCode Available	0
On the Brittle Foundations of ReAct Prompting for Agentic Large Language Models	May 22, 2024	Decision MakingSequential Decision Making	—Unverified	0
A Unified Linear Programming Framework for Offline Reward Learning from Human Demonstrations and Feedback	May 20, 2024	Decision Makingreinforcement-learning	—Unverified	0
Optimistic Query Routing in Clustering-based Approximate Maximum Inner Product Search	May 20, 2024	ClusteringSequential Decision Making	CodeCode Available	0
Is Mamba Compatible with Trajectory Optimization in Offline Reinforcement Learning?	May 20, 2024	Atari GamesMamba	CodeCode Available	0
CPS-LLM: Large Language Model based Safe Usage Plan Generator for Human-in-the-Loop Human-in-the-Plant Cyber-Physical System	May 19, 2024	ChatbotLanguage Modeling	—Unverified	0
AgentClinic: a multimodal agent benchmark to evaluate AI in simulated clinical environments	May 13, 2024	Decision MakingDiagnostic	—Unverified	0
Human-Modeling in Sequential Decision-Making: An Analysis through the Lens of Human-Aware AI	May 13, 2024	Decision MakingSequential Decision Making	—Unverified	0
Learning Planning Abstractions from Language	May 6, 2024	Decision MakingSequential Decision Making	—Unverified	0
Out-of-Distribution Adaptation in Offline RL: Counterfactual Reasoning via Causal Normalizing Flows	May 6, 2024	Causal Inferencecounterfactual	—Unverified	0
Enhancing Q-Learning with Large Language Model Heuristics	May 6, 2024	Decision MakingLanguage Modeling	—Unverified	0
MEXGEN: An Effective and Efficient Information Gain Approximation for Information Gathering Path Planning	May 4, 2024	Decision MakingSequential Decision Making	—Unverified	0
Mathematics of statistical sequential decision-making: concentration, risk-awareness and modelling in stochastic bandits, with applications to bariatric surgery	May 3, 2024	Decision MakingInterpretable Machine Learning	—Unverified	0
Provably Efficient Reinforcement Learning for Adversarial Restless Multi-Armed Bandits with Unknown Transitions and Bandit Feedback	May 2, 2024	Multi-Armed BanditsSequential Decision Making	—Unverified	0
Scalable Bayesian Inference in the Era of Deep Learning: From Gaussian Processes to Deep Neural Networks	Apr 29, 2024	Bayesian InferenceGaussian Processes	—Unverified	0
Q-learning with temporal memory to navigate turbulence	Apr 26, 2024	Decision MakingNavigate	—Unverified	0
Digital Twins for forecasting and decision optimisation with machine learning: applications in wastewater treatment	Apr 23, 2024	Decision MakingSequential Decision Making	—Unverified	0
What Hides behind Unfairness? Exploring Dynamics Fairness in Reinforcement Learning	Apr 16, 2024	Attributecounterfactual	CodeCode Available	0
Do LLMs Play Dice? Exploring Probability Distribution Sampling in Large Language Models for Behavioral Simulation	Apr 13, 2024	Decision MakingSequential Decision Making	—Unverified	0
Sequential Decision Making with Expert Demonstrations under Unobserved Heterogeneity	Apr 10, 2024	Decision MakingMeta Reinforcement Learning	CodeCode Available	0
Rethinking Out-of-Distribution Detection for Reinforcement Learning: Advancing Methods for Evaluation and Detection	Apr 10, 2024	Out-of-Distribution DetectionOut of Distribution (OOD) Detection	CodeCode Available	0
Reward Learning from Suboptimal Demonstrations with Applications in Surgical Electrocautery	Apr 10, 2024	Decision MakingImitation Learning	—Unverified	0
Multi-Agent Soft Actor-Critic with Coordinated Loss for Autonomous Mobility-on-Demand Fleet Control	Apr 10, 2024	Decision MakingSequential Decision Making	CodeCode Available	0
Deep Reinforcement Learning for Personalized Diagnostic Decision Pathways Using Electronic Health Records: A Comparative Study on Anemia and Systemic Lupus Erythematosus	Apr 9, 2024	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Regularized Conditional Diffusion Model for Multi-Task Preference Alignment	Apr 7, 2024	D4RLDecision Making	—Unverified	0
Composite Bayesian Optimization In Function Spaces Using NEON -- Neural Epistemic Operator Networks	Apr 3, 2024	Bayesian OptimizationDecision Making	—Unverified	0
Multi-granular Adversarial Attacks against Black-box Neural Ranking Models	Apr 2, 2024	Adversarial AttackDecision Making	—Unverified	0
Decision Mamba: Reinforcement Learning via Sequence Modeling with Selective State Spaces	Mar 29, 2024	Decision MakingMamba	CodeCode Available	1
Retentive Decision Transformer with Adaptive Masking for Reinforcement Learning based Recommendation Systems	Mar 26, 2024	Computational EfficiencyDecision Making	—Unverified	0
Mixed-Initiative Human-Robot Teaming under Suboptimality with Online Bayesian Adaptation	Mar 24, 2024	Decision MakingSequential Decision Making	CodeCode Available	0
Continual Vision-and-Language Navigation	Mar 22, 2024	Continual LearningNavigate	—Unverified	0
Sequential Decision-Making for Inline Text Autocomplete	Mar 21, 2024	Decision MakingLanguage Modelling	—Unverified	0

Show:10 25 50

← PrevPage 6 of 25Next →

No leaderboard results yet.