Sequential Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1210 papers

Title	Date	Tasks	Status	Hype	Score
Multi-Agent Reinforcement Learning for Autonomous Driving: A Survey	Aug 19, 2024	Autonomous DrivingDecision Making	CodeCode Available	5	5
Reflexion: Language Agents with Verbal Reinforcement Learning	Mar 20, 2023	Decision MakingHumanEval	CodeCode Available	4	5
Eureka: Human-Level Reward Design via Coding Large Language Models	Oct 19, 2023	Decision MakingIn-Context Learning	CodeCode Available	4	5
Reinforcement Learning Meets Visual Odometry	Jul 22, 2024	Decision Makingreinforcement-learning	CodeCode Available	3	5
MineStudio: A Streamlined Package for Minecraft AI Agent Development	Dec 24, 2024	AI AgentDecision Making	CodeCode Available	3	5
Web-Shepherd: Advancing PRMs for Reinforcing Web Agents	May 21, 2025	Large Language ModelMultimodal Large Language Model	CodeCode Available	2	5
Jack of All Trades, Master of Some, a Multi-Purpose Transformer Agent	Feb 15, 2024	AllDecision Making	CodeCode Available	2	5
ACE: Cooperative Multi-agent Q-learning with Bidirectional Action-Dependency	Nov 29, 2022	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2	5
Multi-Agent Reinforcement Learning is a Sequence Modeling Problem	May 30, 2022	Decision MakingMuJoCo	CodeCode Available	2	5
Deep Generative Models for Offline Policy Learning: Tutorial, Survey, and Perspectives on Future Directions	Feb 21, 2024	Decision MakingImitation Learning	CodeCode Available	2	5
Trieste: Efficiently Exploring The Depths of Black-box Functions with TensorFlow	Feb 16, 2023	Active LearningBayesian Optimization	CodeCode Available	2	5
STEVE-1: A Generative Model for Text-to-Behavior in Minecraft	Jun 1, 2023	Decision MakingImage Generation	CodeCode Available	2	5
AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO	Feb 20, 2025	Autonomous NavigationNavigate	CodeCode Available	2	5
MacroHFT: Memory Augmented Context-aware Reinforcement Learning On High Frequency Trading	Jun 20, 2024	Algorithmic TradingDecision Making	CodeCode Available	2	5
Dungeons and Data: A Large-Scale NetHack Dataset	Nov 1, 2022	Decision MakingNetHack	CodeCode Available	2	5
Pre-Trained Language Models for Interactive Decision-Making	Feb 3, 2022	Decision MakingImitation Learning	CodeCode Available	2	5
Learning Dynamic Belief Graphs to Generalize on Text-Based Games	Feb 21, 2020	Decision MakingKnowledge Graphs	CodeCode Available	1	5
Layered and Staged Monte Carlo Tree Search for SMT Strategy Synthesis	Jan 30, 2024	Decision MakingEfficient Exploration	CodeCode Available	1	5
Learning Multi-Level Hierarchies with Hindsight	Dec 4, 2017	Decision MakingHierarchical Reinforcement Learning	CodeCode Available	1	5
Large Language Model as a Policy Teacher for Training Reinforcement Learning Agents	Nov 22, 2023	Decision MakingLanguage Modeling	CodeCode Available	1	5
CertRL: Formalizing Convergence Proofs for Value and Policy Iteration in Coq	Sep 23, 2020	Decision Makingreinforcement-learning	CodeCode Available	1	5
IQ-Learn: Inverse soft-Q Learning for Imitation	Jun 23, 2021	Atari GamesContinuous Control	CodeCode Available	1	5
Large Language Models for Planning: A Comprehensive and Systematic Survey	May 26, 2025	Logical ReasoningNavigate	CodeCode Available	1	5
Independent Reinforcement Learning for Weakly Cooperative Multiagent Traffic Control Problem	Apr 22, 2021	Decision Makingreinforcement-learning	CodeCode Available	1	5
Is Reinforcement Learning (Not) for Natural Language Processing: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization	Oct 3, 2022	Decision MakingPolicy Gradient Methods	CodeCode Available	1	5
LLF-Bench: Benchmark for Interactive Learning from Language Feedback	Dec 11, 2023	Information RetrievalOpenAI Gym	CodeCode Available	1	5
Can Increasing Input Dimensionality Improve Deep Reinforcement Learning?	Mar 3, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Bridging POMDPs and Bayesian decision making for robust maintenance planning under model uncertainty: An application to railway systems	Dec 15, 2022	Decision MakingSequential Decision Making	CodeCode Available	1	5
Learning Discrete World Models for Heuristic Search	Sep 14, 2024	Deep Reinforcement LearningHeuristic Search	CodeCode Available	1	5
Can language agents be alternatives to PPO? A Preliminary Empirical Study On OpenAI Gym	Dec 6, 2023	BenchmarkingDecision Making	CodeCode Available	1	5
Efficient Symptom Inquiring and Diagnosis via Adaptive Alignment of Reinforcement Learning and Classification	Dec 1, 2021	Decision MakingDiagnostic	CodeCode Available	1	5
Efficient Nonmyopic Bayesian Optimization via One-Shot Multi-Step Trees	Jun 29, 2020	Bayesian OptimizationDecision Making	CodeCode Available	1	5
Extracting Reward Functions from Diffusion Models	Jun 1, 2023	Decision MakingImage Generation	CodeCode Available	1	5
Dynamic Causal Bayesian Optimization	Oct 26, 2021	Bayesian OptimizationCausal Inference	CodeCode Available	1	5
Deep Reinforcement Learning for Entity Alignment	Mar 7, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal Constraints	May 27, 2020	Decision MakingDecision Making Under Uncertainty	CodeCode Available	1	5
Free from Bellman Completeness: Trajectory Stitching via Model-based Return-conditioned Supervised Learning	Oct 30, 2023	Decision MakingOffline RL	CodeCode Available	1	5
Decision Stacks: Flexible Reinforcement Learning via Modular Generative Models	Jun 9, 2023	Decision Makingreinforcement-learning	CodeCode Available	1	5
AdaPlanner: Adaptive Planning from Feedback with Language Models	May 26, 2023	Decision MakingHallucination	CodeCode Available	1	5
Does the Markov Decision Process Fit the Data: Testing for the Markov Property in Sequential Decision Making	Feb 5, 2020	Decision Makingreinforcement-learning	CodeCode Available	1	5
An Alternative Softmax Operator for Reinforcement Learning	Dec 16, 2016	Decision Makingreinforcement-learning	CodeCode Available	1	5
An empirical evaluation of active inference in multi-armed bandits	Jan 21, 2021	BIG-bench Machine LearningDecision Making	CodeCode Available	1	5
Effective Reinforcement Learning through Evolutionary Surrogate-Assisted Prescription	Feb 13, 2020	Decision Makingreinforcement-learning	CodeCode Available	1	5
Approximate Inference in Discrete Distributions with Monte Carlo Tree Search and Value Functions	Oct 15, 2019	Decision MakingDecision Making Under Uncertainty	CodeCode Available	1	5
DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback	Oct 8, 2024	MathSequential Decision Making	CodeCode Available	1	5
Enabling Intelligent Interactions between an Agent and an LLM: A Reinforcement Learning Approach	Jun 6, 2023	Decision MakingSequential Decision Making	CodeCode Available	1	5
Adaptive Stress Testing of Trajectory Predictions in Flight Management Systems	Nov 4, 2020	Decision MakingManagement	CodeCode Available	1	5
Breadcrumbs to the Goal: Goal-Conditioned Exploration from Human-in-the-Loop Feedback	Jul 20, 2023	Decision Makingreinforcement-learning	CodeCode Available	1	5
Hybrid Multi-agent Deep Reinforcement Learning for Autonomous Mobility on Demand Systems	Dec 14, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Decision Mamba: Reinforcement Learning via Sequence Modeling with Selective State Spaces	Mar 29, 2024	Decision MakingMamba	CodeCode Available	1	5

Show:10 25 50

← PrevPage 1 of 25Next →

No leaderboard results yet.