SMAC

Bechmarks for Efficient Exploration of Completion of Multi-stage Tasks and Usage of Environmental Factors

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 121 papers

Title	Date	Tasks	Status	Hype
Choices are More Important than Efforts: LLM Enables Efficient Multi-Agent Exploration	Oct 3, 2024	DiversityLanguage Modeling	CodeCode Available	4
Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning	Mar 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
SMACv2: An Improved Benchmark for Cooperative Multi-Agent Reinforcement Learning	Dec 14, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
A New Approach to Solving SMAC Task: Generating Decision Tree Code from Large Language Models	Oct 21, 2024	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2
ACE: Cooperative Multi-agent Q-learning with Bidirectional Action-Dependency	Nov 29, 2022	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2
LLM-PySC2: Starcraft II learning environment for Large Language Models	Nov 8, 2024	Decision MakingLanguage Modelling	CodeCode Available	2
Is Independent Learning All You Need in the StarCraft Multi-Agent Challenge?	Nov 18, 2020	AllMulti-agent Reinforcement Learning	CodeCode Available	1
Efficient Multi-agent Reinforcement Learning by Planning	May 20, 2024	Computational EfficiencyModel-based Reinforcement Learning	CodeCode Available	1
SHAQ: Incorporating Shapley Value Theory into Multi-Agent Q-Learning	May 31, 2021	FairnessMulti-agent Reinforcement Learning	CodeCode Available	1
Attacking Cooperative Multi-Agent Reinforcement Learning by Adversarial Minority Influence	Feb 7, 2023	Continuous ControlMuJoCo	CodeCode Available	1
JaxRobotarium: Training and Deploying Multi-Robot Policies in 10 Minutes	May 10, 2025	BenchmarkingGPU	CodeCode Available	1
SMAC-Hard: Enabling Mixed Opponent Strategy Script and Self-play on SMAC	Dec 23, 2024	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	1
Individual Contributions as Intrinsic Exploration Scaffolds for Multi-agent Reinforcement Learning	May 28, 2024	Multi-agent Reinforcement LearningSMAC	CodeCode Available	1
Robust multi-agent coordination via evolutionary generation of auxiliary adversarial attackers	May 10, 2023	DiversityMulti-agent Reinforcement Learning	CodeCode Available	1
AVA: Attentive VLM Agent for Mastering StarCraft II	Mar 7, 2025	Retrieval-augmented GenerationSMAC	CodeCode Available	1
Graph Convolutional Value Decomposition in Multi-Agent Reinforcement Learning	Oct 9, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
SMAClite: A Lightweight Environment for Multi-Agent Reinforcement Learning	May 9, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
An Extended Benchmarking of Multi-Agent Reinforcement Learning Algorithms in Complex Fully Cooperative Tasks	Feb 7, 2025	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	1
The StarCraft Multi-Agent Challenge	Feb 11, 2019	BenchmarkingMuJoCo	CodeCode Available	1
UPDeT: Universal Multi-agent Reinforcement Learning via Policy Decoupling with Transformers	Jan 20, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Contrastive Identity-Aware Learning for Multi-Agent Value Decomposition	Nov 23, 2022	Contrastive LearningDiversity	CodeCode Available	1
FoX: Formation-aware exploration in multi-agent reinforcement learning	Aug 22, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Scalable Multi-Agent Model-Based Reinforcement Learning	May 25, 2022	Mambamodel	CodeCode Available	1
Latent State Marginalization as a Low-cost Approach for Improving Exploration	Oct 3, 2022	continuous-controlContinuous Control	CodeCode Available	1
Rethinking the Implementation Matters in Cooperative Multi-Agent Reinforcement Learning	Feb 6, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning	Jun 9, 2025	counterfactualMulti-agent Reinforcement Learning	CodeCode Available	1
DFAC Framework: Factorizing the Value Function via Quantile Mixture for Multi-Agent Distributional Q-Learning	Feb 16, 2021	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
HomOpt: A Homotopy-Based Hyperparameter Optimization Method	Aug 7, 2023	Bayesian OptimizationHyperparameter Optimization	CodeCode Available	1
Deep Implicit Coordination Graphs for Multi-agent Reinforcement Learning	Jun 19, 2020	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	1
FACMAC: Factored Multi-Agent Centralised Policy Gradients	Mar 14, 2020	MuJoCoMulti-agent Reinforcement Learning	CodeCode Available	1
Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks	Dec 6, 2021	AllMulti-agent Reinforcement Learning	CodeCode Available	1
Soft-QMIX: Integrating Maximum Entropy For Monotonic Value Function Factorization	Jun 20, 2024	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Transformer-based Value Function Decomposition for Cooperative Multi-agent Reinforcement Learning in StarCraft	Aug 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Automated classification of pre-defined movement patterns: A comparison between GNSS and UWB technology	Mar 10, 2023	SMACSMAC+	—Unverified	0
Innate-Values-driven Reinforcement Learning based Cooperative Multi-Agent Cognitive Modeling	Jan 10, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
CuDA2: An approach for Incorporating Traitor Agents into Cooperative Multi-Agent Systems	Jun 25, 2024	Adversarial AttackMulti-agent Reinforcement Learning	—Unverified	0
Aligning Individual and Collective Objectives in Multi-Agent Cooperation	Feb 19, 2024	SMACSMAC+	—Unverified	0
Coordinated Multi-Agent Exploration Using Shared Goals	Jan 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Cooperative Exploration for Multi-Agent Deep Reinforcement Learning	Jul 23, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Comparative study of Hyper-Parameter Optimization Tools	Jan 17, 2022	Bayesian OptimizationBenchmarking	—Unverified	0
Improving Global Parameter-sharing in Physically Heterogeneous Multi-agent Reinforcement Learning with Unified Action Space	Aug 14, 2024	Multi-agent Reinforcement LearningSMAC	—Unverified	0
A Spatiotemporal Stealthy Backdoor Attack against Cooperative Multi-Agent Deep Reinforcement Learning	Sep 12, 2024	Backdoor AttackDeep Reinforcement Learning	—Unverified	0
Fast Optimization of Wildfire Suppression Policies with SMAC	Mar 28, 2017	ManagementSMAC	—Unverified	0
Exploiting Semantic Epsilon Greedy Exploration Strategy in Multi-Agent Reinforcement Learning	Jan 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Contextual Transformer for Offline Meta Reinforcement Learning	Nov 15, 2022	D4RLMeta Reinforcement Learning	—Unverified	0
How much can change in a year? Revisiting Evaluation in Multi-Agent Reinforcement Learning	Dec 13, 2023	Multi-agent Reinforcement LearningSMAC	—Unverified	0
Ensemble-MIX: Enhancing Sample Efficiency in Multi-Agent RL Using Ensemble Methods	Jun 3, 2025	Ensemble LearningMulti-agent Reinforcement Learning	—Unverified	0
Enabling Multi-Agent Transfer Reinforcement Learning via Scenario Independent Representation	Feb 13, 2024	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Heterogeneous Multi-Agent Reinforcement Learning for Zero-Shot Scalable Collaboration	Apr 5, 2024	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Characterization of neighborhood behaviours in a multi-neighborhood local search algorithm	Mar 12, 2016	SMACSMAC+	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets SMAC MMM2 SMAC 3s5z_vs_3s6z SMAC corridor SMAC 6h_vs_8z SMAC 27m_vs_30m SMAC 26m_vs_30m SMAC 3s5z_vs_4s6z SMAC 6h_vs_9z SMAC corridor_2z_vs_24zg SMAC MMM2_7m2M1M_vs_8m4M1M SMAC MMM2_7m2M1M_vs_9m3M1M

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ACE	Median Win Rate	100	—	Unverified
2	DDN	Median Win Rate	97.22	—	Unverified
3	DPLEX	Median Win Rate	96.88	—	Unverified
4	QPLEX	Median Win Rate	96.88	—	Unverified
5	DMIX	Median Win Rate	95.11	—	Unverified
6	QMIX	Median Win Rate	92.44	—	Unverified
7	VDN	Median Win Rate	89.2	—	Unverified
8	DIQL	Median Win Rate	85.23	—	Unverified
9	QMIX	Median Win Rate	69	—	Unverified
10	QMIX	Median Win Rate	69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	Median Win Rate	100	—	Unverified
2	DDN	Median Win Rate	94.03	—	Unverified
3	DMIX	Median Win Rate	91.08	—	Unverified
4	DPLEX	Median Win Rate	90.62	—	Unverified
5	VDN	Median Win Rate	89.2	—	Unverified
6	QPLEX	Median Win Rate	84.38	—	Unverified
7	QMIX	Median Win Rate	67.22	—	Unverified
8	DIQL	Median Win Rate	62.22	—	Unverified
9	IQL	Median Win Rate	29.83	—	Unverified
10	QMIX	Median Win Rate	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	Median Win Rate	100	—	Unverified
2	DDN	Median Win Rate	95.4	—	Unverified
3	DIQL	Median Win Rate	91.62	—	Unverified
4	DMIX	Median Win Rate	90.45	—	Unverified
5	VDN	Median Win Rate	85.34	—	Unverified
6	IQL	Median Win Rate	84.87	—	Unverified
7	DPLEX	Median Win Rate	81.25	—	Unverified
8	QPLEX	Median Win Rate	75	—	Unverified
9	QMIX	Median Win Rate	37.61	—	Unverified
10	QMIX	Median Win Rate	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	Median Win Rate	93.75	—	Unverified
2	DDN	Median Win Rate	83.92	—	Unverified
3	DMIX	Median Win Rate	49.43	—	Unverified
4	DPLEX	Median Win Rate	43.75	—	Unverified
5	QPLEX	Average Score	15.95	—	Unverified
6	QMIX	Median Win Rate	12.78	—	Unverified
7	QMIX	Median Win Rate	3	—	Unverified
8	QMIX	Median Win Rate	3	—	Unverified
9	Heuristic	Median Win Rate	0	—	Unverified
10	VDN	Median Win Rate	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Median Win Rate	91.48	—	Unverified
2	DPLEX	Median Win Rate	90.62	—	Unverified
3	DMIX	Median Win Rate	85.45	—	Unverified
4	QMIX	Median Win Rate	84.77	—	Unverified
5	QPLEX	Median Win Rate	78.12	—	Unverified
6	VDN	Median Win Rate	63.12	—	Unverified
7	QMIX	Median Win Rate	49	—	Unverified
8	QMIX	Median Win Rate	49	—	Unverified
9	DIQL	Median Win Rate	6.02	—	Unverified
10	IQL	Median Win Rate	2.27	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DMIX	Average Score	19.17	—	Unverified
2	QPLEX	Average Score	18.66	—	Unverified
3	DDN	Average Score	18.49	—	Unverified
4	DPLEX	Average Score	18.49	—	Unverified
5	QMIX	Average Score	18.23	—	Unverified
6	VDN	Average Score	16.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	19.65	—	Unverified
2	DMIX	Average Score	18.61	—	Unverified
3	VDN	Average Score	17.16	—	Unverified
4	DPLEX	Average Score	14.99	—	Unverified
5	QPLEX	Average Score	13.6	—	Unverified
6	QMIX	Average Score	13.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	16	—	Unverified
2	DPLEX	Average Score	14.84	—	Unverified
3	QPLEX	Average Score	13.86	—	Unverified
4	DMIX	Average Score	13.73	—	Unverified
5	VDN	Average Score	13.57	—	Unverified
6	QMIX	Average Score	12.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	11.1	—	Unverified
2	DPLEX	Average Score	10.71	—	Unverified
3	VDN	Average Score	7.78	—	Unverified
4	DMIX	Average Score	7.41	—	Unverified
5	QPLEX	Average Score	6.44	—	Unverified
6	QMIX	Average Score	4.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	16.5	—	Unverified
2	DMIX	Average Score	16.24	—	Unverified
3	DPLEX	Average Score	15.89	—	Unverified
4	QPLEX	Average Score	15.52	—	Unverified
5	QMIX	Average Score	14.4	—	Unverified
6	VDN	Average Score	13.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	19.45	—	Unverified
2	DPLEX	Average Score	19.4	—	Unverified
3	DMIX	Average Score	19.33	—	Unverified
4	QPLEX	Average Score	19.06	—	Unverified
5	QMIX	Average Score	19.01	—	Unverified
6	VDN	Average Score	17.3	—	Unverified