SMAC

Bechmarks for Efficient Exploration of Completion of Multi-stage Tasks and Usage of Environmental Factors

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 121 papers

Title	Date	Tasks	Status	Hype
Choices are More Important than Efforts: LLM Enables Efficient Multi-Agent Exploration	Oct 3, 2024	DiversityLanguage Modeling	CodeCode Available	4
LLM-PySC2: Starcraft II learning environment for Large Language Models	Nov 8, 2024	Decision MakingLanguage Modelling	CodeCode Available	2
A New Approach to Solving SMAC Task: Generating Decision Tree Code from Large Language Models	Oct 21, 2024	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2
SMACv2: An Improved Benchmark for Cooperative Multi-Agent Reinforcement Learning	Dec 14, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
ACE: Cooperative Multi-agent Q-learning with Bidirectional Action-Dependency	Nov 29, 2022	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2
Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning	Mar 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning	Jun 9, 2025	counterfactualMulti-agent Reinforcement Learning	CodeCode Available	1
JaxRobotarium: Training and Deploying Multi-Robot Policies in 10 Minutes	May 10, 2025	BenchmarkingGPU	CodeCode Available	1
AVA: Attentive VLM Agent for Mastering StarCraft II	Mar 7, 2025	Retrieval-augmented GenerationSMAC	CodeCode Available	1
An Extended Benchmarking of Multi-Agent Reinforcement Learning Algorithms in Complex Fully Cooperative Tasks	Feb 7, 2025	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	1
SMAC-Hard: Enabling Mixed Opponent Strategy Script and Self-play on SMAC	Dec 23, 2024	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	1
Soft-QMIX: Integrating Maximum Entropy For Monotonic Value Function Factorization	Jun 20, 2024	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Individual Contributions as Intrinsic Exploration Scaffolds for Multi-agent Reinforcement Learning	May 28, 2024	Multi-agent Reinforcement LearningSMAC	CodeCode Available	1
Efficient Multi-agent Reinforcement Learning by Planning	May 20, 2024	Computational EfficiencyModel-based Reinforcement Learning	CodeCode Available	1
FoX: Formation-aware exploration in multi-agent reinforcement learning	Aug 22, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
HomOpt: A Homotopy-Based Hyperparameter Optimization Method	Aug 7, 2023	Bayesian OptimizationHyperparameter Optimization	CodeCode Available	1
Robust multi-agent coordination via evolutionary generation of auxiliary adversarial attackers	May 10, 2023	DiversityMulti-agent Reinforcement Learning	CodeCode Available	1
SMAClite: A Lightweight Environment for Multi-Agent Reinforcement Learning	May 9, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Attacking Cooperative Multi-Agent Reinforcement Learning by Adversarial Minority Influence	Feb 7, 2023	Continuous ControlMuJoCo	CodeCode Available	1
Contrastive Identity-Aware Learning for Multi-Agent Value Decomposition	Nov 23, 2022	Contrastive LearningDiversity	CodeCode Available	1
Latent State Marginalization as a Low-cost Approach for Improving Exploration	Oct 3, 2022	continuous-controlContinuous Control	CodeCode Available	1
Transformer-based Value Function Decomposition for Cooperative Multi-agent Reinforcement Learning in StarCraft	Aug 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Scalable Multi-Agent Model-Based Reinforcement Learning	May 25, 2022	Mambamodel	CodeCode Available	1
Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks	Dec 6, 2021	AllMulti-agent Reinforcement Learning	CodeCode Available	1
SHAQ: Incorporating Shapley Value Theory into Multi-Agent Q-Learning	May 31, 2021	FairnessMulti-agent Reinforcement Learning	CodeCode Available	1
DFAC Framework: Factorizing the Value Function via Quantile Mixture for Multi-Agent Distributional Q-Learning	Feb 16, 2021	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
Rethinking the Implementation Matters in Cooperative Multi-Agent Reinforcement Learning	Feb 6, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
UPDeT: Universal Multi-agent Reinforcement Learning via Policy Decoupling with Transformers	Jan 20, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Is Independent Learning All You Need in the StarCraft Multi-Agent Challenge?	Nov 18, 2020	AllMulti-agent Reinforcement Learning	CodeCode Available	1
Graph Convolutional Value Decomposition in Multi-Agent Reinforcement Learning	Oct 9, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
Deep Implicit Coordination Graphs for Multi-agent Reinforcement Learning	Jun 19, 2020	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	1
FACMAC: Factored Multi-Agent Centralised Policy Gradients	Mar 14, 2020	MuJoCoMulti-agent Reinforcement Learning	CodeCode Available	1
The StarCraft Multi-Agent Challenge	Feb 11, 2019	BenchmarkingMuJoCo	CodeCode Available	1
Generalizable Agent Modeling for Agent Collaboration-Competition Adaptation with Multi-Retrieval and Dynamic Generation	Jun 20, 2025	Multi-agent Reinforcement LearningSMAC	CodeCode Available	0
Ensemble-MIX: Enhancing Sample Efficiency in Multi-Agent RL Using Ensemble Methods	Jun 3, 2025	Ensemble LearningMulti-agent Reinforcement Learning	—Unverified	0
Dynamic Sight Range Selection in Multi-Agent Reinforcement Learning	May 19, 2025	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
POCAII: Parameter Optimization with Conscious Allocation using Iterative Intelligence	May 16, 2025	Hyperparameter OptimizationSMAC	—Unverified	0
Rainbow Delay Compensation: A Multi-Agent Reinforcement Learning Framework for Mitigating Delayed Observation	May 6, 2025	Multi-agent Reinforcement LearningSMAC	—Unverified	0
Learning Generalizable Skills from Offline Multi-Task Data for Multi-Agent Cooperation	Mar 27, 2025	MuJoCoSMAC	CodeCode Available	0
Low-Rank Agent-Specific Adaptation (LoRASA) for Multi-Agent Policy Learning	Feb 8, 2025	MuJoCoMulti-agent Reinforcement Learning	—Unverified	0
Dual Ensembled Multiagent Q-Learning with Hypernet Regularizer	Feb 4, 2025	Q-LearningSMAC	CodeCode Available	0
O-MAPL: Offline Multi-agent Preference Learning	Jan 31, 2025	Reinforcement Learning (RL)SMAC	—Unverified	0
BLAST: A Stealthy Backdoor Leverage Attack against Cooperative Multi-Agent Deep Reinforcement Learning based Systems	Jan 3, 2025	Deep Reinforcement LearningSMAC	—Unverified	0
Offline-to-Online Multi-Agent Reinforcement Learning with Offline Value Function Memory and Sequential Exploration	Oct 25, 2024	Efficient ExplorationMulti-agent Reinforcement Learning	—Unverified	0
A Safety Modulator Actor-Critic Method in Model-Free Safe Reinforcement Learning and Application in UAV Hovering	Oct 9, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified	0
A Spatiotemporal Stealthy Backdoor Attack against Cooperative Multi-Agent Deep Reinforcement Learning	Sep 12, 2024	Backdoor AttackDeep Reinforcement Learning	—Unverified	0
Diffusion-based Episodes Augmentation for Offline Multi-Agent Reinforcement Learning	Aug 23, 2024	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Improving Global Parameter-sharing in Physically Heterogeneous Multi-agent Reinforcement Learning with Unified Action Space	Aug 14, 2024	Multi-agent Reinforcement LearningSMAC	—Unverified	0
QTypeMix: Enhancing Multi-Agent Cooperative Strategies through Heterogeneous and Homogeneous Value Decomposition	Aug 12, 2024	Multi-agent Reinforcement LearningSMAC	CodeCode Available	0
CuDA2: An approach for Incorporating Traitor Agents into Cooperative Multi-Agent Systems	Jun 25, 2024	Adversarial AttackMulti-agent Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets SMAC MMM2 SMAC 3s5z_vs_3s6z SMAC corridor SMAC 6h_vs_8z SMAC 27m_vs_30m SMAC 26m_vs_30m SMAC 3s5z_vs_4s6z SMAC 6h_vs_9z SMAC corridor_2z_vs_24zg SMAC MMM2_7m2M1M_vs_8m4M1M SMAC MMM2_7m2M1M_vs_9m3M1M

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ACE	Median Win Rate	100	—	Unverified
2	DDN	Median Win Rate	97.22	—	Unverified
3	QPLEX	Median Win Rate	96.88	—	Unverified
4	DPLEX	Median Win Rate	96.88	—	Unverified
5	DMIX	Median Win Rate	95.11	—	Unverified
6	QMIX	Median Win Rate	92.44	—	Unverified
7	VDN	Median Win Rate	89.2	—	Unverified
8	DIQL	Median Win Rate	85.23	—	Unverified
9	QMIX	Median Win Rate	69	—	Unverified
10	QMIX	Median Win Rate	69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	Median Win Rate	100	—	Unverified
2	DDN	Median Win Rate	94.03	—	Unverified
3	DMIX	Median Win Rate	91.08	—	Unverified
4	DPLEX	Median Win Rate	90.62	—	Unverified
5	VDN	Median Win Rate	89.2	—	Unverified
6	QPLEX	Median Win Rate	84.38	—	Unverified
7	QMIX	Median Win Rate	67.22	—	Unverified
8	DIQL	Median Win Rate	62.22	—	Unverified
9	IQL	Median Win Rate	29.83	—	Unverified
10	VDN	Median Win Rate	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	Median Win Rate	100	—	Unverified
2	DDN	Median Win Rate	95.4	—	Unverified
3	DIQL	Median Win Rate	91.62	—	Unverified
4	DMIX	Median Win Rate	90.45	—	Unverified
5	VDN	Median Win Rate	85.34	—	Unverified
6	IQL	Median Win Rate	84.87	—	Unverified
7	DPLEX	Median Win Rate	81.25	—	Unverified
8	QPLEX	Median Win Rate	75	—	Unverified
9	QMIX	Median Win Rate	37.61	—	Unverified
10	QMIX	Median Win Rate	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	Median Win Rate	93.75	—	Unverified
2	DDN	Median Win Rate	83.92	—	Unverified
3	DMIX	Median Win Rate	49.43	—	Unverified
4	DPLEX	Median Win Rate	43.75	—	Unverified
5	QPLEX	Average Score	15.95	—	Unverified
6	QMIX	Median Win Rate	12.78	—	Unverified
7	QMIX	Median Win Rate	3	—	Unverified
8	QMIX	Median Win Rate	3	—	Unverified
9	DIQL	Median Win Rate	0	—	Unverified
10	IQL	Median Win Rate	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Median Win Rate	91.48	—	Unverified
2	DPLEX	Median Win Rate	90.62	—	Unverified
3	DMIX	Median Win Rate	85.45	—	Unverified
4	QMIX	Median Win Rate	84.77	—	Unverified
5	QPLEX	Median Win Rate	78.12	—	Unverified
6	VDN	Median Win Rate	63.12	—	Unverified
7	QMIX	Median Win Rate	49	—	Unverified
8	QMIX	Median Win Rate	49	—	Unverified
9	DIQL	Median Win Rate	6.02	—	Unverified
10	IQL	Median Win Rate	2.27	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DMIX	Average Score	19.17	—	Unverified
2	QPLEX	Average Score	18.66	—	Unverified
3	DPLEX	Average Score	18.49	—	Unverified
4	DDN	Average Score	18.49	—	Unverified
5	QMIX	Average Score	18.23	—	Unverified
6	VDN	Average Score	16.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	19.65	—	Unverified
2	DMIX	Average Score	18.61	—	Unverified
3	VDN	Average Score	17.16	—	Unverified
4	DPLEX	Average Score	14.99	—	Unverified
5	QPLEX	Average Score	13.6	—	Unverified
6	QMIX	Average Score	13.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	16	—	Unverified
2	DPLEX	Average Score	14.84	—	Unverified
3	QPLEX	Average Score	13.86	—	Unverified
4	DMIX	Average Score	13.73	—	Unverified
5	VDN	Average Score	13.57	—	Unverified
6	QMIX	Average Score	12.37	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	11.1	—	Unverified
2	DPLEX	Average Score	10.71	—	Unverified
3	VDN	Average Score	7.78	—	Unverified
4	DMIX	Average Score	7.41	—	Unverified
5	QPLEX	Average Score	6.44	—	Unverified
6	QMIX	Average Score	4.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	16.5	—	Unverified
2	DMIX	Average Score	16.24	—	Unverified
3	DPLEX	Average Score	15.89	—	Unverified
4	QPLEX	Average Score	15.52	—	Unverified
5	QMIX	Average Score	14.4	—	Unverified
6	VDN	Average Score	13.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DDN	Average Score	19.45	—	Unverified
2	DPLEX	Average Score	19.4	—	Unverified
3	DMIX	Average Score	19.33	—	Unverified
4	QPLEX	Average Score	19.06	—	Unverified
5	QMIX	Average Score	19.01	—	Unverified
6	VDN	Average Score	17.3	—	Unverified