Multi-agent Reinforcement Learning

The target of Multi-agent Reinforcement Learning is to solve complex problems by integrating multiple agents that focus on different sub-tasks. In general, there are two types of multi-agent systems: independent and cooperative systems.

Source: Show, Describe and Conclude: On Exploiting the Structure Information of Chest X-Ray Reports

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1718 papers

Title	Date	Tasks	Status	Hype
Multi-Agent Reinforcement Learning for Autonomous Driving: A Survey	Aug 19, 2024	Autonomous DrivingDecision Making	CodeCode Available	5
SigmaRL: A Sample-Efficient and Generalizable Multi-Agent Reinforcement Learning Framework for Motion Planning	Aug 14, 2024	CPUMotion Planning	CodeCode Available	4
Unreal-MAP: Unreal-Engine-Based General Platform for Multi-Agent Reinforcement Learning	Mar 20, 2025	Multi-agent Reinforcement Learning	CodeCode Available	3
Dispelling the Mirage of Progress in Offline MARL through Standardised Baselines and Evaluation	Jun 13, 2024	Multi-agent Reinforcement Learning	CodeCode Available	3
On the Use and Misuse of Absorbing States in Multi-agent Reinforcement Learning	Nov 10, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	3
MARLlib: A Scalable and Efficient Multi-agent Reinforcement Learning Library	Oct 11, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	3
SustainDC: Benchmarking for Sustainable Data Center Control	Aug 14, 2024	BenchmarkingManagement	CodeCode Available	2
SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning	Jun 30, 2025	MathMulti-agent Reinforcement Learning	CodeCode Available	2
AdaSociety: An Adaptive Environment with Social Structures for Multi-Agent Decision-Making	Nov 6, 2024	Decision MakingDiversity	CodeCode Available	2
Multi-Agent Reinforcement Learning is a Sequence Modeling Problem	May 30, 2022	Decision MakingMuJoCo	CodeCode Available	2
ZSC-Eval: An Evaluation Toolkit and Benchmark for Multi-agent Zero-shot Coordination	Oct 8, 2023	DiversityMulti-agent Reinforcement Learning	CodeCode Available	2
SocialJax: An Evaluation Suite for Multi-agent Reinforcement Learning in Sequential Social Dilemmas	Mar 18, 2025	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
Tactics2D: A Highly Modular and Extensible Simulator for Driving Decision-making	Nov 18, 2023	Autonomous DrivingDecision Making	CodeCode Available	2
PettingZoo: Gym for Multi-Agent Reinforcement Learning	Sep 30, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
Mini Honor of Kings: A Lightweight Environment for Multi-Agent Reinforcement Learning	Jun 6, 2024	Multi-agent Reinforcement Learning	CodeCode Available	2
Off-the-Grid MARL: Datasets with Baselines for Offline Multi-Agent Reinforcement Learning	Feb 1, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks	Aug 20, 2024	Multi-agent Reinforcement LearningMulti-Task Learning	CodeCode Available	2
Heterogeneous-Agent Reinforcement Learning	Apr 19, 2023	LEMMAMulti-agent Reinforcement Learning	CodeCode Available	2
MAexp: A Generic Platform for RL-based Multi-Agent Exploration	Apr 19, 2024	DiversityMulti-agent Reinforcement Learning	CodeCode Available	2
MetaDrive: Composing Diverse Driving Scenarios for Generalizable Reinforcement Learning	Sep 26, 2021	BenchmarkingDecision Making	CodeCode Available	2
Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning	Mar 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
Multi-Agent Reinforcement Learning for Resources Allocation Optimization: A Survey	Apr 29, 2025	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2
Pareto Actor-Critic for Equilibrium Selection in Multi-Agent Reinforcement Learning	Sep 28, 2022	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	2
Safe Multi-Agent Reinforcement Learning with Bilevel Optimization in Autonomous Driving	May 28, 2024	Autonomous DrivingBilevel Optimization	CodeCode Available	2
SMACv2: An Improved Benchmark for Cooperative Multi-Agent Reinforcement Learning	Dec 14, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for Autonomous Driving	Oct 19, 2020	Autonomous DrivingMulti-agent Reinforcement Learning	CodeCode Available	2
Improving Retrieval-Augmented Generation through Multi-Agent Reinforcement Learning	Jan 25, 2025	Answer GenerationMulti-agent Reinforcement Learning	CodeCode Available	2
Digital Twin Vehicular Edge Computing Network: Task Offloading and Resource Allocation	Jul 16, 2024	Edge-computingMulti-agent Reinforcement Learning	CodeCode Available	2
VMAS: A Vectorized Multi-Agent Simulator for Collective Robot Learning	Jul 7, 2022	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	2
ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning	Mar 12, 2025	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	2
DouZero: Mastering DouDizhu with Self-Play Deep Reinforcement Learning	Jun 11, 2021	Card GamesDeep Reinforcement Learning	CodeCode Available	2
Deep Reinforcement Learning for Multi-Agent Interaction	Aug 2, 2022	BIG-bench Machine LearningCausal Inference	CodeCode Available	2
Coordinate-Aligned Multi-Camera Collaboration for Active Multi-Object Tracking	Feb 22, 2022	Multi-agent Reinforcement LearningMulti-Object Tracking	CodeCode Available	2
Developing A Multi-Agent and Self-Adaptive Framework with Deep Reinforcement Learning for Dynamic Portfolio Risk Management	Feb 1, 2024	Deep Reinforcement LearningManagement	CodeCode Available	2
Emergent Reciprocity and Team Formation from Randomized Uncertain Social Preferences	Nov 10, 2020	Multi-agent Reinforcement Learning	CodeCode Available	2
Ensembling Prioritized Hybrid Policies for Multi-agent Pathfinding	Mar 12, 2024	Multi-Agent Path FindingMulti-agent Reinforcement Learning	CodeCode Available	2
Heterogeneous Multi-Robot Reinforcement Learning	Jan 17, 2023	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	2
A New Approach to Solving SMAC Task: Generating Decision Tree Code from Large Language Models	Oct 21, 2024	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2
JaxMARL: Multi-Agent RL Environments and Algorithms in JAX	Nov 16, 2023	CPUGPU	CodeCode Available	2
Learning to Fly -- a Gym Environment with PyBullet Physics for Reinforcement Learning of Multi-agent Quadcopter Control	Mar 3, 2021	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	2
Efficient Episodic Memory Utilization of Cooperative Multi-Agent Reinforcement Learning	Mar 2, 2024	DecoderMulti-agent Reinforcement Learning	CodeCode Available	2
Maximum Entropy Heterogeneous-Agent Reinforcement Learning	Jun 19, 2023	MuJoCoMulti-agent Reinforcement Learning	CodeCode Available	2
ACE: Cooperative Multi-agent Q-learning with Bidirectional Action-Dependency	Nov 29, 2022	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	2
MOMAland: A Set of Benchmarks for Multi-Objective Multi-Agent Reinforcement Learning	Jul 23, 2024	BenchmarkingDecision Making	CodeCode Available	2
IntersectionZoo: Eco-driving for Benchmarking Multi-Agent Contextual Reinforcement Learning	Oct 19, 2024	BenchmarkingMulti-agent Reinforcement Learning	CodeCode Available	2
A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in Online Advertising	Jun 11, 2021	Multi-agent Reinforcement Learning	CodeCode Available	1
A Constrained Multi-Agent Reinforcement Learning Approach to Autonomous Traffic Signal Control	Mar 30, 2025	FairnessMulti-agent Reinforcement Learning	CodeCode Available	1
Cooperation and Fairness in Multi-Agent Reinforcement Learning	Oct 19, 2024	FairnessMulti-agent Reinforcement Learning	CodeCode Available	1
Contrastive Identity-Aware Learning for Multi-Agent Value Decomposition	Nov 23, 2022	Contrastive LearningDiversity	CodeCode Available	1
Context-aware Communication for Multi-agent Reinforcement Learning	Dec 25, 2023	Multi-agent Reinforcement LearningQuantization	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 35Next →

All datasets ParticleEnvs Cooperative Communication SMAC-Exp UAV Logistics

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MATD3	final agent reward	-14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DRIMA	Median Win Rate	15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fusion-Multi-Actor-Attention-Critic	Average Reward	39	—	Unverified