Multi-agent Reinforcement Learning

The target of Multi-agent Reinforcement Learning is to solve complex problems by integrating multiple agents that focus on different sub-tasks. In general, there are two types of multi-agent systems: independent and cooperative systems.

Source: Show, Describe and Conclude: On Exploiting the Structure Information of Chest X-Ray Reports

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 1718 papers

Title	Date	Tasks	Status	Hype
One Step is Enough: Multi-Agent Reinforcement Learning based on One-Step Policy Optimization for Order Dispatch on Ride-Sharing Platforms	Jul 21, 2025	Multi-agent Reinforcement Learning	CodeCode Available	0
A Learning Framework For Cooperative Collision Avoidance of UAV Swarms Leveraging Domain Knowledge	Jul 15, 2025	Collision AvoidanceMulti-agent Reinforcement Learning	—Unverified	0
Artificial Generals Intelligence: Mastering Generals.io with Reinforcement Learning	Jul 9, 2025	GPUMulti-agent Reinforcement Learning	—Unverified	0
SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning	Jun 30, 2025	MathMulti-agent Reinforcement Learning	CodeCode Available	2
The Decrypto Benchmark for Multi-Agent Reasoning and Theory of Mind	Jun 25, 2025	Multi-agent Reinforcement LearningNavigate	CodeCode Available	1
Center of Gravity-Guided Focusing Influence Mechanism for Multi-Agent Reinforcement Learning	Jun 24, 2025	counterfactualMulti-agent Reinforcement Learning	—Unverified	0
Learning Bilateral Team Formation in Cooperative Multi-Agent Reinforcement Learning	Jun 24, 2025	Multi-agent Reinforcement Learning	—Unverified	0
Transformer World Model for Sample Efficient Multi-Agent Reinforcement Learning	Jun 23, 2025	Multi-agent Reinforcement LearningStarcraft	CodeCode Available	0
Generalizable Agent Modeling for Agent Collaboration-Competition Adaptation with Multi-Retrieval and Dynamic Generation	Jun 20, 2025	Multi-agent Reinforcement LearningSMAC	CodeCode Available	0
Multi-Agent Reinforcement Learning for Autonomous Multi-Satellite Earth Observation: A Realistic Case Study	Jun 18, 2025	Earth ObservationManagement	—Unverified	0
Light Aircraft Game : Basic Implementation and training results analysis	Jun 17, 2025	Multi-agent Reinforcement Learning	CodeCode Available	0
Dynamic Reinsurance Treaty Bidding via Multi-Agent Reinforcement Learning	Jun 16, 2025	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
MARCO: Hardware-Aware Neural Architecture Search for Edge Devices with Multi-Agent Reinforcement Learning and Conformal Prediction Filtering	Jun 16, 2025	Conformal PredictionHardware Aware Neural Architecture Search	—Unverified	0
Homeostatic Coupling for Prosocial Behavior	Jun 15, 2025	Multi-agent Reinforcement Learning	—Unverified	0
Wasserstein-Barycenter Consensus for Cooperative Multi-Agent Reinforcement Learning	Jun 14, 2025	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Trust-MARL: Trust-Based Multi-Agent Reinforcement Learning Framework for Cooperative On-Ramp Merging Control in Heterogeneous Traffic Flow	Jun 14, 2025	Multi-agent Reinforcement Learning	—Unverified	0
Multi-Agent Language Models: Advancing Cooperation, Coordination, and Adaptation	Jun 11, 2025	Multi-agent Reinforcement Learning	—Unverified	0
When Is Diversity Rewarded in Cooperative Multi-Agent Learning?	Jun 11, 2025	DiversityMulti-agent Reinforcement Learning	—Unverified	0
Chasing Moving Targets with Online Self-Play Reinforcement Learning for Safer Language Models	Jun 9, 2025	Multi-agent Reinforcement LearningSafety Alignment	CodeCode Available	1
Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning	Jun 9, 2025	counterfactualMulti-agent Reinforcement Learning	CodeCode Available	1
Decentralizing Multi-Agent Reinforcement Learning with Temporal Causal Information	Jun 9, 2025	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Ego-centric Learning of Communicative World Models for Autonomous Driving	Jun 9, 2025	Autonomous DrivingMulti-agent Reinforcement Learning	—Unverified	0
Learn as Individuals, Evolve as a Team: Multi-agent LLMs Adaptation in Embodied Environments	Jun 8, 2025	Multi-agent Reinforcement Learning	—Unverified	0
Policy Optimization for Continuous-time Linear-Quadratic Graphon Mean Field Games	Jun 6, 2025	Bilevel OptimizationMulti-agent Reinforcement Learning	—Unverified	0
A MARL-based Approach for Easing MAS Organization Engineering	Jun 5, 2025	Multi-agent Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 1 of 69Next →

All datasets ParticleEnvs Cooperative Communication SMAC-Exp UAV Logistics

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MATD3	final agent reward	-14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DRIMA	Median Win Rate	15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fusion-Multi-Actor-Attention-Critic	Average Reward	39	—	Unverified