Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 180 papers

Title	Date	Tasks	Status	Score
Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling	Jun 16, 2018	Multimodal Emotion RecognitionMultimodal Sentiment Analysis	CodeCode Available	5
Multimodal Speech Emotion Recognition and Ambiguity Resolution	Apr 12, 2019	BIG-bench Machine LearningEmotion Recognition	CodeCode Available	5
Multimodal Speech Emotion Recognition Using Audio and Text	Oct 10, 2018	Emotion ClassificationEmotion Recognition	CodeCode Available	5
Multi Teacher Privileged Knowledge Distillation for Multimodal Expression Recognition	Aug 16, 2024	Emotion RecognitionKnowledge Distillation	CodeCode Available	5
Learning Alignment for Multimodal Emotion Recognition from Speech	Sep 6, 2019	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	5
Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout	Sep 11, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Multimodal End-to-End Group Emotion Recognition using Cross-Modal Attention	Nov 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Multimodal Mixture of Low-Rank Experts for Sentiment Analysis and Emotion Recognition	May 20, 2025	Emotion RecognitionMixture-of-Experts	—Unverified	0
MVP: Multimodal Emotion Recognition based on Video and Physiological Signals	Jan 6, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Noise-Resistant Multimodal Transformer for Emotion Recognition	May 4, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Progressive Modality Reinforcement for Human Multimodal Emotion Recognition From Unaligned Multimodal Sequences	Jun 19, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
PsyCounAssist: A Full-Cycle AI-Powered Psychological Counseling Assistant System	Apr 23, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Revisiting Disentanglement and Fusion on Modality and Context in Conversational Multimodal Emotion Recognition	Aug 8, 2023	Contrastive LearningDisentanglement	—Unverified	0
Revisiting Multimodal Emotion Recognition in Conversation from the Perspective of Graph Spectrum	Apr 27, 2024	Contrastive LearningEmotion Recognition	—Unverified	0
Seamless Multimodal Biometrics for Continuous Personalised Wellbeing Monitoring	Jan 8, 2023	Emotion RecognitionFace Recognition	—Unverified	0
Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors	Nov 8, 2024	Emotion RecognitionFacial Expression Recognition	—Unverified	0
Speech Emotion Recognition Based on Self-Attention Weight Correction for Acoustic and Text Features	Nov 8, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
TACOformer:Token-channel compounded Cross Attention for Multimodal Emotion Recognition	Jun 23, 2023	EEGEmotion Recognition	—Unverified	0
Towards Multimodal Emotion Recognition in German Speech Events in Cars using Transfer Learning	Sep 6, 2019	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion Cause	Mar 30, 2024	Emotion Cause ExtractionEmotion-Cause Pair Extraction	—Unverified	0
Unimodal-driven Distillation in Multimodal Emotion Recognition with Dynamic Fusion	Mar 31, 2025	Emotion RecognitionKnowledge Distillation	—Unverified	0
Using Auxiliary Tasks In Multimodal Fusion Of Wav2vec 2.0 And BERT For Multimodal Emotion Recognition	Feb 27, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Using Large Pre-Trained Models with Cross-Modal Attention for Multi-Modal Emotion Recognition	Aug 22, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Versatile audio-visual learning for emotion recognition	May 12, 2023	Arousal EstimationAttribute	—Unverified	0
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0

Show:10 25 50

← PrevPage 4 of 8Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified