Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 180 papers

Title	Date	Tasks	Status
GSDNet: Revisiting Incomplete Multimodal-Diffusion from Graph Spectrum Perspective for Conversation Emotion Recognition	Jun 14, 2025	Emotion RecognitionModality completion	—Unverified
United we stand, Divided we fall: Handling Weak Complementary Relationships for Audio-Visual Emotion Recognition in Valence-Arousal Space	Mar 15, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
HCAM -- Hierarchical Cross Attention Model for Multi-modal Emotion Recognition	Apr 14, 2023	Emotion ClassificationEmotion Recognition	—Unverified
Hierarchical Audio-Visual Information Fusion with Multi-label Joint Decoding for MER 2023	Sep 11, 2023	Emotion ClassificationEmotion Recognition	—Unverified
ICON: Interactive Conversational Memory Network for Multimodal Emotion Detection	Oct 1, 2018	Emotion RecognitionEmotion Recognition in Conversation	—Unverified
Inconsistency-Aware Cross-Attention for Audio-Visual Fusion in Dimensional Emotion Recognition	May 21, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Interpretability for Multimodal Emotion Recognition using Concept Activation Vectors	Feb 2, 2022	Decision MakingEmotion Recognition	—Unverified
Interpretable Multimodal Emotion Recognition using Facial Features and Physiological Signals	Jun 5, 2023	Emotion ClassificationEmotion Recognition	—Unverified
Multimodal Emotion Recognition on RAVDESS Dataset Using Transfer Learning	Nov 18, 2021	Domain AdaptationEmotion Recognition	—Unverified
Multimodal Emotion Recognition Using Multimodal Deep Learning	Feb 26, 2016	Deep LearningEEG	—Unverified
Multimodal Emotion Recognition using Transfer Learning from Speaker Recognition and BERT-based models	Feb 16, 2022	Data AugmentationEmotional Intelligence	—Unverified
Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout	Sep 11, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Multimodal End-to-End Group Emotion Recognition using Cross-Modal Attention	Nov 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Multimodal Mixture of Low-Rank Experts for Sentiment Analysis and Emotion Recognition	May 20, 2025	Emotion RecognitionMixture-of-Experts	—Unverified
MVP: Multimodal Emotion Recognition based on Video and Physiological Signals	Jan 6, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Noise-Resistant Multimodal Transformer for Emotion Recognition	May 4, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Progressive Modality Reinforcement for Human Multimodal Emotion Recognition From Unaligned Multimodal Sequences	Jun 19, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
PsyCounAssist: A Full-Cycle AI-Powered Psychological Counseling Assistant System	Apr 23, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Revisiting Disentanglement and Fusion on Modality and Context in Conversational Multimodal Emotion Recognition	Aug 8, 2023	Contrastive LearningDisentanglement	—Unverified
Revisiting Multimodal Emotion Recognition in Conversation from the Perspective of Graph Spectrum	Apr 27, 2024	Contrastive LearningEmotion Recognition	—Unverified
Seamless Multimodal Biometrics for Continuous Personalised Wellbeing Monitoring	Jan 8, 2023	Emotion RecognitionFace Recognition	—Unverified
Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors	Nov 8, 2024	Emotion RecognitionFacial Expression Recognition	—Unverified
Speech Emotion Recognition Based on Self-Attention Weight Correction for Acoustic and Text Features	Nov 8, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
TACOformer:Token-channel compounded Cross Attention for Multimodal Emotion Recognition	Jun 23, 2023	EEGEmotion Recognition	—Unverified
Towards Multimodal Emotion Recognition in German Speech Events in Cars using Transfer Learning	Sep 6, 2019	Emotion RecognitionMultimodal Emotion Recognition	—Unverified

Show:10 25 50

← PrevPage 6 of 8Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified