Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 180 papers

Title	Date	Tasks	Status	Hype	Score
Joyful: Joint Modality Fusion and Graph Contrastive Learning for Multimodal Emotion Recognition	Nov 18, 2023	Contrastive LearningEmotion Recognition	CodeCode Available	1	5
Latent Distribution Decoupling: A Probabilistic Framework for Uncertainty-Aware Multimodal Emotion Recognition	Feb 19, 2025	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1	5
FV2ES: A Fully End2End Multimodal System for Fast Yet Effective Video Emotion Recognition Inference	Sep 21, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1	5
GA2MIF: Graph and Attention Based Two-Stage Multi-Source Information Fusion for Conversational Emotion Detection	Jul 25, 2022	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1	5
DialogueRNN: An Attentive RNN for Emotion Detection in Conversations	Nov 1, 2018	Emotion ClassificationEmotion Recognition in Conversation	CodeCode Available	1	5
GPT-4V with Emotion: A Zero-shot Benchmark for Generalized Emotion Recognition	Dec 7, 2023	Emotion RecognitionFacial Emotion Recognition	CodeCode Available	1	5
Attentive Modality Hopping Mechanism for Speech Emotion Recognition	Nov 29, 2019	Emotion ClassificationEmotion Recognition	CodeCode Available	0	5
VISTANet: VIsual Spoken Textual Additive Net for Interpretable Multimodal Emotion Recognition	Aug 24, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Learning Noise-Robust Joint Representation for Multimodal Emotion Recognition under Incomplete Data Scenarios	Sep 21, 2023	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Combining deep and unsupervised features for multilingual speech emotion recognition	Jan 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Investigation of Multimodal Features, Classifiers and Fusion Methods for Emotion Recognition	Sep 13, 2018	Emotion ClassificationEmotion Recognition	CodeCode Available	0	5
Multi-Modal Emotion recognition on IEMOCAP Dataset using Deep Learning	Apr 16, 2018	Deep LearningEmotion Recognition	CodeCode Available	0	5
ICON: Interactive Conversational Memory Network for Multimodal Emotion Detection	Oct 1, 2018	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	0	5
Modality-Collaborative Transformer with Hybrid Feature Reconstruction for Robust Emotion Recognition	Dec 26, 2023	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Multimodal Behavioral Markers Exploring Suicidal Intent in Social Media Videos	Oct 1, 2019	Multimodal Emotion RecognitionMultimodal Sentiment Analysis	CodeCode Available	0	5
Multi-level Fusion of Wav2vec 2.0 and BERT for Multimodal Emotion Recognition	Jul 11, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Multimodal Emotion Recognition Using Deep Canonical Correlation Analysis	Aug 13, 2019	Binary ClassificationEmotion Recognition	CodeCode Available	0	5
Context-Dependent Sentiment Analysis in User-Generated Videos	Jul 1, 2017	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	0	5
TACFN: Transformer-based Adaptive Cross-modal Fusion Network for Multimodal Emotion Recognition	May 10, 2025	Emotion Recognitionfeature selection	CodeCode Available	0	5
End-to-End Multimodal Emotion Recognition using Deep Neural Networks	Apr 27, 2017	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Interpretable Multimodal Emotion Recognition using Hybrid Fusion of Speech and Image Data	Aug 25, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Complementary Fusion of Multi-Features and Multi-Modalities in Sentiment Analysis	Apr 17, 2019	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Textualized and Feature-based Models for Compound Multimodal Emotion Recognition in the Wild	Jul 17, 2024	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Leveraging Contrastive Learning and Self-Training for Multimodal Emotion Recognition with Limited Labeled Samples	Aug 23, 2024	Contrastive LearningEmotion Recognition	CodeCode Available	0	5
Feature-Based Dual Visual Feature Extraction Model for Compound Multimodal Emotion Recognition	Mar 21, 2025	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling	Jun 16, 2018	Multimodal Emotion RecognitionMultimodal Sentiment Analysis	CodeCode Available	0	5
Multimodal Speech Emotion Recognition and Ambiguity Resolution	Apr 12, 2019	BIG-bench Machine LearningEmotion Recognition	CodeCode Available	0	5
Multimodal Speech Emotion Recognition Using Audio and Text	Oct 10, 2018	Emotion ClassificationEmotion Recognition	CodeCode Available	0	5
Multi Teacher Privileged Knowledge Distillation for Multimodal Expression Recognition	Aug 16, 2024	Emotion RecognitionKnowledge Distillation	CodeCode Available	0	5
Learning Alignment for Multimodal Emotion Recognition from Speech	Sep 6, 2019	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout	Sep 11, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
Multimodal End-to-End Group Emotion Recognition using Cross-Modal Attention	Nov 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
Multimodal Mixture of Low-Rank Experts for Sentiment Analysis and Emotion Recognition	May 20, 2025	Emotion RecognitionMixture-of-Experts	—Unverified	0	0
MVP: Multimodal Emotion Recognition based on Video and Physiological Signals	Jan 6, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
Noise-Resistant Multimodal Transformer for Emotion Recognition	May 4, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
Progressive Modality Reinforcement for Human Multimodal Emotion Recognition From Unaligned Multimodal Sequences	Jun 19, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
PsyCounAssist: A Full-Cycle AI-Powered Psychological Counseling Assistant System	Apr 23, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
Revisiting Disentanglement and Fusion on Modality and Context in Conversational Multimodal Emotion Recognition	Aug 8, 2023	Contrastive LearningDisentanglement	—Unverified	0	0
Revisiting Multimodal Emotion Recognition in Conversation from the Perspective of Graph Spectrum	Apr 27, 2024	Contrastive LearningEmotion Recognition	—Unverified	0	0
Seamless Multimodal Biometrics for Continuous Personalised Wellbeing Monitoring	Jan 8, 2023	Emotion RecognitionFace Recognition	—Unverified	0	0
Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors	Nov 8, 2024	Emotion RecognitionFacial Expression Recognition	—Unverified	0	0
Speech Emotion Recognition Based on Self-Attention Weight Correction for Acoustic and Text Features	Nov 8, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
TACOformer:Token-channel compounded Cross Attention for Multimodal Emotion Recognition	Jun 23, 2023	EEGEmotion Recognition	—Unverified	0	0
Towards Multimodal Emotion Recognition in German Speech Events in Cars using Transfer Learning	Sep 6, 2019	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion Cause	Mar 30, 2024	Emotion Cause ExtractionEmotion-Cause Pair Extraction	—Unverified	0	0
Unimodal-driven Distillation in Multimodal Emotion Recognition with Dynamic Fusion	Mar 31, 2025	Emotion RecognitionKnowledge Distillation	—Unverified	0	0
Using Auxiliary Tasks In Multimodal Fusion Of Wav2vec 2.0 And BERT For Multimodal Emotion Recognition	Feb 27, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
Using Large Pre-Trained Models with Cross-Modal Attention for Multi-Modal Emotion Recognition	Aug 22, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0	0
Versatile audio-visual learning for emotion recognition	May 12, 2023	Arousal EstimationAttribute	—Unverified	0	0
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0	0

Show:10 25 50

← PrevPage 2 of 4Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified