Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 180 papers

Title	Date	Tasks	Status	Hype	Score
MultiMAE-DER: Multimodal Masked Autoencoder for Dynamic Emotion Recognition	Apr 28, 2024	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1	5
Multimodal Emotion Recognition with Transformer-Based Self Supervised Feature Fusion	Oct 27, 2020	Emotion RecognitionMultimodal Deep Learning	CodeCode Available	1	5
COGMEN: COntextualized GNN based Multimodal Emotion recognitioN	May 5, 2022	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1	5
Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention	Jul 26, 2024	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1	5
Conversation Understanding using Relational Temporal Graph Neural Networks with Auxiliary Cross-Modality Interaction	Nov 8, 2023	Emotion RecognitionGraph Neural Network	CodeCode Available	1	5
Tracing Intricate Cues in Dialogue: Joint Graph Structure and Sentiment Dynamics for Multimodal Emotion Recognition	Jul 31, 2024	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1	5
Multi Teacher Privileged Knowledge Distillation for Multimodal Expression Recognition	Aug 16, 2024	Emotion RecognitionKnowledge Distillation	CodeCode Available	0	5
Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling	Jun 16, 2018	Multimodal Emotion RecognitionMultimodal Sentiment Analysis	CodeCode Available	0	5
Combining deep and unsupervised features for multilingual speech emotion recognition	Jan 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Multimodal Speech Emotion Recognition and Ambiguity Resolution	Apr 12, 2019	BIG-bench Machine LearningEmotion Recognition	CodeCode Available	0	5
Multimodal Speech Emotion Recognition Using Audio and Text	Oct 10, 2018	Emotion ClassificationEmotion Recognition	CodeCode Available	0	5
Multimodal Emotion Recognition Using Deep Canonical Correlation Analysis	Aug 13, 2019	Binary ClassificationEmotion Recognition	CodeCode Available	0	5
Multimodal Behavioral Markers Exploring Suicidal Intent in Social Media Videos	Oct 1, 2019	Multimodal Emotion RecognitionMultimodal Sentiment Analysis	CodeCode Available	0	5
Multi-Modal Emotion recognition on IEMOCAP Dataset using Deep Learning	Apr 16, 2018	Deep LearningEmotion Recognition	CodeCode Available	0	5
Multi-level Fusion of Wav2vec 2.0 and BERT for Multimodal Emotion Recognition	Jul 11, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Complementary Fusion of Multi-Features and Multi-Modalities in Sentiment Analysis	Apr 17, 2019	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Learning Noise-Robust Joint Representation for Multimodal Emotion Recognition under Incomplete Data Scenarios	Sep 21, 2023	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Learning Alignment for Multimodal Emotion Recognition from Speech	Sep 6, 2019	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Leveraging Contrastive Learning and Self-Training for Multimodal Emotion Recognition with Limited Labeled Samples	Aug 23, 2024	Contrastive LearningEmotion Recognition	CodeCode Available	0	5
Interpretable Multimodal Emotion Recognition using Hybrid Fusion of Speech and Image Data	Aug 25, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
Attentive Modality Hopping Mechanism for Speech Emotion Recognition	Nov 29, 2019	Emotion ClassificationEmotion Recognition	CodeCode Available	0	5
Investigation of Multimodal Features, Classifiers and Fusion Methods for Emotion Recognition	Sep 13, 2018	Emotion ClassificationEmotion Recognition	CodeCode Available	0	5
Feature-Based Dual Visual Feature Extraction Model for Compound Multimodal Emotion Recognition	Mar 21, 2025	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
VISTANet: VIsual Spoken Textual Additive Net for Interpretable Multimodal Emotion Recognition	Aug 24, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5
End-to-End Multimodal Emotion Recognition using Deep Neural Networks	Apr 27, 2017	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0	5

Show:10 25 50

← PrevPage 3 of 8Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified