Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 180 papers

Title	Date	Tasks	Status
UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion Cause	Mar 30, 2024	Emotion Cause ExtractionEmotion-Cause Pair Extraction	—Unverified
Unimodal-driven Distillation in Multimodal Emotion Recognition with Dynamic Fusion	Mar 31, 2025	Emotion RecognitionKnowledge Distillation	—Unverified
Using Auxiliary Tasks In Multimodal Fusion Of Wav2vec 2.0 And BERT For Multimodal Emotion Recognition	Feb 27, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Using Large Pre-Trained Models with Cross-Modal Attention for Multi-Modal Emotion Recognition	Aug 22, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Versatile audio-visual learning for emotion recognition	May 12, 2023	Arousal EstimationAttribute	—Unverified
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified
MULTI-MODAL EMOTION RECOGNITION ON IEMOCAP WITH NEURAL NETWORKS.	Nov 12, 2018	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Multi-Modal Emotion recognition on IEMOCAP Dataset using Deep Learning	Apr 16, 2018	Deep LearningEmotion Recognition	CodeCode Available
Combining deep and unsupervised features for multilingual speech emotion recognition	Jan 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Attentive Modality Hopping Mechanism for Speech Emotion Recognition	Nov 29, 2019	Emotion ClassificationEmotion Recognition	CodeCode Available
VISTANet: VIsual Spoken Textual Additive Net for Interpretable Multimodal Emotion Recognition	Aug 24, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Multimodal Behavioral Markers Exploring Suicidal Intent in Social Media Videos	Oct 1, 2019	Multimodal Emotion RecognitionMultimodal Sentiment Analysis	CodeCode Available
Multimodal Emotion Recognition Using Deep Canonical Correlation Analysis	Aug 13, 2019	Binary ClassificationEmotion Recognition	CodeCode Available
Feature-Based Dual Visual Feature Extraction Model for Compound Multimodal Emotion Recognition	Mar 21, 2025	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Multi-level Fusion of Wav2vec 2.0 and BERT for Multimodal Emotion Recognition	Jul 11, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Modality-Collaborative Transformer with Hybrid Feature Reconstruction for Robust Emotion Recognition	Dec 26, 2023	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Leveraging Contrastive Learning and Self-Training for Multimodal Emotion Recognition with Limited Labeled Samples	Aug 23, 2024	Contrastive LearningEmotion Recognition	CodeCode Available
End-to-End Multimodal Emotion Recognition using Deep Neural Networks	Apr 27, 2017	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Textualized and Feature-based Models for Compound Multimodal Emotion Recognition in the Wild	Jul 17, 2024	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Learning Noise-Robust Joint Representation for Multimodal Emotion Recognition under Incomplete Data Scenarios	Sep 21, 2023	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Complementary Fusion of Multi-Features and Multi-Modalities in Sentiment Analysis	Apr 17, 2019	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling	Jun 16, 2018	Multimodal Emotion RecognitionMultimodal Sentiment Analysis	CodeCode Available
Multimodal Speech Emotion Recognition and Ambiguity Resolution	Apr 12, 2019	BIG-bench Machine LearningEmotion Recognition	CodeCode Available
Multimodal Speech Emotion Recognition Using Audio and Text	Oct 10, 2018	Emotion ClassificationEmotion Recognition	CodeCode Available
Multi Teacher Privileged Knowledge Distillation for Multimodal Expression Recognition	Aug 16, 2024	Emotion RecognitionKnowledge Distillation	CodeCode Available

Show:10 25 50

← PrevPage 7 of 8Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified