Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 180 papers

Title	Date	Tasks	Status
A Multimodal Emotion Recognition System: Integrating Facial Expressions, Body Movement, Speech, and Spoken Language	Dec 23, 2024	DiagnosticEmotion Recognition	—Unverified
Dynamic Graph Neural ODE Network for Multi-modal Emotion Recognition in Conversation	Dec 4, 2024	Emotion RecognitionEmotion Recognition in Conversation	—Unverified
CMATH: Cross-Modality Augmented Transformer with Hierarchical Variational Distillation for Multimodal Emotion Recognition in Conversation	Nov 15, 2024	Emotion RecognitionEmotion Recognition in Conversation	—Unverified
Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors	Nov 8, 2024	Emotion RecognitionFacial Expression Recognition	—Unverified
Early Joint Learning of Emotion Information Makes MultiModal Model Understand You Better	Sep 12, 2024	Emotion RecognitionLanguage Modeling	—Unverified
Multimodal Emotion Recognition with Vision-language Prompting and Modality Dropout	Sep 11, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Leveraging Contrastive Learning and Self-Training for Multimodal Emotion Recognition with Limited Labeled Samples	Aug 23, 2024	Contrastive LearningEmotion Recognition	CodeCode Available
Video Emotion Open-vocabulary Recognition Based on Multimodal Large Language Model	Aug 21, 2024	Emotion RecognitionLanguage Modeling	—Unverified
Multi Teacher Privileged Knowledge Distillation for Multimodal Expression Recognition	Aug 16, 2024	Emotion RecognitionKnowledge Distillation	CodeCode Available
MicroEmo: Time-Sensitive Multimodal Emotion Recognition with Micro-Expression Dynamics in Video Dialogues	Jul 23, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Masked Graph Learning with Recurrent Alignment for Multimodal Emotion Recognition in Conversation	Jul 23, 2024	Emotion RecognitionEmotion Recognition in Conversation	—Unverified
Textualized and Feature-based Models for Compound Multimodal Emotion Recognition in the Wild	Jul 17, 2024	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Enhancing Emotion Recognition in Incomplete Data: A Novel Cross-Modal Alignment, Reconstruction, and Refinement Framework	Jul 12, 2024	Contrastive Learningcross-modal alignment	—Unverified
Multimodal Emotion Recognition based on Facial Expressions, Speech, and EEG	Jun 11, 2024	EEGEmotion Recognition	—Unverified
Inconsistency-Aware Cross-Attention for Audio-Visual Fusion in Dimensional Emotion Recognition	May 21, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Empathy Through Multimodality in Conversational Interfaces	May 8, 2024	Emotional IntelligenceEmotion Recognition	—Unverified
Revisiting Multimodal Emotion Recognition in Conversation from the Perspective of Graph Spectrum	Apr 27, 2024	Contrastive LearningEmotion Recognition	—Unverified
Dynamic Modality and View Selection for Multimodal Emotion Recognition with Missing Modalities	Apr 18, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Deep CNN with late fusion for realtime multimodal emotion recognition	Apr 15, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Multimodal Emotion Recognition by Fusing Video Semantic in MOOC Learning Scenarios	Apr 11, 2024	Emotion RecognitionLanguage Modelling	—Unverified
UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion Cause	Mar 30, 2024	Emotion Cause ExtractionEmotion-Cause Pair Extraction	—Unverified
Multi-Modal Emotion Recognition by Text, Speech and Video Using Pretrained Transformers	Feb 11, 2024	DiversityEmotion Recognition	—Unverified
A Two-Stage Multimodal Emotion Recognition Model Based on Graph Contrastive Learning	Jan 3, 2024	ClassificationContrastive Learning	—Unverified
MART: Masked Affective RepresenTation Learning via Masked Temporal Distribution Distillation	Jan 1, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
Adversarial Representation with Intra-Modal and Inter-Modal Graph Contrastive Learning for Multimodal Emotion Recognition	Dec 28, 2023	Contrastive LearningEmotion Recognition	—Unverified

Show:10 25 50

← PrevPage 4 of 8Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified