Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 180 papers

Title	Date	Tasks	Status	Hype
A cross-modal fusion network based on self-attention and residual structure for multimodal emotion recognition	Nov 3, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
Hypercomplex Multimodal Emotion Recognition from EEG and Peripheral Physiological Signals	Oct 11, 2023	EEGElectroencephalogram (EEG)	CodeCode Available	1
Tracing Intricate Cues in Dialogue: Joint Graph Structure and Sentiment Dynamics for Multimodal Emotion Recognition	Jul 31, 2024	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1
Conversation Understanding using Relational Temporal Graph Neural Networks with Auxiliary Cross-Modality Interaction	Nov 8, 2023	Emotion RecognitionGraph Neural Network	CodeCode Available	1
A proposal for Multimodal Emotion Recognition using aural transformers and Action Units on RAVDESS dataset	Dec 30, 2021	Autonomous DrivingEmotion Recognition	CodeCode Available	1
Predicting emotion from music videos: exploring the relative contribution of visual and auditory information to affective responses	Feb 19, 2022	DescriptiveEmotion Recognition	CodeCode Available	1
Investigating EEG-Based Functional Connectivity Patterns for Multimodal Emotion Recognition	Apr 4, 2020	Brain Computer InterfaceClustering	—Unverified	0
Knowledge-aware Bayesian Co-attention for Multimodal Emotion Recognition	Feb 20, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Leveraging Label Information for Multimodal Emotion Recognition	Sep 5, 2023	Emotion ClassificationEmotion Recognition	—Unverified	0
Leveraging Label Potential for Enhanced Multimodal Emotion Recognition	Apr 7, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
LLM supervised Pre-training for Multimodal Emotion Recognition in Conversations	Jan 20, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
LMR-CBT: Learning Modality-fused Representations with CB-Transformer for Multimodal Emotion Recognition from Unaligned Multimodal Sequences	Dec 3, 2021	Efficient Neural NetworkEmotion Recognition	—Unverified	0
M3ER: Multiplicative Multimodal Emotion Recognition Using Facial, Textual, and Speech Cues	Nov 9, 2019	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
MART: Masked Affective RepresenTation Learning via Masked Temporal Distribution Distillation	Jan 1, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Masked Graph Learning with Recurrent Alignment for Multimodal Emotion Recognition in Conversation	Jul 23, 2024	Emotion RecognitionEmotion Recognition in Conversation	—Unverified	0
MEmoBERT: Pre-training Model with Prompt-based Learning for Multimodal Emotion Recognition	Oct 27, 2021	DiversityEmotion Classification	—Unverified	0
MicroEmo: Time-Sensitive Multimodal Emotion Recognition with Micro-Expression Dynamics in Video Dialogues	Jul 23, 2024	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Modality Influence in Multimodal Machine Learning	Jun 10, 2023	Decision MakingEmotion Recognition	—Unverified	0
Multilevel Transformer For Multimodal Emotion Recognition	Oct 26, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Multimodal Emotion-Cause Pair Extraction in Conversations	Oct 15, 2021	ArticlesEmotion Cause Extraction	—Unverified	0
Multimodal Emotion Recognition among Couples from Lab Settings to Daily Life using Smartwatches	Dec 21, 2022	Emotion RecognitionManagement	—Unverified	0
Multimodal Emotion Recognition and Sentiment Analysis in Multi-Party Conversation Contexts	Mar 9, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Multimodal Emotion Recognition based on Facial Expressions, Speech, and EEG	Jun 11, 2024	EEGEmotion Recognition	—Unverified	0
Multimodal Emotion Recognition by Fusing Video Semantic in MOOC Learning Scenarios	Apr 11, 2024	Emotion RecognitionLanguage Modelling	—Unverified	0
Multi-Modal Emotion Recognition by Text, Speech and Video Using Pretrained Transformers	Feb 11, 2024	DiversityEmotion Recognition	—Unverified	0
Multimodal Emotion Recognition for One-Minute-Gradual Emotion Challenge	May 3, 2018	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Multimodal Affective States Recognition Based on Multiscale CNNs and Biologically Inspired Decision Fusion Model	Nov 29, 2019	EEGElectroencephalogram (EEG)	—Unverified	0
Video Emotion Open-vocabulary Recognition Based on Multimodal Large Language Model	Aug 21, 2024	Emotion RecognitionLanguage Modeling	—Unverified	0
Accommodating Missing Modalities in Time-Continuous Multimodal Emotion Recognition	Nov 16, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
A Comparison of Time-based Models for Multimodal Emotion Recognition	Jun 22, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
A Contextualized Real-Time Multimodal Emotion Recognition for Conversational Agents using Graph Convolutional Networks in Reinforcement Learning	Oct 24, 2023	Emotion ClassificationEmotion Recognition	—Unverified	0
Adversarial Representation with Intra-Modal and Inter-Modal Graph Contrastive Learning for Multimodal Emotion Recognition	Dec 28, 2023	Contrastive LearningEmotion Recognition	—Unverified	0
A Multibias-mitigated and Sentiment Knowledge Enriched Transformer for Debiasing in Multimodal Conversational Emotion Recognition	Jul 17, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
A Multimodal Emotion Recognition System: Integrating Facial Expressions, Body Movement, Speech, and Spoken Language	Dec 23, 2024	DiagnosticEmotion Recognition	—Unverified	0
Analyzing the Influence of Dataset Composition for Emotion Recognition	Mar 5, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
An Audio-Video Deep and Transfer Learning Framework for Multimodal Emotion Recognition in the wild	Oct 7, 2020	Deep LearningEmotion Recognition	—Unverified	0
An Empirical Study and Improvement for Speech Emotion Recognition	Apr 8, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
A Novel Approach to for Multimodal Emotion Recognition : Multimodal semantic information fusion	Feb 12, 2025	Contrastive LearningEmotion Recognition	—Unverified	0
A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition	Jul 15, 2025	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
A Two-Stage Multimodal Emotion Recognition Model Based on Graph Contrastive Learning	Jan 3, 2024	ClassificationContrastive Learning	—Unverified	0
A Unified Transformer-based Network for multimodal Emotion Recognition	Aug 27, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
BeMERC: Behavior-Aware MLLM-based Framework for Multimodal Emotion Recognition in Conversation	Mar 31, 2025	Emotion RecognitionEmotion Recognition in Conversation	—Unverified	0
Bias and Fairness on Multimodal Emotion Detection Algorithms	May 11, 2022	Emotion RecognitionFairness	—Unverified	0
CMATH: Cross-Modality Augmented Transformer with Hierarchical Variational Distillation for Multimodal Emotion Recognition in Conversation	Nov 15, 2024	Emotion RecognitionEmotion Recognition in Conversation	—Unverified	0
COLD Fusion: Calibrated and Ordinal Latent Distribution Fusion for Uncertainty-Aware Multimodal Emotion Recognition	Jun 12, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Context-aware Cascade Attention-based RNN for Video Emotion Recognition	May 30, 2018	DecoderEmotion Classification	—Unverified	0
Context-Dependent Domain Adversarial Neural Network for Multimodal Emotion Recognition	Oct 28, 2020	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Contextual Dependencies in Time-Continuous Multidimensional Affect Recognition	May 1, 2018	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Continuous Multimodal Emotion Recognition Approach for AVEC 2017	Sep 18, 2017	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Continuous-Time Audiovisual Fusion with Recurrence vs. Attention for In-The-Wild Affect Recognition	Mar 24, 2022	Arousal EstimationEmotion Recognition	—Unverified	0

Show:10 25 50

← PrevPage 2 of 4Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified