Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 180 papers

Title	Date	Tasks	Status	Hype
CSAT‑FTCN: A Fuzzy‑Oriented Model with Contextual Self‑attention Network for Multimodal Emotion Recognition	Jan 31, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Seamless Multimodal Biometrics for Continuous Personalised Wellbeing Monitoring	Jan 8, 2023	Emotion RecognitionFace Recognition	—Unverified	0
Emotion Recognition with Pre-Trained Transformers Using Multimodal Signals	Dec 22, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Multimodal Emotion Recognition among Couples from Lab Settings to Daily Life using Smartwatches	Dec 21, 2022	Emotion RecognitionManagement	—Unverified	0
FAF: A novel multimodal emotion recognition approach integrating face, body and text	Nov 20, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Speech Emotion Recognition Based on Self-Attention Weight Correction for Acoustic and Text Features	Nov 8, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Multimodal Information Bottleneck: Learning Minimal Sufficient Unimodal and Multimodal Representations	Oct 31, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
Exploiting modality-invariant feature for robust multimodal emotion recognition with missing modalities	Oct 27, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
Multilevel Transformer For Multimodal Emotion Recognition	Oct 26, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
FV2ES: A Fully End2End Multimodal System for Fast Yet Effective Video Emotion Recognition Inference	Sep 21, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
Interpretable Multimodal Emotion Recognition using Hybrid Fusion of Speech and Image Data	Aug 25, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0
VISTANet: VIsual Spoken Textual Additive Net for Interpretable Multimodal Emotion Recognition	Aug 24, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0
GA2MIF: Graph and Attention Based Two-Stage Multi-Source Information Fusion for Conversational Emotion Detection	Jul 25, 2022	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1
Multimodal Emotion Recognition with Modality-Pairwise Unsupervised Contrastive Loss	Jul 23, 2022	Cultural Vocal Bursts Intensity PredictionEmotion Recognition	CodeCode Available	1
A Multibias-mitigated and Sentiment Knowledge Enriched Transformer for Debiasing in Multimodal Conversational Emotion Recognition	Jul 17, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Multi-level Fusion of Wav2vec 2.0 and BERT for Multimodal Emotion Recognition	Jul 11, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0
GraphCFC: A Directed Graph Based Cross-Modal Feature Complementation Approach for Multimodal Conversational Emotion Recognition	Jul 6, 2022	Emotion ClassificationEmotion Recognition	CodeCode Available	1
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0
COLD Fusion: Calibrated and Ordinal Latent Distribution Fusion for Uncertainty-Aware Multimodal Emotion Recognition	Jun 12, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Do Multimodal Emotion Recognition Models Tackle Ambiguity?	Jun 1, 2022	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Bias and Fairness on Multimodal Emotion Detection Algorithms	May 11, 2022	Emotion RecognitionFairness	—Unverified	0
COGMEN: COntextualized GNN based Multimodal Emotion recognitioN	May 5, 2022	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1
MMER: Multimodal Multi-task Learning for Speech Emotion Recognition	Mar 31, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
A Joint Cross-Attention Model for Audio-Visual Fusion in Dimensional Emotion Recognition	Mar 28, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
Continuous-Time Audiovisual Fusion with Recurrence vs. Attention for In-The-Wild Affect Recognition	Mar 24, 2022	Arousal EstimationEmotion Recognition	—Unverified	0
Predicting emotion from music videos: exploring the relative contribution of visual and auditory information to affective responses	Feb 19, 2022	DescriptiveEmotion Recognition	CodeCode Available	1
Multimodal Emotion Recognition using Transfer Learning from Speaker Recognition and BERT-based models	Feb 16, 2022	Data AugmentationEmotional Intelligence	—Unverified	0
Interpretability for Multimodal Emotion Recognition using Concept Activation Vectors	Feb 2, 2022	Decision MakingEmotion Recognition	—Unverified	0
Group Gated Fusion on Attention-based Bidirectional Alignment for Multimodal Emotion Recognition	Jan 17, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
A proposal for Multimodal Emotion Recognition using aural transformers and Action Units on RAVDESS dataset	Dec 30, 2021	Autonomous DrivingEmotion Recognition	CodeCode Available	1
Shapes of Emotions: Multimodal Emotion Recognition in Conversations via Emotion Shifts	Dec 3, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
LMR-CBT: Learning Modality-fused Representations with CB-Transformer for Multimodal Emotion Recognition from Unaligned Multimodal Sequences	Dec 3, 2021	Efficient Neural NetworkEmotion Recognition	—Unverified	0
Multimodal Emotion Recognition on RAVDESS Dataset Using Transfer Learning	Nov 18, 2021	Domain AdaptationEmotion Recognition	—Unverified	0
Multimodal End-to-End Group Emotion Recognition using Cross-Modal Attention	Nov 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Cross Attentional Audio-Visual Fusion for Dimensional Emotion Recognition	Nov 9, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
A cross-modal fusion network based on self-attention and residual structure for multimodal emotion recognition	Nov 3, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
MEmoBERT: Pre-training Model with Prompt-based Learning for Multimodal Emotion Recognition	Oct 27, 2021	DiversityEmotion Classification	—Unverified	0
Multimodal Emotion-Cause Pair Extraction in Conversations	Oct 15, 2021	ArticlesEmotion Cause Extraction	—Unverified	0
Multimodal Emotion Recognition with High-level Speech and Text Features	Sep 29, 2021	DisentanglementEmotion Recognition	CodeCode Available	1
Using Large Pre-Trained Models with Cross-Modal Attention for Multi-Modal Emotion Recognition	Aug 22, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Progressive Modality Reinforcement for Human Multimodal Emotion Recognition From Unaligned Multimodal Sequences	Jun 19, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Analyzing the Influence of Dataset Composition for Emotion Recognition	Mar 5, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Combining deep and unsupervised features for multilingual speech emotion recognition	Jan 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0
MSAF: Multimodal Split Attention Fusion	Dec 13, 2020	Action RecognitionEmotion Recognition	CodeCode Available	1
Context-Dependent Domain Adversarial Neural Network for Multimodal Emotion Recognition	Oct 28, 2020	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Emotion recognition by fusing time synchronous and time asynchronous representations	Oct 27, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multimodal Emotion Recognition with Transformer-Based Self Supervised Feature Fusion	Oct 27, 2020	Emotion RecognitionMultimodal Deep Learning	CodeCode Available	1
An Audio-Video Deep and Transfer Learning Framework for Multimodal Emotion Recognition in the wild	Oct 7, 2020	Deep LearningEmotion Recognition	—Unverified	0
Modality-Transferable Emotion Embeddings for Low-Resource Multimodal Emotion Recognition	Sep 21, 2020	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
Jointly Fine-Tuning “BERT-like” Self Supervised Models to Improve Multimodal Speech Emotion Recognition	Aug 15, 2020	Emotion RecognitionMultimodal Deep Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 4Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified