Multimodal Emotion Recognition

This is a leaderboard for multimodal emotion recognition on the IEMOCAP dataset. The modality abbreviations are A: Acoustic T: Text V: Visual

Please include the modality in the bracket after the model name.

All models must use standard five emotion categories and are evaluated in standard leave-one-session-out (LOSO). See the papers for references.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 180 papers

Title	Date	Tasks	Status	Hype
Predicting emotion from music videos: exploring the relative contribution of visual and auditory information to affective responses	Feb 19, 2022	DescriptiveEmotion Recognition	CodeCode Available	1
Multimodal Emotion Recognition using Transfer Learning from Speaker Recognition and BERT-based models	Feb 16, 2022	Data AugmentationEmotional Intelligence	—Unverified	0
Interpretability for Multimodal Emotion Recognition using Concept Activation Vectors	Feb 2, 2022	Decision MakingEmotion Recognition	—Unverified	0
Group Gated Fusion on Attention-based Bidirectional Alignment for Multimodal Emotion Recognition	Jan 17, 2022	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
A proposal for Multimodal Emotion Recognition using aural transformers and Action Units on RAVDESS dataset	Dec 30, 2021	Autonomous DrivingEmotion Recognition	CodeCode Available	1
Shapes of Emotions: Multimodal Emotion Recognition in Conversations via Emotion Shifts	Dec 3, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
LMR-CBT: Learning Modality-fused Representations with CB-Transformer for Multimodal Emotion Recognition from Unaligned Multimodal Sequences	Dec 3, 2021	Efficient Neural NetworkEmotion Recognition	—Unverified	0
Multimodal Emotion Recognition on RAVDESS Dataset Using Transfer Learning	Nov 18, 2021	Domain AdaptationEmotion Recognition	—Unverified	0
Multimodal End-to-End Group Emotion Recognition using Cross-Modal Attention	Nov 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Cross Attentional Audio-Visual Fusion for Dimensional Emotion Recognition	Nov 9, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
A cross-modal fusion network based on self-attention and residual structure for multimodal emotion recognition	Nov 3, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
MEmoBERT: Pre-training Model with Prompt-based Learning for Multimodal Emotion Recognition	Oct 27, 2021	DiversityEmotion Classification	—Unverified	0
Multimodal Emotion-Cause Pair Extraction in Conversations	Oct 15, 2021	ArticlesEmotion Cause Extraction	—Unverified	0
Multimodal Emotion Recognition with High-level Speech and Text Features	Sep 29, 2021	DisentanglementEmotion Recognition	CodeCode Available	1
Using Large Pre-Trained Models with Cross-Modal Attention for Multi-Modal Emotion Recognition	Aug 22, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Progressive Modality Reinforcement for Human Multimodal Emotion Recognition From Unaligned Multimodal Sequences	Jun 19, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Analyzing the Influence of Dataset Composition for Emotion Recognition	Mar 5, 2021	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Combining deep and unsupervised features for multilingual speech emotion recognition	Jan 10, 2021	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	0
MSAF: Multimodal Split Attention Fusion	Dec 13, 2020	Action RecognitionEmotion Recognition	CodeCode Available	1
Context-Dependent Domain Adversarial Neural Network for Multimodal Emotion Recognition	Oct 28, 2020	Emotion RecognitionMultimodal Emotion Recognition	—Unverified	0
Emotion recognition by fusing time synchronous and time asynchronous representations	Oct 27, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Multimodal Emotion Recognition with Transformer-Based Self Supervised Feature Fusion	Oct 27, 2020	Emotion RecognitionMultimodal Deep Learning	CodeCode Available	1
An Audio-Video Deep and Transfer Learning Framework for Multimodal Emotion Recognition in the wild	Oct 7, 2020	Deep LearningEmotion Recognition	—Unverified	0
Modality-Transferable Emotion Embeddings for Low-Resource Multimodal Emotion Recognition	Sep 21, 2020	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available	1
Jointly Fine-Tuning “BERT-like” Self Supervised Models to Improve Multimodal Speech Emotion Recognition	Aug 15, 2020	Emotion RecognitionMultimodal Deep Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 6 of 8Next →

All datasets IEMOCAP-4 MELD IEMOCAP CMU-MOSEI-Sentiment CMU-MOSEI-Sentiment-3 Expressive hands and faces dataset (EHF).MELD-Sentiment

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	86.52	—	Unverified
2	Joyful	Weighted F1	85.7	—	Unverified
3	COGMEN	Weighted F1	84.5	—	Unverified
4	DANN	Accuracy	82.7	—	Unverified
5	MMER	Accuracy	81.7	—	Unverified
6	PATHOSnet v2	Accuracy	80.4	—	Unverified
7	Self-attention weight correction (A+T)	Accuracy	76.8	—	Unverified
8	CHFusion	Accuracy	76.5	—	Unverified
9	bc-LSTM	Weighted F1	74.1	—	Unverified
10	Audio + Text (Stage III)	F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.71	—	Unverified
2	Audio + Text (Stage III)	Weighted F1	65.8	—	Unverified
3	Joyful	Weighted F1	61.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	72.81	—	Unverified
2	Joyful	Weighted F1	70.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	44.93	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	66.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SMPLify-X	v2v error	52.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GraphSmile	Weighted F1	74.31	—	Unverified