Speech Emotion Recognition

Speech Emotion Recognition is a task of speech processing and computational paralinguistics that aims to recognize and categorize the emotions expressed in spoken language. The goal is to determine the emotional state of a speaker, such as happiness, anger, sadness, or frustration, from their speech patterns, such as prosody, pitch, and rhythm.

For multimodal emotion recognition, please upload your result to Multimodal Emotion Recognition on IEMOCAP

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 431 papers

Title	Date	Tasks	Status
Deep Residual Local Feature Learning for Speech Emotion Recognition	Nov 19, 2020	Emotion RecognitionSpeech Emotion Recognition	—Unverified
On the use of Self-supervised Pre-trained Acoustic and Linguistic Features for Continuous Speech Emotion Recognition	Nov 18, 2020	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Recognizing More Emotions with Less Data Using Self-supervised Transfer Learning	Nov 11, 2020	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Efficient Arabic emotion recognition using deep neural networks	Oct 31, 2020	Emotion RecognitionSpeech Emotion Recognition	CodeCode Available
Empirical Interpretation of Speech Emotion Perception with Attention Based Model for Speech Emotion Recognition	Oct 28, 2020	Emotional IntelligenceEmotion Recognition	—Unverified
Context-Dependent Domain Adversarial Neural Network for Multimodal Emotion Recognition	Oct 28, 2020	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
CopyPaste: An Augmentation Method for Speech Emotion Recognition	Oct 27, 2020	Data AugmentationEmotion Recognition	—Unverified
Emotion controllable speech synthesis using emotion-unlabeled dataset with the assistance of cross-domain speech emotion recognition	Oct 26, 2020	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Multi-stream Attention-based BLSTM with Feature Segmentation for Speech Emotion Recognition	Oct 25, 2020	Data AugmentationEmotional Speech Synthesis	—Unverified
Dynamic Layer Customization for Noise Robust Speech Emotion Recognition in Heterogeneous Condition Training	Oct 21, 2020	Domain AdaptationEmotion Recognition	—Unverified
Multi-Window Data Augmentation Approach for Speech Emotion Recognition	Oct 19, 2020	Data AugmentationEmotion Recognition	—Unverified
Optimizing Speech Emotion Recognition using Manta-Ray Based Feature Selection	Sep 18, 2020	ClassificationEmotion Recognition	—Unverified
Is Everything Fine, Grandma? Acoustic and Linguistic Modeling for Robust Elderly Speech Emotion Recognition	Sep 7, 2020	Emotion RecognitionSpeech Emotion Recognition	CodeCode Available
Fine-grained Early Frequency Attention for Deep Speaker Representation Learning	Sep 3, 2020	Deep LearningEmotion Recognition	—Unverified
A Transfer Learning Method for Speech Emotion Recognition from Automatic Speech Recognition	Aug 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Shallow over Deep Neural Networks: A empirical analysis for human emotion classification using audio data	Jul 3, 2020	Emotion ClassificationEmotion Recognition	—Unverified
Meta Transfer Learning for Emotion Recognition	Jun 23, 2020	Emotion RecognitionFacial Expression Recognition	—Unverified
A Siamese Neural Network with Modified Distance Loss For Transfer Learning in Speech Emotion Recognition	Jun 4, 2020	Emotion RecognitionSpeech Emotion Recognition	—Unverified
ConcealNet: An End-to-end Neural Network for Packet Loss Concealment in Deep Speech Emotion Recognition	May 15, 2020	Emotion RecognitionPacket Loss Concealment	—Unverified
"I have vxxx bxx connexxxn!": Facing Packet Loss in Deep Speech Emotion Recognition	May 15, 2020	Data AugmentationEmotion Recognition	—Unverified
On The Differences Between Song and Speech Emotion Recognition: Effect of Feature Sets, Feature Types, and Classifiers	Apr 1, 2020	Emotion Recognitionregression	CodeCode Available
Cross Lingual Cross Corpus Speech Emotion Recognition	Mar 18, 2020	Cross-corpusEmotion Recognition	—Unverified
Speech Emotion Recognition using Support Vector Machine	Feb 3, 2020	ClassificationEmotion Recognition	—Unverified
Non-linear Neurons with Human-like Apical Dendrite Activations	Feb 2, 2020	Speech Emotion Recognition	CodeCode Available
Speech Emotion Recognition Based on Multi-feature and Multi-lingual Fusion	Jan 16, 2020	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Visually Guided Self Supervised Learning of Speech Representations	Jan 13, 2020	Emotion RecognitionRepresentation Learning	—Unverified
Learning Transferable Features for Speech Emotion Recognition	Dec 23, 2019	Domain AdaptationEmotional Intelligence	—Unverified
Bimodal Speech Emotion Recognition Using Pre-Trained Language Models	Nov 29, 2019	Emotion RecognitionReinforcement Learning	—Unverified
Attentive Modality Hopping Mechanism for Speech Emotion Recognition	Nov 29, 2019	Emotion ClassificationEmotion Recognition	CodeCode Available
Speech Emotion Recognition Using Speech Feature and Word Embedding	Nov 18, 2019	Emotion RecognitionSpeech Emotion Recognition	CodeCode Available
Speaker-invariant Affective Representation Learning via Adversarial Training	Nov 4, 2019	Emotion ClassificationEmotion Recognition	—Unverified
Unsupervised Representation Learning with Future Observation Prediction for Speech Emotion Recognition	Oct 24, 2019	Emotion RecognitionRepresentation Learning	—Unverified
Speech Emotion Recognition via Contrastive Loss under Siamese Networks	Oct 23, 2019	Emotion Recognitionfeature selection	—Unverified
Speech Emotion Recognition with Dual-Sequence LSTM Architecture	Oct 20, 2019	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Learning Alignment for Multimodal Emotion Recognition from Speech	Sep 6, 2019	Emotion RecognitionMultimodal Emotion Recognition	CodeCode Available
Pitch-Synchronous Single Frequency Filtering Spectrogram for Speech Emotion Recognition	Aug 7, 2019	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Learning Discriminative features using Center Loss and Reconstruction as Regularizer for Speech Emotion Recognition	Jun 19, 2019	Emotion RecognitionMetric Learning	—Unverified
Focal Loss based Residual Convolutional Neural Network for Speech Emotion Recognition	Jun 11, 2019	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Deep Learning based Emotion Recognition System Using Speech Features and Transcriptions	Jun 11, 2019	Emotion RecognitionSpeech Emotion Recognition	CodeCode Available
Speech Emotion Recognition Using Multi-hop Attention Mechanism	Apr 23, 2019	Emotion ClassificationEmotion Recognition	CodeCode Available
An Interaction-aware Attention Network for Speech Emotion Recognition in Spoken Dialogs	Apr 17, 2019	Emotion RecognitionSpeech Emotion Recognition	CodeCode Available
Multimodal Speech Emotion Recognition and Ambiguity Resolution	Apr 12, 2019	BIG-bench Machine LearningEmotion Recognition	CodeCode Available
Attention-Augmented End-to-End Multi-Task Learning for Emotion Prediction from Speech	Mar 29, 2019	Emotion RecognitionMulti-Task Learning	CodeCode Available
Improving Cross-Corpus Speech Emotion Recognition with Adversarial Discriminative Domain Generalization (ADDoG)	Mar 28, 2019	Cross-corpusDomain Generalization	—Unverified
Towards adversarial learning of speaker-invariant representation for speech emotion recognition	Mar 22, 2019	ClassificationEmotion Classification	—Unverified
Cross Lingual Speech Emotion Recognition: Urdu vs. Western Languages	Dec 15, 2018	Cross-corpusEmotion Recognition	CodeCode Available
Adversarial Machine Learning And Speech Emotion Recognition: Utilizing Generative Adversarial Networks For Robustness	Nov 28, 2018	Adversarial AttackBIG-bench Machine Learning	—Unverified
Improving speech emotion recognition via Transformer-based Predictive Coding through transfer learning	Nov 11, 2018	Emotion RecognitionSpeech Emotion Recognition	—Unverified
Integrating Recurrence Dynamics for Speech Emotion Recognition	Nov 9, 2018	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available
Transferable Positive/Negative Speech Emotion Recognition via Class-wise Adversarial Domain Adaptation	Oct 30, 2018	Domain AdaptationEmotion Recognition	—Unverified

Show:10 25 50

← PrevPage 8 of 9Next →

All datasets CREMA-D IEMOCAP RAVDESS MSP-Podcast (Activation)MSP-Podcast (Dominance)MSP-Podcast (Valence)BERSt RESD Dusha Crowd Dusha Podcast EMODB EmoDB Dataset

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Vertically long patch ViT	Accuracy	94.07	—	Unverified
2	ConformerXL-P	Accuracy	88.2	—	Unverified
3	CoordViT	Accuracy	82.96	—	Unverified
4	SepTr + LeRaC	Accuracy	70.95	—	Unverified
5	SepTr	Accuracy	70.47	—	Unverified
6	ResNet-18 + SPEL	Accuracy	68.12	—	Unverified
7	ViT	Accuracy	67.81	—	Unverified
8	ResNet-18 + PyNADA	Accuracy	65.15	—	Unverified
9	GRU	Accuracy	55.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SER with MTL	UA CV	0.78	—	Unverified
2	emoDARTS	UA CV	0.77	—	Unverified
3	LSTM+FC	WA	0.76	—	Unverified
4	TAP	WA CV	0.74	—	Unverified
5	SYSCOMB: BLSTMATT with CSA (session5)	UA	0.74	—	Unverified
6	Partially Fine-tuned HuBERT Large	WA CV	0.73	—	Unverified
7	CNN - DARTS	UA	0.7	—	Unverified
8	CNN+LSTM	UA	0.65	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VQ-MAE-S-12 (Frame) + Query2Emo	Accuracy	84.1	—	Unverified
2	CNN-X (Shallow CNN)	Accuracy	82.99	—	Unverified
3	xlsr-Wav2Vec2.0(FineTuning)	Accuracy	81.82	—	Unverified
4	CNN-14 (Fine-Tuning)	Accuracy	76.58	—	Unverified
5	AlexNet (FineTuning)	Accuracy	61.67	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	wav2small-Teacher	CCC	0.76	—	Unverified
2	wavlm	CCC	0.75	—	Unverified
3	w2v2-L-robust-12	CCC	0.75	—	Unverified
4	preCPC	CCC	0.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	wav2small-Teacher	CCC	0.68	—	Unverified
2	wavlm	CCC	0.67	—	Unverified
3	w2v2-L-robust-12	CCC	0.66	—	Unverified
4	preCPC	CCC	0.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	wav2small-Teacher	CCC	0.68	—	Unverified
2	wavlm	CCC	0.65	—	Unverified
3	w2v2-L-robust-12	CCC	0.64	—	Unverified
4	preCPC	CCC	0.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAWN-hidden-SVM	Unweighted Accuracy (UA)	32.1	—	Unverified
2	Wav2Small-VAD-SVM	Unweighted Accuracy (UA)	23.3	—	Unverified
3	Speechbrain Wav2Vec2	Unweighted Accuracy (UA)	20.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	emotion2vec+base	Weighted Accuracy (WA)	79.4	—	Unverified
2	emotion2vec+large	Weighted Accuracy (WA)	69.5	—	Unverified
3	emotion2vec	Weighted Accuracy (WA)	64.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Dusha baseline	Macro F1	0.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Dusha baseline	Macro F1	0.54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VGG-optiVMD	1:1 Accuracy	96.09	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VQ-MAE-S-12 (Frame) + Query2Emo	Accuracy	90.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PyResNet	Unweighted Accuracy (UA)	0.43	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	emoDARTS	UA	0.66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM	CCC (Arousal)	0.76	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN (1D)	Unweighted Accuracy	65.2	—	Unverified