Lip Reading

Lip Reading is a task to infer the speech content in a video by using only the visual information, especially the lip movements. It has many crucial applications in practice, such as assisting audio-based speech recognition, biometric authentication and aiding hearing-impaired people.

Source: Mutual Information Maximization for Effective Lip Reading

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 153 papers

Title	Date	Tasks	Status	Hype
Audio-Visual Synchronisation in the wild	Dec 8, 2021	Lip Reading	—Unverified	0
Contrastive Learning of Global and Local Video Representations	Dec 1, 2021	ClassificationContrastive Learning	—Unverified	0
Leveraging Uni-Modal Self-Supervised Learning for Multimodal Audio-visual Speech Recognition	Nov 16, 2021	Audio-Visual Speech RecognitionLanguage Modelling	—Unverified	0
Visual Keyword Spotting with Attention	Oct 29, 2021	Lip ReadingVisual Keyword Spotting	CodeCode Available	1
Advances and Challenges in Deep Lip Reading	Oct 15, 2021	Deep LearningLip Reading	—Unverified	0
Sub-word Level Lip Reading With Visual Attention	Oct 14, 2021	Audio-Visual Active Speaker DetectionAutomatic Speech Recognition	—Unverified	0
Perception Point: Identifying Critical Learning Periods in Speech for Bilingual Networks	Oct 13, 2021	Lip Readingspeech-recognition	—Unverified	0
Audio-Visual Speech Recognition is Worth 32328 Voxels	Sep 20, 2021	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified	0
LRWR: Large-Scale Benchmark for Lip Reading in Russian language	Sep 14, 2021	LipreadingLip Reading	—Unverified	0
SimulLR: Simultaneous Lip Reading Transducer with Attention-Guided Adaptive Memory	Aug 31, 2021	Lip Reading	—Unverified	0
Adaptive Semantic-Spatio-Temporal Graph Convolutional Network for Lip Reading	Aug 16, 2021	Landmark-based LipreadingLip Reading	—Unverified	0
Spatio-Temporal Attention Mechanism and Knowledge Distillation for Lip Reading	Aug 7, 2021	Audio-Visual Speech RecognitionKnowledge Distillation	—Unverified	0
Facetron: A Multi-speaker Face-to-Speech Model based on Cross-modal Latent Representations	Jul 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Learning From the Master: Distilling Cross-Modal Advanced Knowledge for Lip Reading	Jun 19, 2021	Lip ReadingSentence	—Unverified	0
LiRA: Learning Visual Speech Representations from Audio through Self-supervision	Jun 16, 2021	Lip ReadingSelf-Supervised Learning	—Unverified	0
Selective Listening by Synchronizing Speech with Lips	Jun 14, 2021	Lip ReadingTarget Speaker Extraction	CodeCode Available	1
Multi-Perspective LSTM for Joint Visual Representation Learning	May 6, 2021	Face RecognitionLip Reading	CodeCode Available	0
End-to-End Video-To-Speech Synthesis using Generative Adversarial Networks	Apr 27, 2021	Lip ReadingSpeech Synthesis	—Unverified	0
Fusing information streams in end-to-end audio-visual speech recognition	Apr 19, 2021	Audio-Visual Speech RecognitionLip Reading	—Unverified	0
Lip reading using external viseme decoding	Apr 10, 2021	Lip Reading	—Unverified	0
Contrastive Learning of Global-Local Video Representations	Apr 7, 2021	ClassificationContrastive Learning	CodeCode Available	1
End-to-end Audio-visual Speech Recognition with Conformers	Feb 12, 2021	Audio-Visual Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Contrastive Self-Supervised Learning of Global-Local Audio-Visual Representations	Jan 1, 2021	ClassificationDeepFake Detection	—Unverified	0
Lip-reading with Hierarchical Pyramidal Convolution and Self-Attention	Dec 28, 2020	Lip Reading	—Unverified	0
AuthNet: A Deep Learning based Authentication Mechanism using Temporal Facial Feature Movements	Dec 4, 2020	BenchmarkingLip password classification	CodeCode Available	0

Show:10 25 50

← PrevPage 4 of 7Next →

All datasets GRID corpus (mixed-speech)LRW TCD-TIMIT corpus (mixed-speech)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	14.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	34.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	31.26	—	Unverified