Lip Reading

Lip Reading is a task to infer the speech content in a video by using only the visual information, especially the lip movements. It has many crucial applications in practice, such as assisting audio-based speech recognition, biometric authentication and aiding hearing-impaired people.

Source: Mutual Information Maximization for Effective Lip Reading

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 153 papers

Title	Date	Tasks	Status
Facetron: A Multi-speaker Face-to-Speech Model based on Cross-modal Latent Representations	Jul 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning From the Master: Distilling Cross-Modal Advanced Knowledge for Lip Reading	Jun 19, 2021	Lip ReadingSentence	—Unverified
LiRA: Learning Visual Speech Representations from Audio through Self-supervision	Jun 16, 2021	Lip ReadingSelf-Supervised Learning	—Unverified
Multi-Perspective LSTM for Joint Visual Representation Learning	May 6, 2021	Face RecognitionLip Reading	CodeCode Available
End-to-End Video-To-Speech Synthesis using Generative Adversarial Networks	Apr 27, 2021	Lip ReadingSpeech Synthesis	—Unverified
Fusing information streams in end-to-end audio-visual speech recognition	Apr 19, 2021	Audio-Visual Speech RecognitionLip Reading	—Unverified
Lip reading using external viseme decoding	Apr 10, 2021	Lip Reading	—Unverified
Contrastive Self-Supervised Learning of Global-Local Audio-Visual Representations	Jan 1, 2021	ClassificationDeepFake Detection	—Unverified
Lip-reading with Hierarchical Pyramidal Convolution and Self-Attention	Dec 28, 2020	Lip Reading	—Unverified
AuthNet: A Deep Learning based Authentication Mechanism using Temporal Facial Feature Movements	Dec 4, 2020	BenchmarkingLip password classification	CodeCode Available
Disentangling Homophemes in Lip Reading using Perplexity Analysis	Nov 28, 2020	Language ModelingLanguage Modelling	—Unverified
A Study on Lip Localization Techniques used for Lip reading from a Video	Sep 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Synchronous Bidirectional Learning for Multilingual Lip Reading	May 8, 2020	Lip Reading	CodeCode Available
Seeing voices and hearing voices: learning discriminative embeddings using cross-modal self-supervision	Apr 29, 2020	Lip ReadingSelf-Supervised Learning	—Unverified
Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence Lip-Reading	Mar 9, 2020	LipreadingLip Reading	—Unverified
Re-synchronization using the Hand Preceding Model for Multi-modal Fusion in Automatic Continuous Cued Speech Recognition	Feb 23, 2020	Lip ReadingPhoneme Recognition	—Unverified
ASR is all you need: cross-modal distillation for lip reading	Nov 28, 2019	AllAutomatic Speech Recognition	—Unverified
Hearing Lips: Improving Lip Reading by Distilling Speech Recognizers	Nov 26, 2019	Knowledge DistillationLipreading	—Unverified
Towards Pose-invariant Lip-Reading	Nov 14, 2019	Lip Reading	—Unverified
Spatio-Temporal Fusion Based Convolutional Sequence Learning for Lip Reading	Oct 1, 2019	LipreadingLip Reading	—Unverified
Multi-Grained Spatio-temporal Modeling for Lip-reading	Aug 30, 2019	LipreadingLip Reading	—Unverified
A Cascade Sequence-to-Sequence Model for Chinese Mandarin Lip Reading	Aug 14, 2019	LipreadingLip Reading	—Unverified
Realistic Speech-Driven Facial Animation with GANs	Jun 14, 2019	Audio-Visual SynchronizationLip Reading	—Unverified
MobiVSR: A Visual Speech Recognition Solution for Mobile Devices	May 10, 2019	Lip ReadingQuantization	—Unverified
Synthesising 3D Facial Motion from "In-the-Wild" Speech	Apr 15, 2019	Lip ReadingMotion Synthesis	—Unverified
Learning from Videos with Deep Convolutional LSTM Networks	Apr 9, 2019	LipreadingLip Reading	—Unverified
An Empirical Analysis of Deep Audio-Visual Models for Speech Recognition	Dec 21, 2018	Lip ReadingSensitivity	—Unverified
LRW-1000: A Naturally-Distributed Large-Scale Benchmark for Lip Reading in the Wild	Oct 16, 2018	LipreadingLip Reading	CodeCode Available
Contextual Audio-Visual Switching For Speech Enhancement in Real-World Environments	Aug 28, 2018	Lip ReadingSpeech Enhancement	—Unverified
Lip-Reading Driven Deep Learning Approach for Speech Enhancement	Jul 31, 2018	Acoustic ModellingDeep Learning	—Unverified
Talking Face Generation by Adversarially Disentangled Audio-Visual Representation	Jul 20, 2018	Face GenerationLip Reading	CodeCode Available
Deep Lip Reading: a comparison of models and an online application	Jun 15, 2018	Language ModelingLanguage Modelling	—Unverified
Lip Reading Using Convolutional Auto Encoders as Feature Extractor	May 31, 2018	ClassificationGeneral Classification	—Unverified
Resource aware design of a deep convolutional-recurrent neural network for speech recognition through audio-visual sensor fusion	Mar 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Learning for Lip Reading using Audio-Visual Information for Urdu Language	Feb 15, 2018	Lip Readingspeech-recognition	—Unverified
Lip2AudSpec: Speech reconstruction from silent lip movements video	Oct 26, 2017	Lip Reading	CodeCode Available
Which phoneme-to-viseme maps best improve visual-only computer lip-reading?	Oct 3, 2017	Lip Readingspeech-recognition	—Unverified
Resolution limits on visual speech recognition	Oct 3, 2017	Lip Readingspeech-recognition	—Unverified
Decoding visemes: improving machine lipreading	Oct 3, 2017	ClassificationGeneral Classification	—Unverified
Finding phonemes: improving machine lip-reading	Oct 3, 2017	Lip ReadingPhoneme Recognition	—Unverified
Speaker-independent machine lip-reading with speaker-dependent viseme classifiers	Oct 3, 2017	ClusteringLip Reading	—Unverified
Some observations on computer lip-reading: moving from the dream to the reality	Oct 3, 2017	Lip Reading	—Unverified
XFlow: Cross-modal Deep Neural Networks for Audiovisual Classification	Sep 2, 2017	ClassificationGeneral Classification	CodeCode Available
Estimating speech from lip dynamics	Aug 3, 2017	Lip ReadingPosition	CodeCode Available
Towards Estimating the Upper Bound of Visual-Speech Recognition: The Visual Lip-Reading Feasibility Database	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Viseme Vocabulary Construction to Enhance Continuous Lip-reading	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Combining Residual Networks with LSTMs for Lipreading	Mar 12, 2017	LipreadingLip Reading	CodeCode Available
Lip Reading Sentences in the Wild	Nov 16, 2016	LipreadingLip Reading	—Unverified
Video-Based Action Recognition Using Rate-Invariant Analysis of Covariance Trajectories	Mar 23, 2015	Action RecognitionGeneral Classification	—Unverified
Definition of Visual Speech Element and Research on a Method of Extracting Feature Vector for Korean Lip-Reading	Nov 15, 2014	Lip Reading	—Unverified

Show:10 25 50

← PrevPage 3 of 4Next →

All datasets GRID corpus (mixed-speech)LRW TCD-TIMIT corpus (mixed-speech)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	14.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	34.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	31.26	—	Unverified