Lip Reading

Lip Reading is a task to infer the speech content in a video by using only the visual information, especially the lip movements. It has many crucial applications in practice, such as assisting audio-based speech recognition, biometric authentication and aiding hearing-impaired people.

Source: Mutual Information Maximization for Effective Lip Reading

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 153 papers

Title	Date	Tasks	Status	Hype
Disentangling Homophemes in Lip Reading using Perplexity Analysis	Nov 28, 2020	Language ModelingLanguage Modelling	—Unverified	0
Learn an Effective Lip Reading Model without Pains	Nov 15, 2020	LipreadingLip Reading	CodeCode Available	1
Lip-reading with Densely Connected Temporal Convolutional Networks	Sep 29, 2020	Lip Reading	CodeCode Available	1
A Study on Lip Localization Techniques used for Lip reading from a Video	Sep 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Seeing wake words: Audio-visual Keyword Spotting	Sep 2, 2020	Keyword SpottingLip Reading	CodeCode Available	1
Learning Individual Speaking Styles for Accurate Lip to Speech Synthesis	May 17, 2020	Lip ReadingLip to Speech Synthesis	CodeCode Available	1
Synchronous Bidirectional Learning for Multilingual Lip Reading	May 8, 2020	Lip Reading	CodeCode Available	0
Seeing voices and hearing voices: learning discriminative embeddings using cross-modal self-supervision	Apr 29, 2020	Lip ReadingSelf-Supervised Learning	—Unverified	0
Mutual Information Maximization for Effective Lip Reading	Mar 13, 2020	LipreadingLip Reading	CodeCode Available	1
Deformation Flow Based Two-Stream Network for Lip Reading	Mar 12, 2020	Knowledge DistillationLipreading	CodeCode Available	1
Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence Lip-Reading	Mar 9, 2020	LipreadingLip Reading	—Unverified	0
Can We Read Speech Beyond the Lips? Rethinking RoI Selection for Deep Visual Speech Recognition	Mar 6, 2020	LipreadingLip Reading	CodeCode Available	1
Re-synchronization using the Hand Preceding Model for Multi-modal Fusion in Automatic Continuous Cued Speech Recognition	Feb 23, 2020	Lip ReadingPhoneme Recognition	—Unverified	0
Lipreading using Temporal Convolutional Networks	Jan 23, 2020	LipreadingLip Reading	CodeCode Available	1
ASR is all you need: cross-modal distillation for lip reading	Nov 28, 2019	AllAutomatic Speech Recognition	—Unverified	0
Hearing Lips: Improving Lip Reading by Distilling Speech Recognizers	Nov 26, 2019	Knowledge DistillationLipreading	—Unverified	0
Towards Pose-invariant Lip-Reading	Nov 14, 2019	Lip Reading	—Unverified	0
Spatio-Temporal Fusion Based Convolutional Sequence Learning for Lip Reading	Oct 1, 2019	LipreadingLip Reading	—Unverified	0
Multi-Grained Spatio-temporal Modeling for Lip-reading	Aug 30, 2019	LipreadingLip Reading	—Unverified	0
A Cascade Sequence-to-Sequence Model for Chinese Mandarin Lip Reading	Aug 14, 2019	LipreadingLip Reading	—Unverified	0
Realistic Speech-Driven Facial Animation with GANs	Jun 14, 2019	Audio-Visual SynchronizationLip Reading	—Unverified	0
MobiVSR: A Visual Speech Recognition Solution for Mobile Devices	May 10, 2019	Lip ReadingQuantization	—Unverified	0
Synthesising 3D Facial Motion from "In-the-Wild" Speech	Apr 15, 2019	Lip ReadingMotion Synthesis	—Unverified	0
Learning from Videos with Deep Convolutional LSTM Networks	Apr 9, 2019	LipreadingLip Reading	—Unverified	0
An Empirical Analysis of Deep Audio-Visual Models for Speech Recognition	Dec 21, 2018	Lip ReadingSensitivity	—Unverified	0
LRW-1000: A Naturally-Distributed Large-Scale Benchmark for Lip Reading in the Wild	Oct 16, 2018	LipreadingLip Reading	CodeCode Available	0
Deep Audio-Visual Speech Recognition	Sep 6, 2018	Audio-Visual Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Contextual Audio-Visual Switching For Speech Enhancement in Real-World Environments	Aug 28, 2018	Lip ReadingSpeech Enhancement	—Unverified	0
Lip-Reading Driven Deep Learning Approach for Speech Enhancement	Jul 31, 2018	Acoustic ModellingDeep Learning	—Unverified	0
Talking Face Generation by Adversarially Disentangled Audio-Visual Representation	Jul 20, 2018	Face GenerationLip Reading	CodeCode Available	0
Deep Lip Reading: a comparison of models and an online application	Jun 15, 2018	Language ModelingLanguage Modelling	—Unverified	0
Lip Reading Using Convolutional Auto Encoders as Feature Extractor	May 31, 2018	ClassificationGeneral Classification	—Unverified	0
End-to-End Speech-Driven Facial Animation with Temporal GANs	May 23, 2018	Lip Reading	CodeCode Available	1
Resource aware design of a deep convolutional-recurrent neural network for speech recognition through audio-visual sensor fusion	Mar 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Deep Learning for Lip Reading using Audio-Visual Information for Urdu Language	Feb 15, 2018	Lip Readingspeech-recognition	—Unverified	0
Lip2AudSpec: Speech reconstruction from silent lip movements video	Oct 26, 2017	Lip Reading	CodeCode Available	0
Some observations on computer lip-reading: moving from the dream to the reality	Oct 3, 2017	Lip Reading	—Unverified	0
Decoding visemes: improving machine lipreading	Oct 3, 2017	ClassificationGeneral Classification	—Unverified	0
Which phoneme-to-viseme maps best improve visual-only computer lip-reading?	Oct 3, 2017	Lip Readingspeech-recognition	—Unverified	0
Speaker-independent machine lip-reading with speaker-dependent viseme classifiers	Oct 3, 2017	ClusteringLip Reading	—Unverified	0
Resolution limits on visual speech recognition	Oct 3, 2017	Lip Readingspeech-recognition	—Unverified	0
Finding phonemes: improving machine lip-reading	Oct 3, 2017	Lip ReadingPhoneme Recognition	—Unverified	0
XFlow: Cross-modal Deep Neural Networks for Audiovisual Classification	Sep 2, 2017	ClassificationGeneral Classification	CodeCode Available	0
Estimating speech from lip dynamics	Aug 3, 2017	Lip ReadingPosition	CodeCode Available	0
Automatic Viseme Vocabulary Construction to Enhance Continuous Lip-reading	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Towards Estimating the Upper Bound of Visual-Speech Recognition: The Visual Lip-Reading Feasibility Database	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Combining Residual Networks with LSTMs for Lipreading	Mar 12, 2017	LipreadingLip Reading	CodeCode Available	0
Lip Reading Sentences in the Wild	Nov 16, 2016	LipreadingLip Reading	—Unverified	0
Video-Based Action Recognition Using Rate-Invariant Analysis of Covariance Trajectories	Mar 23, 2015	Action RecognitionGeneral Classification	—Unverified	0
Definition of Visual Speech Element and Research on a Method of Extracting Feature Vector for Korean Lip-Reading	Nov 15, 2014	Lip Reading	—Unverified	0

Show:10 25 50

← PrevPage 3 of 4Next →

All datasets GRID corpus (mixed-speech)LRW TCD-TIMIT corpus (mixed-speech)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	14.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	34.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	31.26	—	Unverified