Lip Reading

Lip Reading is a task to infer the speech content in a video by using only the visual information, especially the lip movements. It has many crucial applications in practice, such as assisting audio-based speech recognition, biometric authentication and aiding hearing-impaired people.

Source: Mutual Information Maximization for Effective Lip Reading

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 153 papers

Title	Date	Tasks	Status
Facetron: A Multi-speaker Face-to-Speech Model based on Cross-modal Latent Representations	Jul 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning From the Master: Distilling Cross-Modal Advanced Knowledge for Lip Reading	Jun 19, 2021	Lip ReadingSentence	—Unverified
LiRA: Learning Visual Speech Representations from Audio through Self-supervision	Jun 16, 2021	Lip ReadingSelf-Supervised Learning	—Unverified
Multi-Perspective LSTM for Joint Visual Representation Learning	May 6, 2021	Face RecognitionLip Reading	CodeCode Available
End-to-End Video-To-Speech Synthesis using Generative Adversarial Networks	Apr 27, 2021	Lip ReadingSpeech Synthesis	—Unverified
Fusing information streams in end-to-end audio-visual speech recognition	Apr 19, 2021	Audio-Visual Speech RecognitionLip Reading	—Unverified
Lip reading using external viseme decoding	Apr 10, 2021	Lip Reading	—Unverified
Contrastive Self-Supervised Learning of Global-Local Audio-Visual Representations	Jan 1, 2021	ClassificationDeepFake Detection	—Unverified
Lip-reading with Hierarchical Pyramidal Convolution and Self-Attention	Dec 28, 2020	Lip Reading	—Unverified
AuthNet: A Deep Learning based Authentication Mechanism using Temporal Facial Feature Movements	Dec 4, 2020	BenchmarkingLip password classification	CodeCode Available
Disentangling Homophemes in Lip Reading using Perplexity Analysis	Nov 28, 2020	Language ModelingLanguage Modelling	—Unverified
A Study on Lip Localization Techniques used for Lip reading from a Video	Sep 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Synchronous Bidirectional Learning for Multilingual Lip Reading	May 8, 2020	Lip Reading	CodeCode Available
Seeing voices and hearing voices: learning discriminative embeddings using cross-modal self-supervision	Apr 29, 2020	Lip ReadingSelf-Supervised Learning	—Unverified
Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence Lip-Reading	Mar 9, 2020	LipreadingLip Reading	—Unverified
Re-synchronization using the Hand Preceding Model for Multi-modal Fusion in Automatic Continuous Cued Speech Recognition	Feb 23, 2020	Lip ReadingPhoneme Recognition	—Unverified
ASR is all you need: cross-modal distillation for lip reading	Nov 28, 2019	AllAutomatic Speech Recognition	—Unverified
Hearing Lips: Improving Lip Reading by Distilling Speech Recognizers	Nov 26, 2019	Knowledge DistillationLipreading	—Unverified
Towards Pose-invariant Lip-Reading	Nov 14, 2019	Lip Reading	—Unverified
Spatio-Temporal Fusion Based Convolutional Sequence Learning for Lip Reading	Oct 1, 2019	LipreadingLip Reading	—Unverified
Multi-Grained Spatio-temporal Modeling for Lip-reading	Aug 30, 2019	LipreadingLip Reading	—Unverified
A Cascade Sequence-to-Sequence Model for Chinese Mandarin Lip Reading	Aug 14, 2019	LipreadingLip Reading	—Unverified
Realistic Speech-Driven Facial Animation with GANs	Jun 14, 2019	Audio-Visual SynchronizationLip Reading	—Unverified
MobiVSR: A Visual Speech Recognition Solution for Mobile Devices	May 10, 2019	Lip ReadingQuantization	—Unverified
Synthesising 3D Facial Motion from "In-the-Wild" Speech	Apr 15, 2019	Lip ReadingMotion Synthesis	—Unverified

Show:10 25 50

← PrevPage 5 of 7Next →

All datasets GRID corpus (mixed-speech)LRW TCD-TIMIT corpus (mixed-speech)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	14.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	34.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	31.26	—	Unverified