Lip Reading

Lip Reading is a task to infer the speech content in a video by using only the visual information, especially the lip movements. It has many crucial applications in practice, such as assisting audio-based speech recognition, biometric authentication and aiding hearing-impaired people.

Source: Mutual Information Maximization for Effective Lip Reading

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 153 papers

Title	Date	Tasks	Status	Hype
Disentangling Homophemes in Lip Reading using Perplexity Analysis	Nov 28, 2020	Language ModelingLanguage Modelling	—Unverified	0
Learn an Effective Lip Reading Model without Pains	Nov 15, 2020	LipreadingLip Reading	CodeCode Available	1
Lip-reading with Densely Connected Temporal Convolutional Networks	Sep 29, 2020	Lip Reading	CodeCode Available	1
A Study on Lip Localization Techniques used for Lip reading from a Video	Sep 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Seeing wake words: Audio-visual Keyword Spotting	Sep 2, 2020	Keyword SpottingLip Reading	CodeCode Available	1
Learning Individual Speaking Styles for Accurate Lip to Speech Synthesis	May 17, 2020	Lip ReadingLip to Speech Synthesis	CodeCode Available	1
Synchronous Bidirectional Learning for Multilingual Lip Reading	May 8, 2020	Lip Reading	CodeCode Available	0
Seeing voices and hearing voices: learning discriminative embeddings using cross-modal self-supervision	Apr 29, 2020	Lip ReadingSelf-Supervised Learning	—Unverified	0
Mutual Information Maximization for Effective Lip Reading	Mar 13, 2020	LipreadingLip Reading	CodeCode Available	1
Deformation Flow Based Two-Stream Network for Lip Reading	Mar 12, 2020	Knowledge DistillationLipreading	CodeCode Available	1
Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence Lip-Reading	Mar 9, 2020	LipreadingLip Reading	—Unverified	0
Can We Read Speech Beyond the Lips? Rethinking RoI Selection for Deep Visual Speech Recognition	Mar 6, 2020	LipreadingLip Reading	CodeCode Available	1
Re-synchronization using the Hand Preceding Model for Multi-modal Fusion in Automatic Continuous Cued Speech Recognition	Feb 23, 2020	Lip ReadingPhoneme Recognition	—Unverified	0
Lipreading using Temporal Convolutional Networks	Jan 23, 2020	LipreadingLip Reading	CodeCode Available	1
ASR is all you need: cross-modal distillation for lip reading	Nov 28, 2019	AllAutomatic Speech Recognition	—Unverified	0
Hearing Lips: Improving Lip Reading by Distilling Speech Recognizers	Nov 26, 2019	Knowledge DistillationLipreading	—Unverified	0
Towards Pose-invariant Lip-Reading	Nov 14, 2019	Lip Reading	—Unverified	0
Spatio-Temporal Fusion Based Convolutional Sequence Learning for Lip Reading	Oct 1, 2019	LipreadingLip Reading	—Unverified	0
Multi-Grained Spatio-temporal Modeling for Lip-reading	Aug 30, 2019	LipreadingLip Reading	—Unverified	0
A Cascade Sequence-to-Sequence Model for Chinese Mandarin Lip Reading	Aug 14, 2019	LipreadingLip Reading	—Unverified	0
Realistic Speech-Driven Facial Animation with GANs	Jun 14, 2019	Audio-Visual SynchronizationLip Reading	—Unverified	0
MobiVSR: A Visual Speech Recognition Solution for Mobile Devices	May 10, 2019	Lip ReadingQuantization	—Unverified	0
Synthesising 3D Facial Motion from "In-the-Wild" Speech	Apr 15, 2019	Lip ReadingMotion Synthesis	—Unverified	0
Learning from Videos with Deep Convolutional LSTM Networks	Apr 9, 2019	LipreadingLip Reading	—Unverified	0
An Empirical Analysis of Deep Audio-Visual Models for Speech Recognition	Dec 21, 2018	Lip ReadingSensitivity	—Unverified	0

Show:10 25 50

← PrevPage 5 of 7Next →

All datasets GRID corpus (mixed-speech)LRW TCD-TIMIT corpus (mixed-speech)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	14.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	34.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	31.26	—	Unverified