SOTAVerified|Agents Browse Leaderboard About Blog

Lip Reading

Lip Reading is a task to infer the speech content in a video by using only the visual information, especially the lip movements. It has many crucial applications in practice, such as assisting audio-based speech recognition, biometric authentication and aiding hearing-impaired people.

Source: Mutual Information Maximization for Effective Lip Reading

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 153 papers

Title	Date	Tasks	Status
Exploring Lip Segmentation Techniques in Computer Vision: A Comparative Analysis	Nov 20, 2023	Edge-computingLip Reading	—Unverified
Expression-preserving face frontalization improves visually assisted speech processing	Apr 6, 2022	Face ModelLip Reading	—Unverified
Facetron: A Multi-speaker Face-to-Speech Model based on Cross-modal Latent Representations	Jul 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Finding phonemes: improving machine lip-reading	Oct 3, 2017	Lip ReadingPhoneme Recognition	—Unverified
A Study on Lip Localization Techniques used for Lip reading from a Video	Sep 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bridge to Non-Barrier Communication: Gloss-Prompted Fine-grained Cued Speech Gesture Generation with Diffusion Model	Apr 30, 2024	DescriptiveGesture Generation	—Unverified
GLaM-Sign: Greek Language Multimodal Lip Reading with Integrated Sign Language Accessibility	Jan 9, 2025	Lip ReadingSign Language Translation	—Unverified
Hearing Lips: Improving Lip Reading by Distilling Speech Recognizers	Nov 26, 2019	Knowledge DistillationLipreading	—Unverified
Integrating Persian Lip Reading in Surena-V Humanoid Robot for Human-Robot Interaction	Jan 23, 2025	Landmark TrackingLip Reading	—Unverified
Landmark-Guided Cross-Speaker Lip Reading with Mutual Information Regularization	Mar 24, 2024	Lip Reading	—Unverified
ASR is all you need: cross-modal distillation for lip reading	Nov 28, 2019	AllAutomatic Speech Recognition	—Unverified
Disentangling Homophemes in Lip Reading using Perplexity Analysis	Nov 28, 2020	Language ModelingLanguage Modelling	—Unverified
Automatic Viseme Vocabulary Construction to Enhance Continuous Lip-reading	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Multimodal German Dataset for Automatic Lip Reading Systems and Transfer Learning	Feb 27, 2022	Lip ReadingTransfer Learning	—Unverified
Lip Reading Sentences in the Wild	Nov 16, 2016	LipreadingLip Reading	—Unverified
Development and evaluation of a deep learning algorithm for German word recognition from lip movements	Apr 22, 2025	Lip Readingspeech-recognition	—Unverified
A large-scale multimodal dataset of human speech recognition	Mar 15, 2023	Lip ReadingMotion Detection	—Unverified
Definition of Visual Speech Element and Research on a Method of Extracting Feature Vector for Korean Lip-Reading	Nov 15, 2014	Lip Reading	—Unverified
Deep Lip Reading: a comparison of models and an online application	Jun 15, 2018	Language ModelingLanguage Modelling	—Unverified
Leveraging Visemes for Better Visual Speech Representation and Lip Reading	Jul 19, 2023	Lip ReadingSentence	—Unverified
Audio-visual video face hallucination with frequency supervision and cross modality support by speech based lip reading loss	Nov 20, 2022	Face HallucinationGenerative Adversarial Network	—Unverified
Adaptive Semantic-Spatio-Temporal Graph Convolutional Network for Lip Reading	Aug 16, 2021	Landmark-based LipreadingLip Reading	—Unverified
Lip2Vec: Efficient and Robust Visual Speech Recognition via Latent-to-Latent Visual to Audio Representation Mapping	Aug 11, 2023	Lip Readingspeech-recognition	—Unverified
LipGen: Viseme-Guided Lip Video Generation for Enhancing Visual Speech Recognition	Jan 8, 2025	Lip Readingspeech-recognition	—Unverified
Lip-Reading Driven Deep Learning Approach for Speech Enhancement	Jul 31, 2018	Acoustic ModellingDeep Learning	—Unverified

Show:10 25 50

← PrevPage 3 of 7Next →

All datasets GRID corpus (mixed-speech)LRW TCD-TIMIT corpus (mixed-speech)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	14.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	34.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	31.26	—	Unverified