Lip Reading

Lip Reading is a task to infer the speech content in a video by using only the visual information, especially the lip movements. It has many crucial applications in practice, such as assisting audio-based speech recognition, biometric authentication and aiding hearing-impaired people.

Source: Mutual Information Maximization for Effective Lip Reading

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 153 papers

Title	Date	Tasks	Status
SynthVSR: Scaling Up Visual Speech Recognition With Synthetic Supervision	Mar 30, 2023	Lip Readingspeech-recognition	—Unverified
Towards Estimating the Upper Bound of Visual-Speech Recognition: The Visual Lip-Reading Feasibility Database	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards MOOCs for Lipreading: Using Synthetic Talking Heads to Train Humans in Lipreading at Scale	Aug 21, 2022	LipreadingLip Reading	—Unverified
Towards Pose-invariant Lip-Reading	Nov 14, 2019	Lip Reading	—Unverified
VALLR: Visual ASR Language Model for Lip Reading	Mar 27, 2025	Automatic Speech RecognitionLanguage Modeling	—Unverified
VCSE: Time-Domain Visual-Contextual Speaker Extraction Network	Oct 9, 2022	Lip Reading	—Unverified
Video-Based Action Recognition Using Rate-Invariant Analysis of Covariance Trajectories	Mar 23, 2015	Action RecognitionGeneral Classification	—Unverified
Visual Passwords Using Automatic Lip Reading	Sep 2, 2014	Lip Reading	—Unverified
VisualSpeaker: Visually-Guided 3D Avatar Lip Synthesis	Jul 8, 2025	Automatic Speech RecognitionLip Reading	—Unverified
Visual Speech Recognition	Sep 3, 2014	Audio-Visual Speech RecognitionLip Reading	—Unverified
Visual Speech Recognition in a Driver Assistance System	Aug 29, 2022	Data AugmentationLipreading	—Unverified
Visual Words for Automatic Lip-Reading	Sep 17, 2014	Lip Readingspeech-recognition	—Unverified
Which phoneme-to-viseme maps best improve visual-only computer lip-reading?	Oct 3, 2017	Lip Readingspeech-recognition	—Unverified
Word-level Persian Lipreading Dataset	Apr 8, 2023	LipreadingLip Reading	—Unverified
Neuromorphic Facial Analysis with Cross-Modal Supervision	Sep 16, 2024	Lip Reading	—Unverified
Perception Point: Identifying Critical Learning Periods in Speech for Bilingual Networks	Oct 13, 2021	Lip Readingspeech-recognition	—Unverified
PixelRNN: In-pixel Recurrent Neural Networks for End-to-end-optimized Perception with Neural Sensors	Apr 11, 2023	Gesture RecognitionHand Gesture Recognition	—Unverified
Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence Lip-Reading	Mar 9, 2020	LipreadingLip Reading	—Unverified
Quantitative Analysis of Audio-Visual Tasks: An Information-Theoretic Perspective	Sep 29, 2024	Audio-Visual Speech RecognitionLip Reading	—Unverified
RAL:Redundancy-Aware Lipreading Model Based on Differential Learning with Symmetric Views	Sep 9, 2024	LipreadingLip Reading	—Unverified
Realistic Speech-Driven Facial Animation with GANs	Jun 14, 2019	Audio-Visual SynchronizationLip Reading	—Unverified
Relaxed Attention for Transformer Models	Sep 20, 2022	DecoderImage Classification	—Unverified
Resolution limits on visual speech recognition	Oct 3, 2017	Lip Readingspeech-recognition	—Unverified
Resource aware design of a deep convolutional-recurrent neural network for speech recognition through audio-visual sensor fusion	Mar 13, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Re-synchronization using the Hand Preceding Model for Multi-modal Fusion in Automatic Continuous Cued Speech Recognition	Feb 23, 2020	Lip ReadingPhoneme Recognition	—Unverified

Show:10 25 50

← PrevPage 5 of 7Next →

All datasets GRID corpus (mixed-speech)LRW TCD-TIMIT corpus (mixed-speech)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	14.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	34.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lip2Wav	WER	31.26	—	Unverified