Visual Speech Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–182 of 182 papers

Title	Date	Tasks	Status
Large-Scale Visual Speech Recognition	Jul 13, 2018	DecoderLipreading	—Unverified
Deep Lip Reading: a comparison of models and an online application	Jun 15, 2018	Language ModelingLanguage Modelling	—Unverified
Towards Lipreading Sentences with Active Appearance Models	May 29, 2018	Audio-Visual Speech RecognitionLipreading	—Unverified
Task-dependent modulation of the visual sensory thalamus assists visual-speech recognition	May 24, 2018	Face Identificationspeech-recognition	—Unverified
Visual-Only Recognition of Normal, Whispered and Silent Speech	Feb 18, 2018	Silent Speech Recognitionspeech-recognition	—Unverified
Deep word embeddings for visual speech recognition	Oct 30, 2017	Lipreadingspeech-recognition	CodeCode Available
Combining Multiple Views for Visual Speech Recognition	Oct 19, 2017	Sentencespeech-recognition	—Unverified
Visual Speech Recognition Using PCA Networks and LSTMs in a Tandem GMM-HMM System	Oct 19, 2017	Sentencespeech-recognition	—Unverified
Which phoneme-to-viseme maps best improve visual-only computer lip-reading?	Oct 3, 2017	Lip Readingspeech-recognition	—Unverified
Resolution limits on visual speech recognition	Oct 3, 2017	Lip Readingspeech-recognition	—Unverified
Visual speech recognition: aligning terminologies for better understanding	Oct 3, 2017	Lipreadingspeech-recognition	—Unverified
Multimodal Machine Learning: Integrating Language, Vision and Speech	Jul 1, 2017	Audio-Visual Speech RecognitionBIG-bench Machine Learning	—Unverified
Towards Estimating the Upper Bound of Visual-Speech Recognition: The Visual Lip-Reading Feasibility Database	Apr 26, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Multimodal Representation Learning from Temporal Data	Apr 11, 2017	Audio-Visual Speech RecognitionRepresentation Learning	—Unverified
Combining Residual Networks with LSTMs for Lipreading	Mar 12, 2017	LipreadingLip Reading	CodeCode Available
End-To-End Visual Speech Recognition With LSTMs	Jan 20, 2017	ClassificationGeneral Classification	—Unverified
Auxiliary Multimodal LSTM for Audio-visual Speech Recognition and Lipreading	Jan 16, 2017	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Lip Reading Sentences in the Wild	Nov 16, 2016	LipreadingLip Reading	—Unverified
Audio Visual Speech Recognition using Deep Recurrent Neural Networks	Nov 9, 2016	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
A three-dimensional approach to Visual Speech Recognition using Discrete Cosine Transforms	Sep 7, 2016	speech-recognitionSpeech Recognition	—Unverified
Manifold-Kernels Comparison in MKPLS for Visual Speech Recognition	Jan 22, 2016	speech-recognitionSpeech Recognition	—Unverified
Listening With Your Eyes: Towards a Practical Visual Speech Recognition System Using Deep Boltzmann Machines	Dec 1, 2015	speech-recognitionSpeech Recognition	—Unverified
Video-Based Action Recognition Using Rate-Invariant Analysis of Covariance Trajectories	Mar 23, 2015	Action RecognitionGeneral Classification	—Unverified
Deep Multimodal Learning for Audio-Visual Speech Recognition	Jan 22, 2015	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Visual Words for Automatic Lip-Reading	Sep 17, 2014	Lip Readingspeech-recognition	—Unverified
Visual Speech Recognition	Sep 3, 2014	Audio-Visual Speech RecognitionLip Reading	—Unverified
Recognition of Isolated Words using Zernike and MFCC features for Audio Visual Speech Recognition	Jul 4, 2014	Audio-Visual Speech RecognitionAutomatic Speech Recognition	—Unverified
Preliminary Test of a Real-Time, Interactive Silent Speech Interface Based on Electromagnetic Articulograph	Jun 1, 2014	Speech RecognitionVisual Speech Recognition	—Unverified
Rate-Invariant Analysis of Trajectories on Riemannian Manifolds with Application in Visual Speech Recognition	Jun 1, 2014	Activity RecognitionClassification	—Unverified
MKPLS: Manifold Kernel Partial Least Squares for Lipreading and Speaker Identification	Jun 1, 2013	LipreadingSpeaker Identification	—Unverified
SUTAV: A Turkish Audio-Visual Database	May 1, 2012	Audio-Visual Speech RecognitionPerson Identification	—Unverified
Building a synchronous corpus of acoustic and 3D facial marker data for adaptive audio-visual speech synthesis	May 1, 2012	Audio-Visual Speech RecognitionSpeech Recognition	—Unverified

Show:10 25 50

← PrevPage 4 of 4Next →

All datasets LRS3-TED LRS2

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	VTP with more data	Word Error Rate (WER)	30.7	—	Unverified
2	CTC/Attention	Word Error Rate (WER)	19.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VTP with more data	Word Error Rate (WER)	22.6	—	Unverified