Speech-to-Text

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 403 papers

Title	Date	Tasks	Status
Learning Adaptive Segmentation Policy for End-to-End Simultaneous Translation	May 1, 2022	SegmentationSimultaneous Speech-to-Text Translation	—Unverified
NAIST Simultaneous Speech-to-Text Translation System for IWSLT 2022	May 1, 2022	SegmentationSimultaneous Speech-to-Text Translation	—Unverified
The AISP-SJTU Simultaneous Translation System for IWSLT 2022	May 1, 2022	Speech-to-TextTranslation	—Unverified
The HW-TSC’s Simultaneous Speech Translation System for IWSLT 2022 Evaluation	May 1, 2022	ChunkingSentence	—Unverified
LibriS2S: A German-English Speech-to-Speech Translation Corpus	Apr 22, 2022	Speech-to-Speech TranslationSpeech-to-Text	CodeCode Available
WaBERT: A Low-resource End-to-end Model for Spoken Language Understanding and Speech-to-BERT Alignment	Apr 22, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Enhanced Direct Speech-to-Speech Translation Using Self-supervised Pre-training and Data Augmentation	Apr 6, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Study of Gender Impact in Self-supervised Models for Speech-to-Text Systems	Apr 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Deep Speech Based End-to-End Automated Speech Recognition (ASR) for Indian-English Accents	Apr 3, 2022	speech-recognitionSpeech Recognition	—Unverified
The MIT Voice Name System	Mar 28, 2022	Speech-to-Text	—Unverified
A Dataset for Speech Emotion Recognition in Greek Theatrical Plays	Mar 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
XTREME-S: Evaluating Cross-lingual Speech Representations	Mar 21, 2022	Representation LearningRetrieval	—Unverified
A combined approach to the analysis of speech conversations in a contact center domain	Mar 12, 2022	Speech-to-Text	—Unverified
Attacks as Defenses: Designing Robust Audio CAPTCHAs Using Attacks on Automatic Speech Recognition Systems	Mar 10, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Which French speech recognition system for assistant robots?	Mar 4, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Spanish and English Phoneme Recognition by Training on Simulated Classroom Audio Recordings of Collaborative Learning Environments	Feb 21, 2022	Data AugmentationPhoneme Recognition	CodeCode Available
Punctuation restoration in Swedish through fine-tuned KB-BERT	Feb 14, 2022	Language ModellingPunctuation Restoration	—Unverified
Semantic-aware Speech to Text Transmission with Redundancy Removal	Feb 7, 2022	Semantic CommunicationSpeech-to-Text	—Unverified
Optimization of a Real-Time Wavelet-Based Algorithm for Improving Speech Intelligibility	Feb 5, 2022	Speech EnhancementSpeech-to-Text	—Unverified
A wearable sensor vest for social humanoid robots with GPGPU, IoT, and modular software architecture	Jan 6, 2022	Speech-to-Texttext-to-speech	CodeCode Available
InstaIndoor and Multi-modal Deep Learning for Indoor Scene Recognition	Dec 23, 2021	BenchmarkingDeep Learning	CodeCode Available
Cross-modal Contrastive Learning for Speech Translation	Dec 17, 2021	Contrastive LearningRetrieval	—Unverified
Training end-to-end speech-to-text models on mobile phones	Dec 7, 2021	CPUSpeech-to-Text	—Unverified
Impact of Microphone position Measurement Error on Multi Channel Distant Speech Recognition & Intelligibility	Dec 1, 2021	Distant Speech RecognitionPosition	—Unverified
Improve Sinhala Speech Recognition Through e2e LF-MMI Model	Dec 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Experiment on Speech-to-Text Translation Systems for Manipuri to English on Low Resource Setting	Dec 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Scribosermo: Fast Speech-to-Text models for German and other Languages	Oct 15, 2021	Speech RecognitionSpeech-to-Text	CodeCode Available
Decision Attentive Regularization to Improve Simultaneous Speech Translation Systems	Oct 13, 2021	SentenceSimultaneous Speech-to-Text Translation	—Unverified
Comparison of SVD and factorized TDNN approaches for speech to text	Oct 13, 2021	Speech-to-Text	—Unverified
A Comparative Study on Non-Autoregressive Modelings for Speech-to-Text Generation	Oct 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automated Testing of AI Models	Oct 7, 2021	FairnessSpeech-to-Text	—Unverified
Challenges and Opportunities of Speech Recognition for Bengali Language	Sep 27, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Audio Interval Retrieval using Convolutional Neural Networks	Sep 21, 2021	Audio ClassificationRetrieval	—Unverified
Wav-BERT: Cooperative Acoustic and Linguistic Representation Learning for Low-Resource Speech Recognition	Sep 19, 2021	Language ModelingLanguage Modelling	—Unverified
Infusing Future Information into Monotonic Attention Through Language Models	Sep 7, 2021	Language ModelingLanguage Modelling	CodeCode Available
With One Voice: Composing a Travel Voice Assistant from Re-purposed Models	Aug 4, 2021	BIG-bench Machine Learningnamed-entity-recognition	—Unverified
Multilingual Speech Translation from Efficient Finetuning of Pretrained Models	Aug 1, 2021	DecoderSpeech-to-Text	—Unverified
Corpus Creation and Evaluation for Speech-to-Text and Speech Translation	Aug 1, 2021	Machine TranslationSpeech-to-Text	—Unverified
BTS: Back TranScription for Speech-to-Text Post-Processor using Text-to-Speech-to-Text	Aug 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Speech Translation by Understanding and Learning from the Auxiliary Text Translation Task	Jul 12, 2021	DecoderKnowledge Distillation	—Unverified
The USTC-NELSLIP Systems for Simultaneous Speech Translation Task at IWSLT 2021	Jul 1, 2021	Data AugmentationSpeech-to-Text	—Unverified
Pay Better Attention to Attention: Head Selection in Multilingual and Multi-Domain Sequence Modeling	Jun 21, 2021	speech-recognitionSpeech Recognition	—Unverified
Direct Simultaneous Speech-to-Text Translation Assisted by Synchronized Streaming ASR	Jun 11, 2021	Simultaneous Speech-to-Text TranslationSpeech-to-Text	—Unverified
TASK AWARE MULTI-TASK LEARNING FOR SPEECH TO TEXT TASKS	Jun 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On the Design of Strategic Task Recommendations for Sustainable Crowdsourcing-Based Content Moderation	Jun 4, 2021	Recommendation SystemsSpeech-to-Text	—Unverified
Findings of the Second Workshop on Automatic Simultaneous Translation	Jun 1, 2021	Machine TranslationSpeech-to-Text	—Unverified
Worldly Wise (WoW) - Cross-Lingual Knowledge Fusion for Fact-based Visual Spoken-Question Answering	Jun 1, 2021	Knowledge GraphsQuestion Answering	—Unverified
What shall we do with an hour of data? Speech recognition for the un- and under-served languages of Common Voice	May 10, 2021	speech-recognitionSpeech Recognition	—Unverified
A Benchmarking on Cloud based Speech-To-Text Services for French Speech and Background Noise Effect	May 7, 2021	BenchmarkingSpeech-to-Text	—Unverified
Bridging the gap between streaming and non-streaming ASR systems bydistilling ensembles of CTC and RNN-T models	Apr 25, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 6 of 9Next →

No leaderboard results yet.