Speech-to-Text Translation

Translate audio signals of speech in one language into text in a foreign language, either in an end-to-end or cascade manner.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–146 of 146 papers

Title	Date	Tasks	Status	Hype
TASK AWARE MULTI-TASK LEARNING FOR SPEECH TO TEXT TASKS	Jun 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Lightweight Adapter Tuning for Multilingual Speech Translation	Jun 2, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Investigating the Reordering Capability in CTC-based Non-Autoregressive End-to-End Speech Translation	May 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
End-to-End Speech Translation with Pre-trained Models and Adapters: UPC at IWSLT 2021	May 10, 2021	DecoderSegmentation	CodeCode Available	1
Learning Shared Semantic Space for Speech-to-Text Translation	May 7, 2021	Machine TranslationSpeech-to-Text	CodeCode Available	1
End-to-end Speech Translation via Cross-modal Progressive Training	Apr 21, 2021	Machine TranslationSpeech-to-Text	CodeCode Available	1
Towards Measuring Fairness in AI: the Casual Conversations Dataset	Apr 6, 2021	Age And Gender ClassificationDeepFake Detection	—Unverified	0
Towards the evaluation of automatic simultaneous speech translation from a communicative perspective	Mar 15, 2021	automatic-speech-translationInformativeness	—Unverified	0
NeurST: Neural Speech Translation Toolkit	Dec 18, 2020	Speech-to-Text TranslationTranslation	—Unverified	0
Dual-decoder Transformer for Joint Automatic Speech Recognition and Multilingual Speech Translation	Nov 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Bridging the Modality Gap for Speech-to-Text Translation	Oct 28, 2020	DecoderSpeech-to-Text	—Unverified	0
MAM: Masked Acoustic Modeling for End-to-End Speech-to-Text Translation	Oct 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Subtitles to Segmentation: Improving Low-Resource Speech-to-Text Translation Pipelines	Oct 19, 2020	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified	0
fairseq S2T: Fast Speech-to-Text Modeling with fairseq	Oct 11, 2020	Machine TranslationMulti-Task Learning	CodeCode Available	0
Consecutive Decoding for Speech-to-text Translation	Sep 21, 2020	DecoderMachine Translation	CodeCode Available	1
"Listen, Understand and Translate": Triple Supervision Decouples End-to-end Speech-to-text Translation	Sep 21, 2020	Speech-to-TextSpeech-to-Text Translation	CodeCode Available	1
Contextualized Translation of Automatically Segmented Speech	Aug 5, 2020	SegmentationSentence	—Unverified	0
CoVoST 2 and Massively Multilingual Speech-to-Text Translation	Jul 20, 2020	Machine Translationspeech-recognition	CodeCode Available	1
End-to-End Offline Speech Translation System for IWSLT 2020 using Modality Agnostic Meta-Learning	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
SimulSpeech: End-to-End Simultaneous Speech to Text Translation	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Self-Supervised Representations Improve End-to-End Speech Translation	Jun 22, 2020	Cross-Lingual Transferspeech-recognition	—Unverified	0
Improving Cross-Lingual Transfer Learning for End-to-End Speech Recognition with Speech Translation	Jun 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Subtitles to Segmentation: Improving Low-Resource Speech-to-TextTranslation Pipelines	May 1, 2020	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified	0
CoVoST: A Diverse Multilingual Speech-To-Text Translation Corpus	Feb 4, 2020	Speech-to-TextSpeech-to-Text Translation	CodeCode Available	1
FlexiBO: A Decoupled Cost-Aware Multi-Objective Optimization Approach for Deep Neural Networks	Jan 18, 2020	Bayesian OptimizationObject Detection	CodeCode Available	1
Synchronous Speech Recognition and Speech-to-Text Translation with Interactive Decoding	Dec 16, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
A Comparative Study on End-to-end Speech to Text Translation	Nov 20, 2019	Speech-to-TextSpeech-to-Text Translation	—Unverified	0
Data Efficient Direct Speech-to-Text Translation with Modality Agnostic Meta-Learning	Nov 11, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Europarl-ST: A Multilingual Corpus For Speech Translation Of Parliamentary Debates	Nov 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Analyzing ASR pretraining for low-resource speech-to-text translation	Oct 23, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Instance-Based Model Adaptation For Direct Speech Translation	Oct 23, 2019	Domain AdaptationSpeech-to-Text	—Unverified	0
Cross-lingual topic prediction for speech using translations	Aug 29, 2019	HumanitarianPrediction	—Unverified	0
Enhancing Transformer for End-to-end Speech-to-Text Translation	Aug 1, 2019	Speech-to-TextSpeech-to-Text Translation	—Unverified	0
Direct speech-to-speech translation with a sequence-to-sequence model	Apr 12, 2019	Speech SynthesisSpeech-to-Speech Translation	CodeCode Available	0
Leveraging Weakly Supervised Data to Improve End-to-End Speech-to-Text Translation	Nov 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Towards Unsupervised Speech-to-Text Translation	Nov 4, 2018	DenoisingLanguage Modeling	—Unverified	0
Pre-training on high-resource speech recognition improves low-resource speech-to-text translation	Sep 5, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Unsupervised Cross-Modal Alignment of Speech and Text Embedding Spaces	May 18, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Low-Resource Speech-to-Text Translation	Mar 24, 2018	DecoderMachine Translation	—Unverified	0
End-to-End Automatic Speech Translation of Audiobooks	Feb 12, 2018	automatic-speech-translationSpeech-to-Text	CodeCode Available	0
Augmenting Librispeech with French Translations: A Multimodal Corpus for Direct Speech Translation Evaluation	Feb 9, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Interpreting Strategies Annotation in the WAW Corpus	Sep 1, 2017	Machine TranslationSpeech-to-Text	—Unverified	0
Using of heterogeneous corpora for training of an ASR system	Jun 1, 2017	speech-recognitionSpeech Recognition	—Unverified	0
Towards speech-to-text translation without speech recognition	Feb 13, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Listen and Translate: A Proof of Concept for End-to-End Speech-to-Text Translation	Dec 6, 2016	Speech-to-TextSpeech-to-Text Translation	CodeCode Available	0
The USFD Spoken Language Translation System for IWSLT 2014	Sep 13, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 3 of 3Next →

All datasets MuST-C EN->DE MuST-C EN->ES MuST-C EN->FR CoVoST 2 eng-X CoVoST 2 X-eng FLEURS eng-X FLEURS X-eng libri-trans MediBeng MuST-C MuST-C EN->NL

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Task Modulation + Multitask Learning(ASR/MT) + Data Augmentation	Case-sensitive sacreBLEU	28.88	—	Unverified
2	Wav2Vec2.0+mBART+Adaptors	Case-sensitive sacreBLEU	28.22	—	Unverified
3	Transformer + Meta Learning(ASR/MT) + Data Augmentation	Case-sensitive sacreBLEU	27.51	—	Unverified
4	Transformer with Adapters	Case-sensitive sacreBLEU	24.63	—	Unverified
5	Dual-decoder Transformer	Case-sensitive sacreBLEU	23.63	—	Unverified
6	Speechformer	Case-sensitive sacreBLEU	23.6	—	Unverified
7	Transformer + ASR Pretrain	Case-sensitive sacreBLEU	22.8	—	Unverified
8	Transformer + ASR Pretrain	Case-sensitive sacreBLEU	22.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer with Adapters	Case-sensitive sacreBLEU	28.73	—	Unverified
2	Speechformer	Case-sensitive sacreBLEU	28.5	—	Unverified
3	Dual-decoder Transformer	Case-sensitive sacreBLEU	28.12	—	Unverified
4	Transformer + ASR Pretrain + SpecAug	Case-sensitive sacreBLEU	27.4	—	Unverified
5	Transformer + ASR Pretrain	Case-sensitive sacreBLEU	26.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Dual-decoder Transformer	Case-sensitive sacreBLEU	33.45	—	Unverified
2	Transformer + ASR Pretrain + SpecAug	Case-sensitive sacreBLEU	33.3	—	Unverified
3	Transformer + ASR Pretrain	Case-sensitive sacreBLEU	32.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SeamlessM4T Large	BLEU	30.6	—	Unverified
2	SeamlessM4T Medium	BLEU	26.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SeamlessM4T Large	BLEU	34.1	—	Unverified
2	SeamlessM4T Medium	BLEU	29.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SeamlessM4T Large	BLEU	21.5	—	Unverified
2	SeamlessM4T Medium	BLEU	19.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SeamlessM4T Large	BLEU	24	—	Unverified
2	SeamlessM4T Medium	BLEU	20.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer + ASR Pretrain + SpecAug	Case-insensitive sacreBLEU	17.2	—	Unverified
2	Transformer + ASR Pretrain	Case-insensitive sacreBLEU	16.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MediBeng Whisper Tiny	Bleu	0.98	—	Unverified
2	Whisper Tiny	Bleu	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer with Adapters	SacreBLEU	26.61	—	Unverified
2	Dual-decoder Transformer	SacreBLEU	25.62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Speechformer	Case-sensitive sacreBLEU	27.7	—	Unverified