Multilingual NLP

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 96 papers

Title	Date	Tasks	Status	Hype
BLOOM: A 176B-Parameter Open-Access Multilingual Language Model	Nov 9, 2022	DecoderLanguage Modeling	CodeCode Available	4
On Bilingual Lexicon Induction with Large Language Models	Oct 21, 2023	Bilingual Lexicon InductionCross-Lingual Word Embeddings	CodeCode Available	1
XTREME-UP: A User-Centric Scarce-Data Benchmark for Under-Represented Languages	May 19, 2023	In-Context LearningMultilingual NLP	CodeCode Available	1
Improving Bilingual Lexicon Induction with Cross-Encoder Reranking	Oct 30, 2022	Bilingual Lexicon InductionCross Encoder Reranking	CodeCode Available	1
DetIE: Multilingual Open Information Extraction Inspired by Object Detection	Jun 24, 2022	Multilingual NLPObject	CodeCode Available	1
Improving Word Translation via Two-Stage Contrastive Learning	Mar 15, 2022	Bilingual Lexicon InductionContrastive Learning	CodeCode Available	1
Improving Word Translation via Two-Stage Contrastive Learning	Nov 16, 2021	Bilingual Lexicon InductionContrastive Learning	CodeCode Available	1
WikiNEuRal: Combined Neural and Knowledge-based Silver Data Creation for Multilingual NER	Nov 1, 2021	Domain AdaptationMultilingual Named Entity Recognition	CodeCode Available	1
HONEST: Measuring Hurtful Sentence Completion in Language Models	Jun 1, 2021	Hate Speech DetectionHurtful Sentence Completion	CodeCode Available	1
Samanantar: The Largest Publicly Available Parallel Corpora Collection for 11 Indic Languages	Apr 12, 2021	Machine TranslationMultilingual NLP	CodeCode Available	1
Trankit: A Light-Weight Transformer-based Toolkit for Multilingual Natural Language Processing	Jan 9, 2021	Dependency ParsingLanguage Modeling	CodeCode Available	1
fugashi, a Tool for Tokenizing Japanese in Python	Oct 14, 2020	Multilingual NLP	CodeCode Available	1
Language-agnostic BERT Sentence Embedding	Jul 3, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Simultaneous Translation and Paraphrase for Language Education	Jul 1, 2020	Machine TranslationMultilingual NLP	CodeCode Available	1
PMIndia -- A Collection of Parallel Corpora of Languages of India	Jan 27, 2020	Machine TranslationMultilingual NLP	CodeCode Available	1
Unsupervised Cross-lingual Representation Learning at Scale	Nov 5, 2019	Cross-Lingual TransferLanguage Modeling	CodeCode Available	1
Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks	May 30, 2025	Cross-Lingual TransferMultilingual NLP	—Unverified	0
SenWiCh: Sense-Annotation of Low-Resource Languages for WiC using Hybrid Methods	May 29, 2025	Cross-Lingual TransferMultilingual NLP	—Unverified	0
LAGO: Few-shot Crosslingual Embedding Inversion Attacks via Language Similarity-Aware Graph Optimization	May 21, 2025	Distributed OptimizationMultilingual NLP	—Unverified	0
Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities	May 21, 2025	MemorizationMultilingual NLP	—Unverified	0
Cross-Linguistic Transfer in Multilingual NLP: The Role of Language Families and Morphology	May 20, 2025	Cross-Lingual TransferMultilingual NLP	—Unverified	0
HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing	May 20, 2025	Language ModelingLanguage Modelling	—Unverified	0
Multilingual Prompt Engineering in Large Language Models: A Survey Across NLP Tasks	May 16, 2025	Multilingual NLPPrompt Engineering	—Unverified	0
Bias Beyond English: Evaluating Social Bias and Debiasing Methods in a Low-Resource Setting	Apr 15, 2025	FairnessMultilingual NLP	—Unverified	0
Poly-FEVER: A Multilingual Fact Verification Benchmark for Hallucination Detection in Large Language Models	Mar 19, 2025	Fact CheckingFact Verification	—Unverified	0
Code-Mixed Telugu-English Hate Speech Detection	Feb 15, 2025	Hate Speech DetectionMultilingual NLP	—Unverified	0
How does a Multilingual LM Handle Multiple Languages?	Feb 6, 2025	Multilingual NLPMultilingual Word Embeddings	—Unverified	0
How Good is Your Wikipedia? Auditing Data Quality for Low-resource and Multilingual NLP	Nov 8, 2024	ArticlesMultilingual NLP	—Unverified	0
Don't Touch My Diacritics	Oct 31, 2024	Multilingual NLP	—Unverified	0
SandboxAQ's submission to MRL 2024 Shared Task on Multi-lingual Multi-task Information Retrieval	Oct 28, 2024	Information RetrievalMultilingual Named Entity Recognition	—Unverified	0
Adapting LLMs to Hebrew: Unveiling DictaLM 2.0 with Enhanced Vocabulary and Instruction Capabilities	Jul 9, 2024	Multilingual NLPQuestion Answering	—Unverified	0
On the Evaluation Practices in Multilingual NLP: Can Machine Translation Offer an Alternative to Human Translations?	Jun 20, 2024	Machine TranslationMultilingual NLP	—Unverified	0
Dravidian language family through Universal Dependencies lens	Jun 20, 2024	Multilingual NLP	—Unverified	0
Leveraging Large Language Models to Measure Gender Representation Bias in Gendered Language Corpora	Jun 19, 2024	Multilingual NLP	—Unverified	0
News Without Borders: Domain Adaptation of Multilingual Sentence Embeddings for Cross-lingual News Recommendation	Jun 18, 2024	Cross-Lingual TransferDomain Adaptation	CodeCode Available	0
ProxyLM: Predicting Language Model Performance on Multilingual Tasks via Proxy Models	Jun 13, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Benchmarking the Performance of Pre-trained LLMs across Urdu NLP Tasks	May 24, 2024	BenchmarkingDecoder	—Unverified	0
A Reproducibility Study on Quantifying Language Similarity: The Impact of Missing Values in the URIEL Knowledge Base	May 17, 2024	Missing ValuesMultilingual NLP	—Unverified	0
Analyzing Language Bias Between French and English in Conventional Multilingual Sentiment Analysis Models	May 7, 2024	Multilingual NLPSentiment Analysis	CodeCode Available	0
UQA: Corpus for Urdu Question Answering	May 2, 2024	Multilingual NLPQuestion Answering	CodeCode Available	0
What Drives Performance in Multilingual Language Models?	Apr 29, 2024	Cross-Lingual TransferMultilingual NLP	CodeCode Available	0
Introducing Syllable Tokenization for Low-resource Languages: A Case Study with Swahili	Mar 26, 2024	Multilingual NLPText Generation	—Unverified	0
Is Translation All You Need? A Study on Solving Multilingual Tasks with Large Language Models	Mar 15, 2024	AllMultilingual NLP	—Unverified	0
A Measure for Transparent Comparison of Linguistic Diversity in Multilingual NLP Data Sets	Mar 6, 2024	DiversityMultilingual NLP	CodeCode Available	0
Self-Augmented In-Context Learning for Unsupervised Word Translation	Feb 15, 2024	Bilingual Lexicon InductionCross-Lingual Word Embeddings	CodeCode Available	0
What is "Typological Diversity" in NLP?	Feb 6, 2024	DiversityMultilingual NLP	CodeCode Available	0
Patterns of Persistence and Diffusibility across the World's Languages	Jan 3, 2024	Multilingual NLP	—Unverified	0
Multilingual Word Embeddings for Low-Resource Languages using Anchors and a Chain of Related Languages	Nov 21, 2023	Bilingual Lexicon InductionMultilingual NLP	—Unverified	0
Multi-teacher Distillation for Multilingual Spelling Correction	Nov 20, 2023	Multilingual NLPSpeech-to-Text	—Unverified	0
A Systematic Study of Performance Disparities in Multilingual Task-Oriented Dialogue Systems	Oct 19, 2023	Language ModelingLanguage Modelling	—Unverified	0

Show:10 25 50

← PrevPage 1 of 2Next →

No leaderboard results yet.