Cross-Lingual Document Classification

Cross-lingual document classification refers to the task of using data and models available for one language for which ample such resources are available (e.g., English) to solve classification tasks in another, commonly low-resource, language.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 25 papers

Title	Date	Tasks	Status	Hype
Multilingual and cross-lingual document classification: A meta-learning approach	Jan 27, 2021	Cross-Lingual Document ClassificationDocument Classification	CodeCode Available	1
Margin-aware Unsupervised Domain Adaptation for Cross-lingual Text Labeling	Nov 1, 2020	Cross-Lingual Document ClassificationDocument Classification	—Unverified	0
Robust Cross-lingual Embeddings from Parallel Sentences	Dec 28, 2019	Cross-Lingual Document ClassificationCross-Lingual Word Embeddings	CodeCode Available	0
Wasserstein distances for evaluating cross-lingual embeddings	Oct 24, 2019	Cross-Lingual Document ClassificationDocument Classification	—Unverified	0
ZeRO: Memory Optimizations Toward Training Trillion Parameter Models	Oct 4, 2019	Cross-Lingual Document ClassificationImage Generation	CodeCode Available	1
Bridging the domain gap in cross-lingual document classification	Sep 16, 2019	ClassificationCross-Domain Document Classification	CodeCode Available	0
MultiFiT: Efficient Multi-lingual Language Model Fine-tuning	Sep 10, 2019	Cross-Lingual Document ClassificationDocument Classification	CodeCode Available	1
Massively Multilingual Sentence Embeddings for Zero-Shot Cross-Lingual Transfer and Beyond	Dec 26, 2018	Cross-Lingual Bitext MiningCross-Lingual Document Classification	CodeCode Available	1
Exploiting Cross-Lingual Subword Similarities in Low-Resource Document Classification	Dec 22, 2018	ClassificationCross-Lingual Document Classification	—Unverified	0
Variational learning across domains with triplet information	Oct 22, 2018	Cross-Lingual Document ClassificationDocument Classification	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets MLDoc Zero-Shot English-to-French MLDoc Zero-Shot English-to-Spanish MLDoc Zero-Shot English-to-Chinese MLDoc Zero-Shot English-to-German MLDoc Zero-Shot English-to-Russian MLDoc Zero-Shot English-to-Italian MLDoc Zero-Shot English-to-Japanese Reuters RCV1/RCV2 English-to-German Reuters RCV1/RCV2 German-to-English MLDoc Zero-Shot German-to-French

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	XLMft UDA	Accuracy	96.05	—	Unverified
2	MultiFiT, pseudo	Accuracy	89.42	—	Unverified
3	Massively Multilingual Sentence Embeddings	Accuracy	77.95	—	Unverified
4	BiLSTM (UN)	Accuracy	74.52	—	Unverified
5	BiLSTM (Europarl)	Accuracy	72.83	—	Unverified
6	MultiCCA + CNN	Accuracy	72.38	—	Unverified