Topic Classification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 186 papers

Title	Date	Tasks	Status	Hype
Prototypical Verbalizer for Prompt-based Few-shot Tuning	Mar 18, 2022	Contrastive LearningEntity Typing	CodeCode Available	4
GrEmLIn: A Repository of Green Baseline Embeddings for 87 Low-Resource Languages Injected with Multilingual Graph Knowledge	Sep 26, 2024	Natural Language InferenceSentiment Analysis	CodeCode Available	1
Newswire: A Large-Scale Structured Database of a Century of Historical News	Jun 13, 2024	ArticlesEntity Disambiguation	CodeCode Available	1
SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation	May 16, 2024	Bias DetectionDiversity	CodeCode Available	1
LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons	Feb 21, 2024	Sentiment AnalysisTopic Classification	CodeCode Available	1
L3Cube-IndicNews: News-based Short Text and Long Document Classification Datasets in Indic Languages	Jan 4, 2024	ArticlesClassification	CodeCode Available	1
In-Context Learning with Iterative Demonstration Selection	Oct 15, 2023	Few-Shot LearningIn-Context Learning	CodeCode Available	1
SIB-200: A Simple, Inclusive, and Big Evaluation Dataset for Topic Classification in 200+ Languages and Dialects	Sep 14, 2023	Cross-Lingual TransferLanguage Modelling	CodeCode Available	1
Zero-Shot Text Classification via Self-Supervised Tuning	May 19, 2023	ClassificationSelf-Supervised Learning	CodeCode Available	1
MasakhaNEWS: News Topic Classification for African languages	Apr 19, 2023	ClassificationFew-Shot Learning	CodeCode Available	1
TEMPERA: Test-Time Prompting via Reinforcement Learning	Nov 21, 2022	Few-Shot LearningNatural Language Inference	CodeCode Available	1
Hierarchical Multi-Label Classification of Scientific Documents	Nov 5, 2022	ClassificationHierarchical Multi-label Classification	CodeCode Available	1
HUE: Pretrained Model and Dataset for Understanding Hanja Documents of Ancient Korea	Oct 11, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Polyglot Prompt: Multilingual Multitask PrompTraining	Apr 29, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Label Semantic Aware Pre-training for Few-shot Text Classification	Apr 14, 2022	ClassificationFew-Shot Text Classification	CodeCode Available	1
Adapting Pre-trained Language Models to African Languages via Multilingual Adaptive Fine-Tuning	Apr 13, 2022	Cross-Lingual TransferLanguage Modelling	CodeCode Available	1
MultiEURLEX - A multi-lingual and multi-label legal document classification dataset for zero-shot cross-lingual transfer	Nov 1, 2021	Cross-Lingual TransferDocument Classification	CodeCode Available	1
MultiEURLEX -- A multi-lingual and multi-label legal document classification dataset for zero-shot cross-lingual transfer	Sep 2, 2021	Cross-Lingual TransferDocument Classification	CodeCode Available	1
Mind Your Outliers! Investigating the Negative Impact of Outliers on Active Learning for Visual Question Answering	Jul 6, 2021	Active LearningObject Recognition	CodeCode Available	1
KLUE: Korean Language Understanding Evaluation	May 20, 2021	Dependency ParsingDialogue State Tracking	CodeCode Available	1
DocSCAN: Unsupervised Text Classification via Learning from Neighbors	May 9, 2021	ClassificationClustering	CodeCode Available	1
Entailment as Few-Shot Learner	Apr 29, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
Explaining NLP Models via Minimal Contrastive Editing (MiCE)	Dec 27, 2020	counterfactualMultiple-choice	CodeCode Available	1
Language Through a Prism: A Spectral Approach for Multiscale Language Representations	Nov 9, 2020	Part-Of-Speech TaggingTopic Classification	CodeCode Available	1
Revisiting LSTM Networks for Semi-Supervised Text Classification via Mixed Objective Function	Sep 8, 2020	ClassificationGeneral Classification	CodeCode Available	1
2kenize: Tying Subword Sequences for Chinese Script Conversion	May 7, 2020	General ClassificationTopic Classification	CodeCode Available	1
Hierarchical Transformers for Long Document Classification	Oct 23, 2019	ClassificationDocument Classification	CodeCode Available	1
Cross-Lingual Adaptation using Structural Correspondence Learning	Aug 4, 2010	ClassificationDomain Adaptation	CodeCode Available	1
On Multilingual Encoder Language Model Compression for Low-Resource Languages	May 22, 2025	Knowledge DistillationLanguage Modeling	—Unverified	0
A Multi-Task Benchmark for Abusive Language Detection in Low-Resource Settings	May 17, 2025	Abusive LanguageTopic Classification	CodeCode Available	0
Low-Resource Language Processing: An OCR-Driven Summarization and Translation Pipeline	May 16, 2025	Abstractive Text SummarizationLanguage Modeling	CodeCode Available	0
A thorough benchmark of automatic text classification: From traditional approaches to large language models	Apr 2, 2025	Sentiment Analysistext-classification	CodeCode Available	0
Detection of Somali-written Fake News and Toxic Messages on the Social Media Using Transformer-based Language Models	Mar 23, 2025	Language ModelingLanguage Modelling	—Unverified	0
A Statistical Theory of Contrastive Learning via Approximate Sufficient Statistics	Mar 21, 2025	Contrastive LearningData Augmentation	—Unverified	0
Reading the unreadable: Creating a dataset of 19th century English newspapers using image-to-text language models	Feb 18, 2025	Image to textOptical Character Recognition	CodeCode Available	0
Concept Navigation and Classification via Open-Source Large Language Model Processing	Feb 7, 2025	ArticlesLanguage Modeling	—Unverified	0
Analyzing the Effect of Linguistic Similarity on Cross-Lingual Transfer: Tasks and Experimental Setups Matter	Jan 24, 2025	Cross-Lingual TransferDependency Parsing	—Unverified	0
Evaluating Pixel Language Models on Non-Standardized Languages	Dec 12, 2024	Dependency ParsingIntent Detection	—Unverified	0
DISHONEST: Dissecting misInformation Spread using Homogeneous sOcial NEtworks and Semantic Topic classification	Dec 12, 2024	MisinformationTopic Classification	—Unverified	0
LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification	Nov 29, 2024	ArticlesClassification	CodeCode Available	0
QuickCharNet: An Efficient URL Classification Framework for Enhanced Search Engine Optimization	Oct 22, 2024	ClassificationEfficient Neural Network	CodeCode Available	0
From Measurement Instruments to Data: Leveraging Theory-Driven Synthetic Training Data for Classifying Social Constructs	Oct 16, 2024	Classificationtext-classification	—Unverified	0
Inference and Verbalization Functions During In-Context Learning	Oct 12, 2024	In-Context LearningNatural Language Inference	CodeCode Available	0
The Large Language Model GreekLegalRoBERTa	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified	0
Language Model-Driven Data Pruning Enables Efficient Active Learning	Oct 5, 2024	Active LearningLanguage Modeling	—Unverified	0
Multilingual Topic Classification in X: Dataset and Analysis	Oct 4, 2024	ClassificationDiversity	—Unverified	0
Optimal and efficient text counterfactuals using Graph Neural Networks	Aug 4, 2024	counterfactualDecision Making	CodeCode Available	0
Assessing In-context Learning and Fine-tuning for Topic Classification of German Web Data	Jul 23, 2024	Binary ClassificationIn-Context Learning	—Unverified	0
Automatic Classification of News Subjects in Broadcast News: Application to a Gender Bias Representation Analysis	Jul 19, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Multi-task Prompt Words Learning for Social Media Content Generation	Jul 10, 2024	Keyword ExtractionScene Recognition	—Unverified	0

Show:10 25 50

← PrevPage 1 of 4Next →

No leaderboard results yet.