Topic Classification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 186 papers

Title	Date	Tasks	Status	Hype
On Multilingual Encoder Language Model Compression for Low-Resource Languages	May 22, 2025	Knowledge DistillationLanguage Modeling	—Unverified	0
A Multi-Task Benchmark for Abusive Language Detection in Low-Resource Settings	May 17, 2025	Abusive LanguageTopic Classification	CodeCode Available	0
Low-Resource Language Processing: An OCR-Driven Summarization and Translation Pipeline	May 16, 2025	Abstractive Text SummarizationLanguage Modeling	CodeCode Available	0
A thorough benchmark of automatic text classification: From traditional approaches to large language models	Apr 2, 2025	Sentiment Analysistext-classification	CodeCode Available	0
Detection of Somali-written Fake News and Toxic Messages on the Social Media Using Transformer-based Language Models	Mar 23, 2025	Language ModelingLanguage Modelling	—Unverified	0
A Statistical Theory of Contrastive Learning via Approximate Sufficient Statistics	Mar 21, 2025	Contrastive LearningData Augmentation	—Unverified	0
Reading the unreadable: Creating a dataset of 19th century English newspapers using image-to-text language models	Feb 18, 2025	Image to textOptical Character Recognition	CodeCode Available	0
Concept Navigation and Classification via Open-Source Large Language Model Processing	Feb 7, 2025	ArticlesLanguage Modeling	—Unverified	0
Analyzing the Effect of Linguistic Similarity on Cross-Lingual Transfer: Tasks and Experimental Setups Matter	Jan 24, 2025	Cross-Lingual TransferDependency Parsing	—Unverified	0
Evaluating Pixel Language Models on Non-Standardized Languages	Dec 12, 2024	Dependency ParsingIntent Detection	—Unverified	0
DISHONEST: Dissecting misInformation Spread using Homogeneous sOcial NEtworks and Semantic Topic classification	Dec 12, 2024	MisinformationTopic Classification	—Unverified	0
LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification	Nov 29, 2024	ArticlesClassification	CodeCode Available	0
QuickCharNet: An Efficient URL Classification Framework for Enhanced Search Engine Optimization	Oct 22, 2024	ClassificationEfficient Neural Network	CodeCode Available	0
From Measurement Instruments to Data: Leveraging Theory-Driven Synthetic Training Data for Classifying Social Constructs	Oct 16, 2024	Classificationtext-classification	—Unverified	0
Inference and Verbalization Functions During In-Context Learning	Oct 12, 2024	In-Context LearningNatural Language Inference	CodeCode Available	0
The Large Language Model GreekLegalRoBERTa	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified	0
Language Model-Driven Data Pruning Enables Efficient Active Learning	Oct 5, 2024	Active LearningLanguage Modeling	—Unverified	0
Multilingual Topic Classification in X: Dataset and Analysis	Oct 4, 2024	ClassificationDiversity	—Unverified	0
GrEmLIn: A Repository of Green Baseline Embeddings for 87 Low-Resource Languages Injected with Multilingual Graph Knowledge	Sep 26, 2024	Natural Language InferenceSentiment Analysis	CodeCode Available	1
Optimal and efficient text counterfactuals using Graph Neural Networks	Aug 4, 2024	counterfactualDecision Making	CodeCode Available	0
Assessing In-context Learning and Fine-tuning for Topic Classification of German Web Data	Jul 23, 2024	Binary ClassificationIn-Context Learning	—Unverified	0
Automatic Classification of News Subjects in Broadcast News: Application to a Gender Bias Representation Analysis	Jul 19, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Multi-task Prompt Words Learning for Social Media Content Generation	Jul 10, 2024	Keyword ExtractionScene Recognition	—Unverified	0
STF: Sentence Transformer Fine-Tuning For Topic Categorization With Limited Data	Jul 3, 2024	ClassificationSentence	—Unverified	0
Retrieval Augmented Zero-Shot Text Classification	Jun 21, 2024	ClassificationRetrieval	CodeCode Available	0
Newswire: A Large-Scale Structured Database of a Century of Historical News	Jun 13, 2024	ArticlesEntity Disambiguation	CodeCode Available	1
Topic Classification of Case Law Using a Large Language Model and a New Taxonomy for UK Law: AI Insights into Summary Judgment	May 21, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation	May 16, 2024	Bias DetectionDiversity	CodeCode Available	1
InsightNet: Structured Insight Mining from Customer Feedback	May 12, 2024	Semantic SimilaritySemantic Textual Similarity	—Unverified	0
Addressing Topic Granularity and Hallucination in Large Language Models for Topic Modelling	May 1, 2024	HallucinationTopic Classification	CodeCode Available	0
What Drives Performance in Multilingual Language Models?	Apr 29, 2024	Cross-Lingual TransferMultilingual NLP	CodeCode Available	0
L3Cube-MahaNews: News-based Short Text and Long Document Classification Datasets in Marathi	Apr 28, 2024	ArticlesDocument Classification	—Unverified	0
Forget NLI, Use a Dictionary: Zero-Shot Topic Classification for Low-Resource Languages with Application to Luxembourgish	Apr 5, 2024	Language ModellingNatural Language Inference	CodeCode Available	0
Few-Shot Cross-Lingual Transfer for Prompting Large Language Models in Low-Resource Languages	Mar 9, 2024	Abstractive Text SummarizationCross-Lingual Transfer	—Unverified	0
Zero-Shot Topic Classification of Column Headers: Leveraging LLMs for Metadata Enrichment	Mar 1, 2024	Retrievaltext-classification	CodeCode Available	0
LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons	Feb 21, 2024	Sentiment AnalysisTopic Classification	CodeCode Available	1
Prompt-Based Bias Calibration for Better Zero/Few-Shot Learning of Language Models	Feb 15, 2024	FairnessFew-Shot Learning	—Unverified	0
Advancing NLP Models with Strategic Text Augmentation: A Comprehensive Study of Augmentation Methods and Curriculum Strategies	Feb 14, 2024	Sentiment AnalysisText Augmentation	—Unverified	0
L3Cube-IndicNews: News-based Short Text and Long Document Classification Datasets in Indic Languages	Jan 4, 2024	ArticlesClassification	CodeCode Available	1
Iterative Mask Filling: An Effective Text Augmentation Method Using Masked Language Modeling	Jan 3, 2024	Data Augmentationfill-mask	—Unverified	0
A Soft Contrastive Learning-based Prompt Model for Few-shot Sentiment Analysis	Dec 16, 2023	ClassificationContrastive Learning	—Unverified	0
DRAFT: Dense Retrieval Augmented Few-shot Topic classifier Framework	Dec 5, 2023	ClassificationIn-Context Learning	CodeCode Available	0
NLEBench+NorGLM: A Comprehensive Empirical Analysis and Benchmark Dataset for Generative Language Models in Norwegian	Dec 3, 2023	Natural Language UnderstandingQuestion Answering	CodeCode Available	0
How good are Large Language Models on African Languages?	Nov 14, 2023	In-Context LearningLanguage Modelling	—Unverified	0
Attention-Enhancing Backdoor Attacks Against BERT-based Models	Oct 23, 2023	Sentiment AnalysisTopic Classification	—Unverified	0
Domain-Specific Language Model Post-Training for Indonesian Financial NLP	Oct 15, 2023	Language ModelingLanguage Modelling	CodeCode Available	0
In-Context Learning with Iterative Demonstration Selection	Oct 15, 2023	Few-Shot LearningIn-Context Learning	CodeCode Available	1
HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model	Oct 6, 2023	Automatic Speech RecognitionRepresentation Learning	—Unverified	0
UPB @ ACTI: Detecting Conspiracies using fine tuned Sentence Transformers	Sep 28, 2023	Binary ClassificationClassification	—Unverified	0
Machine-assisted quantitizing designs: augmenting humanities and social sciences with artificial intelligence	Sep 24, 2023	BenchmarkingChange Detection	CodeCode Available	0

Show:10 25 50

← PrevPage 1 of 4Next →

No leaderboard results yet.