Token Classification

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 99 papers

Title	Date	Tasks	Status	Hype
LLMLingua-2: Data Distillation for Efficient and Faithful Task-Agnostic Prompt Compression	Mar 19, 2024	GSM8KLanguage Modelling	CodeCode Available	9
AutoTrain: No-code training for state-of-the-art models	Oct 21, 2024	Classificationimage-classification	CodeCode Available	7
LettuceDetect: A Hallucination Detection Framework for RAG Applications	Feb 24, 2025	8kGPU	CodeCode Available	4
Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation	Feb 27, 2025	Image Generationtoken-classification	CodeCode Available	3
VNLP: Turkish NLP Package	Mar 2, 2024	Morphological Analysisnamed-entity-recognition	CodeCode Available	2
NLRG at SemEval-2021 Task 5: Toxic Spans Detection Leveraging BERT-based Token Classification and Span Prediction Techniques	Feb 24, 2021	NERtoken-classification	CodeCode Available	1
WangchanBERTa: Pretraining transformer-based Thai Language Models	Jan 24, 2021	ArticlesLanguage Modelling	CodeCode Available	1
Label Supervised LLaMA Finetuning	Oct 2, 2023	GPUnamed-entity-recognition	CodeCode Available	1
Investigating Entity Knowledge in BERT with Simple Neural End-To-End Entity Linking	Mar 11, 2020	Entity DisambiguationEntity Linking	CodeCode Available	1
Empowering the Fact-checkers! Automatic Identification of Claim Spans on Twitter	Oct 10, 2022	Misinformationtoken-classification	CodeCode Available	1
VILA: Improving Structured Content Extraction from Scientific PDFs Using Visual Layout Groups	Jun 1, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
Improving Radiology Report Generation Systems by Removing Hallucinated References to Non-existent Priors	Sep 27, 2022	token-classificationToken Classification	CodeCode Available	1
Ultrasound Video Transformers for Cardiac Ejection Fraction Estimation	Jul 2, 2021	token-classificationToken Classification	CodeCode Available	1
General and Domain Adaptive Chinese Spelling Check with Error Consistent Pretraining	Mar 21, 2022	Domain Adaptationtoken-classification	CodeCode Available	1
BERT got a Date: Introducing Transformers to Temporal Tagging	Sep 30, 2021	ClassificationDecoder	CodeCode Available	1
Reading Order Matters: Information Extraction from Visually-rich Documents by Token Path Prediction	Oct 17, 2023	Entity LinkingKey Information Extraction	CodeCode Available	1
From Zero to Hero: Harnessing Transformers for Biomedical Named Entity Recognition in Zero- and Few-shot Contexts	May 5, 2023	few-shot-nerFew-shot NER	CodeCode Available	1
On Long-Tailed Phenomena in Neural Machine Translation	Oct 10, 2020	Conditional Text GenerationMachine Translation	CodeCode Available	1
Detecting Spells in Fantasy Literature with a Transformer Based Artificial Intelligence	Aug 7, 2023	token-classificationToken Classification	—Unverified	0
A Bit Bayesian Facilitates Efficient Training in Token Classification	Nov 16, 2021	Classificationtoken-classification	—Unverified	0
Arabic Text Diacritization In The Age Of Transfer Learning: Token Classification Is All You Need	Jan 9, 2024	AllArabic Text Diacritization	—Unverified	0
Bangla Grammatical Error Detection Leveraging Transformer-based Token Classification	Nov 13, 2024	Grammatical Error Detectiontoken-classification	—Unverified	0
BEADs: Bias Evaluation Across Domains	Jun 6, 2024	BenchmarkingBias Detection	—Unverified	0
BERT got a Date: Introducing Transformers to Temporal Tagging	Nov 16, 2021	ClassificationDecoder	—Unverified	0
BiDoRA: Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation	Oct 13, 2024	Natural Language Understandingparameter-efficient fine-tuning	—Unverified	0
Boosting the Capabilities of Compact Models in Low-Data Contexts with Large Language Models and Retrieval-Augmented Generation	Oct 1, 2024	DescriptiveInductive Bias	—Unverified	0
Combining resources for MWE-token classification	Jul 1, 2012	ClassificationGeneral Classification	—Unverified	0
Comparing Variation in Tokenizer Outputs Using a Series of Problematic and Challenging Biomedical Sentences	May 15, 2023	Sentencetoken-classification	—Unverified	0
Comparison Study Between Token Classification and Sequence Classification In Text Classification	Nov 25, 2022	ClassificationLanguage Modeling	—Unverified	0
Data Cleaning Tools for Token Classification Tasks	Jun 1, 2021	Classificationnamed-entity-recognition	—Unverified	0
De-identification of Unstructured Clinical Texts from Sequence to Sequence Perspective	Aug 18, 2021	De-identificationnamed-entity-recognition	—Unverified	0
ECSpell^UD: Zero-shot Domain Adaptive Chinese Spelling Check with User Dictionary	Nov 16, 2021	Domain Adaptationtoken-classification	—Unverified	0
Evaluating Input Representation for Language Identification in Hindi-English Code Mixed Text	Nov 23, 2020	Language IdentificationSentence	—Unverified	0
Interactive DualChecker for Mitigating Hallucinations in Distilling Large Language Models	Aug 22, 2024	In-Context LearningKnowledge Distillation	—Unverified	0
John_Snow_Labs@SMM4H’22: Social Media Mining for Health (#SMM4H) with Spark NLP	Oct 1, 2022	ClassificationGPU	—Unverified	0
Learning the Language of NVMe Streams for Ransomware Detection	Feb 7, 2025	Language ModelingLanguage Modelling	—Unverified	0
Leveraging Three Types of Embeddings from Masked Language Models in Idiom Token Classification	Jul 1, 2022	Classificationtoken-classification	—Unverified	0
Looks can be Deceptive: Distinguishing Repetition Disfluency from Reduplication	Jul 11, 2024	token-classificationToken Classification	—Unverified	0
MOOSComp: Improving Lightweight Long-Context Compressor via Mitigating Over-Smoothing and Incorporating Outlier Scores	Apr 23, 2025	Long-Context Understandingtoken-classification	—Unverified	0
Multimodal Document Analytics for Banking Process Automation	Jul 21, 2023	token-classificationToken Classification	—Unverified	0
MultiVitaminBooster at PARSEME Shared Task 2020: Combining Window- and Dependency-Based Features with Multilingual Contextualised Word Embeddings for VMWE Detection	Dec 1, 2020	Language ModelingLanguage Modelling	—Unverified	0
NBIAS: A Natural Language Processing Framework for Bias Identification in Text	Aug 3, 2023	token-classificationToken Classification	—Unverified	0
Nested Named Entity Recognition as Single-Pass Sequence Labeling	May 22, 2025	named-entity-recognitionNamed Entity Recognition	—Unverified	0
People and Places of Historical Europe: Bootstrapping Annotation Pipeline and a New Corpus of Named Entities in Late Medieval Texts	May 26, 2023	Information Retrievalnamed-entity-recognition	—Unverified	0
Persian Typographical Error Type Detection Using Deep Neural Networks on Algorithmically-Generated Misspellings	May 19, 2023	Spelling Correctiontoken-classification	—Unverified	0
Preserving Empirical Probabilities in BERT for Small-sample Clinical Entity Recognition	Sep 5, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Instruction Fine-Tuning: Does Prompt Loss Matter?	Jan 24, 2024	Multiple-choicetoken-classification	—Unverified	0
Region-dependent temperature scaling for certainty calibration and application to class-imbalanced token classification	May 1, 2022	NERtoken-classification	—Unverified	0
Revisiting Supertagging for Faster HPSG Pasing	Sep 14, 2023	token-classificationToken Classification	—Unverified	0
Robust and Fine-Grained Detection of AI Generated Texts	Apr 16, 2025	token-classificationToken Classification	—Unverified	0

Show:10 25 50

← PrevPage 1 of 2Next →

No leaderboard results yet.