Chunking

Chunking, also known as shallow parsing, identifies continuous spans of tokens that form syntactic units such as noun phrases or verb phrases.

Example:

| Vinken | , | 61 | years | old | | --- | ---| --- | --- | --- | | B-NLP| I-NP | I-NP | I-NP | I-NP |

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 447 papers

Title	Date	Tasks	Status
ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems	Oct 25, 2024	ChunkingFact Checking	—Unverified
Chunk Twice, Embed Once: A Systematic Study of Segmentation and Representation Trade-offs in Chemistry-Aware Retrieval-Augmented Generation	Jun 13, 2025	ChunkingRAG	—Unverified
ClearTK 2.0: Design Patterns for Machine Learning in UIMA	May 1, 2014	BIG-bench Machine LearningChunking	—Unverified
ClearTK-TimeML: A minimalist approach to TempEval 2013	Jun 1, 2013	ChunkingRelation Classification	—Unverified
CLI-RAG: A Retrieval-Augmented Framework for Clinically Structured and Context Aware Text Generation with LLMs	Jul 9, 2025	ChunkingRAG	—Unverified
A Unified Framework for Structured Prediction: From Theory to Practice	Sep 1, 2017	AMR ParsingChunking	—Unverified
AILS-NTUA at SemEval-2025 Task 4: Parameter-Efficient Unlearning for Large Language Models using Data Chunking	Mar 4, 2025	ChunkingGeneral Knowledge	—Unverified
Combining Top-down and Bottom-up Search for Unsupervised Induction of Transduction Grammars	Jun 1, 2013	ChunkingMachine Translation	—Unverified
A Retrieval-Augmented Generation Framework for Academic Literature Navigation in Data Science	Dec 19, 2024	ChunkingDecision Making	—Unverified
Concept-Guided Interpretability via Neural Chunking	May 16, 2025	Chunking	—Unverified
Building Trainable Taggers in a Web-based, UIMA-Supported NLP Workbench	Jul 1, 2012	ChunkingFeature Engineering	—Unverified
A Conditional Random Field-based Traditional Chinese Base Phrase Parser for SIGHAN Bake-off 2012 Evaluation	Dec 1, 2012	ChunkingLanguage Modelling	—Unverified
A Reranking Model for Discourse Segmentation using Subtree Features	Jul 1, 2012	ChunkingDialogue Generation	—Unverified
A New HOPE: Domain-agnostic Automatic Evaluation of Text Chunking	May 4, 2025	ChunkingRAG	—Unverified
Coreference Resolution for the Basque Language with BART	Jun 1, 2016	Chunkingcoreference-resolution	—Unverified
Counting What Counts: Decompounding for Keyphrase Extraction	Jul 1, 2015	ChunkingInformation Retrieval	—Unverified
CronusVLA: Transferring Latent Motion Across Time for Multi-Frame Prediction in Manipulation	Jun 24, 2025	ChunkingVision-Language-Action	—Unverified
Cross-lingual transfer parser from Hindi to Bengali using delexicalization and chunking	Dec 1, 2016	ChunkingCross-Lingual Transfer	—Unverified
Cross-View Training for Semi-Supervised Learning	Jan 1, 2018	Chunking	—Unverified
Crowd Prefers the Middle Path: A New IAA Metric for Crowdsourcing Reveals Turker Biases in Query Segmentation	Aug 1, 2013	Chunking	—Unverified
CUSIDE: Chunking, Simulating Future Context and Decoding for Streaming ASR	Mar 31, 2022	Chunkingspeech-recognition	—Unverified
Bridging Industrial Expertise and XR with LLM-Powered Conversational Agents	Apr 7, 2025	ChunkingRAG	—Unverified
TOBUGraph: Knowledge Graph-Based Retrieval for Enhanced LLM Performance Beyond RAG	Dec 6, 2024	ChunkingHallucination	—Unverified
Decoding with Finite-State Transducers on GPUs	Jan 11, 2017	ChunkingGPU	—Unverified
Evaluating distributed word representations for capturing semantics of biomedical concepts	Jul 1, 2015	ArticlesChunking	—Unverified
Deep Learning Transformer Architecture for Named Entity Recognition on Low Resourced Languages: State of the art results	Nov 1, 2021	BIG-bench Machine LearningChunking	—Unverified
Evaluation of Domain-specific Word Embeddings using Knowledge Resources	May 1, 2018	ChunkingNamed Entity Recognition (NER)	—Unverified
Evolution of diverse (and advanced) cognitive abilities through adaptive fine-tuning of learning and chunking mechanisms	Jan 20, 2025	ChunkingDecision Making	—Unverified
Breaking the Token Barrier: Chunking and Convolution for Efficient Long Text Classification with BERT	Oct 31, 2023	Binary ClassificationChunking	—Unverified
A Recursive Recurrent Neural Network for Statistical Machine Translation	Jun 1, 2014	ChunkingLanguage Modelling	—Unverified
A Concise Query Language with Search and Transform Operations for Corpora with Multiple Levels of Annotation	May 1, 2012	ChunkingPart-Of-Speech Tagging	—Unverified
Boundary-based MWE segmentation with text partitioning	Sep 1, 2017	ChunkingInformation Retrieval	—Unverified
Bootstrapping a historical commodities lexicon with SKOS and DBpedia	Apr 1, 2014	ChunkingLanguage Identification	—Unverified
A recurrent connectionist model of melody perception : An exploration using TRACX2	Nov 21, 2023	ChunkingSegmentation	—Unverified
A Boosting-based Algorithm for Classification of Semi-Structured Text using the Frequency of Substructures	Sep 1, 2013	ChunkingGeneral Classification	—Unverified
Boosting Named Entity Recognition with Neural Character Embeddings	Jul 1, 2015	Chunkingnamed-entity-recognition	—Unverified
A Quantitative Comparative Study of Prosodic and Discourse Units, the Case of French and Taiwan Mandarin	Nov 1, 2013	Chunking	—Unverified
Enrichir et raisonner sur des espaces s\'emantiques pour l'attribution de mots-cl\'es (Enriching and reasoning on semantic spaces for keyword extraction) [in French]	Jun 1, 2012	ChunkingKeyword Extraction	—Unverified
BLAZE: Cross-Language and Cross-Project Bug Localization via Dynamic Chunking and Hard Example Learning	Jul 24, 2024	Chunking	—Unverified
Domain Adaptation with Filtering for Named Entity Extraction of Japanese Anime-Related Words	Sep 1, 2015	ChunkingDomain Adaptation	—Unverified
BIT-Xiaomi’s System for AutoSimTrans 2022	Jul 1, 2022	ChunkingData Augmentation	—Unverified
Apprentissage automatique d'un chunker pour le fran (Machine Learning of a chunker for French) [in French]	Jun 1, 2012	Chunking	—Unverified
Advanced System Integration: Analyzing OpenAPI Chunking for Retrieval-Augmented Generation	Nov 29, 2024	ChunkingRAG	—Unverified
Entailment: An Effective Metric for Comparing and Evaluating Hierarchical and Non-hierarchical Annotation Schemes	Aug 1, 2013	Chunking	—Unverified
DTSim at SemEval-2016 Task 1: Semantic Similarity Model Including Multi-Level Alignment and Vector-Based Compositional Semantics	Jun 1, 2016	ChunkingSemantic Composition	—Unverified
DTSim at SemEval-2016 Task 2: Interpreting Similarity of Texts Based on Automated Chunking, Chunk Alignment and Semantic Relation Prediction	Jun 1, 2016	ChunkingRelation Prediction	—Unverified
Duluth: Word Sense Discrimination in the Service of Lexicography	Jun 1, 2015	ChunkingSemantic Role Labeling	—Unverified
Boosting Named Entity Recognition with Neural Character Embeddings	May 19, 2015	Chunkingnamed-entity-recognition	—Unverified
Dynamic Chunking for End-to-End Hierarchical Sequence Modeling	Jul 10, 2025	Chunking	—Unverified
EPIC: Efficient Position-Independent Caching for Serving Large Language Models	Oct 20, 2024	ChunkingFew-Shot Learning	—Unverified

Show:10 25 50

← PrevPage 3 of 9Next →

All datasets CoNLL-2000 Penn Treebank CoNLL 2003 (German)CoNLL 2003 (English)CoNLL 2003

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ACE	Exact Span F1	97.3	—	Unverified
2	BERT-CRF (Replicated in AdaSeq)	Exact Span F1	97.18	—	Unverified
3	ELMo + MAT + Multi-Task	Exact Span F1	97.04	—	Unverified
4	CVT+Multi-Task+Large	Exact Span F1	96.98	—	Unverified
5	ELMo + Multi-Task	Exact Span F1	96.83	—	Unverified
6	Flair	Exact Span F1	96.72	—	Unverified
7	SeqVAT	Exact Span F1	95.45	—	Unverified
8	Adversarial Training	Exact Span F1	95.25	—	Unverified
9	BiLSTM-CRF	Exact Span F1	95.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	F1 score	97.3	—	Unverified
2	Flair embeddings	F1 score	96.72	—	Unverified
3	JMT	F1 score	95.77	—	Unverified
4	Low supervision	F1 score	95.57	—	Unverified
5	IntNet + BiLSTM-CRF	F1 score	95.29	—	Unverified
6	Suzuki and Isozaki	F1 score	95.15	—	Unverified
7	NCRF++	F1 score	95.06	—	Unverified
8	BI-LSTM-CRF (Senna) (ours)	F1 score	94.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	F1	95	—	Unverified
2	Wang et al., 2020	F1	94.4	—	Unverified
3	AIN	F1	94.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wang et al., 2020	F1	92	—	Unverified
2	AIN	F1	91.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Def2Vec	AUC	93.07	—	Unverified