Chunking

Chunking, also known as shallow parsing, identifies continuous spans of tokens that form syntactic units such as noun phrases or verb phrases.

Example:

| Vinken | , | 61 | years | old | | --- | ---| --- | --- | --- | | B-NLP| I-NP | I-NP | I-NP | I-NP |

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 447 papers

Title	Date	Tasks	Status
CronusVLA: Transferring Latent Motion Across Time for Multi-Frame Prediction in Manipulation	Jun 24, 2025	ChunkingVision-Language-Action	—Unverified
Can LLMs Replace Humans During Code Chunking?	Jun 24, 2025	Chunking	—Unverified
Chunk Twice, Embed Once: A Systematic Study of Segmentation and Representation Trade-offs in Chemistry-Aware Retrieval-Augmented Generation	Jun 13, 2025	ChunkingRAG	—Unverified
Knowledge Compression via Question Generation: Enhancing Multihop Document Retrieval without Fine-tuning	Jun 9, 2025	ChunkingQuestion Generation	—Unverified
Dynamic Chunking and Selection for Reading Comprehension of Ultra-Long Context in Large Language Models	Jun 1, 2025	ChunkingMulti-hop Question Answering	CodeCode Available
LID Models are Actually Accent Classifiers: Implications and Solutions for LID on Accented Speech	May 31, 2025	Chunking	—Unverified
Optimizing the Interface Between Knowledge Graphs and LLMs for Complex Reasoning	May 30, 2025	Chunkinggraph construction	—Unverified
Rethinking Chunk Size For Long-Document Retrieval: A Multi-Dataset Analysis	May 27, 2025	ChunkingInformation Retrieval	CodeCode Available
Retrieval-Augmented Generation for Service Discovery: Chunking Strategies and Benchmarking	May 25, 2025	BenchmarkingChunking	—Unverified
HASH-RAG: Bridging Deep Hashing with Retriever for Efficient, Fine Retrieval and Augmented Generation	May 22, 2025	ChunkingDeep Hashing	—Unverified
Not All Thoughts are Generated Equal: Efficient LLM Reasoning via Multi-Turn Reinforcement Learning	May 17, 2025	AllChunking	CodeCode Available
Concept-Guided Interpretability via Neural Chunking	May 16, 2025	Chunking	—Unverified
Optimizing Retrieval-Augmented Generation: Analysis of Hyperparameter Impact on Performance and Efficiency	May 13, 2025	ChunkingRAG	—Unverified
Recognizing Ornaments in Vocal Indian Art Music with Active Annotation	May 7, 2025	ChunkingGenre classification	—Unverified
A New HOPE: Domain-agnostic Automatic Evaluation of Text Chunking	May 4, 2025	ChunkingRAG	—Unverified
Adaptive Token Boundaries: Integrating Human Chunking Mechanisms into Multimodal LLMs	May 3, 2025	ChunkingQuestion Answering	—Unverified
CHORUS: Zero-shot Hierarchical Retrieval and Orchestration for Generating Linear Programming Code	May 2, 2025	ChunkingCode Generation	—Unverified
Reconstructing Context: Evaluating Advanced Chunking Strategies for Retrieval-Augmented Generation	Apr 28, 2025	ChunkingRAG	CodeCode Available
A Baseline for Self-state Identification and Classification in Mental Health Data: CLPsych 2025 Task	Apr 18, 2025	AttributeBinary Classification	—Unverified
Bridging Industrial Expertise and XR with LLM-Powered Conversational Agents	Apr 7, 2025	ChunkingRAG	—Unverified
FlexChunk: Enabling 100M×100M Out-of-Core SpMV (~1.8 min, ~1.7 GB RAM) with Near-Linear Scaling	Apr 5, 2025	ChunkingNature-Inspired Optimization Algorithm	CodeCode Available
Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment	Apr 2, 2025	ChunkingDiagnostic	—Unverified
Bi-LAT: Bilateral Control-Based Imitation Learning via Natural Language and Action Chunking with Transformers	Apr 2, 2025	ChunkingImitation Learning	—Unverified
ParallelFlow: Parallelizing Linear Transformers via Flow Discretization	Apr 1, 2025	ChunkingState Space Models	—Unverified
Text Chunking for Document Classification for Urban System Management using Large Language Models	Mar 31, 2025	ChunkingDocument Classification	CodeCode Available

Show:10 25 50

← PrevPage 3 of 18Next →

All datasets CoNLL-2000 Penn Treebank CoNLL 2003 (German)CoNLL 2003 (English)CoNLL 2003

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ACE	Exact Span F1	97.3	—	Unverified
2	BERT-CRF (Replicated in AdaSeq)	Exact Span F1	97.18	—	Unverified
3	ELMo + MAT + Multi-Task	Exact Span F1	97.04	—	Unverified
4	CVT+Multi-Task+Large	Exact Span F1	96.98	—	Unverified
5	ELMo + Multi-Task	Exact Span F1	96.83	—	Unverified
6	Flair	Exact Span F1	96.72	—	Unverified
7	SeqVAT	Exact Span F1	95.45	—	Unverified
8	Adversarial Training	Exact Span F1	95.25	—	Unverified
9	BiLSTM-CRF	Exact Span F1	95.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	F1 score	97.3	—	Unverified
2	Flair embeddings	F1 score	96.72	—	Unverified
3	JMT	F1 score	95.77	—	Unverified
4	Low supervision	F1 score	95.57	—	Unverified
5	IntNet + BiLSTM-CRF	F1 score	95.29	—	Unverified
6	Suzuki and Isozaki	F1 score	95.15	—	Unverified
7	NCRF++	F1 score	95.06	—	Unverified
8	BI-LSTM-CRF (Senna) (ours)	F1 score	94.46	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACE	F1	95	—	Unverified
2	Wang et al., 2020	F1	94.4	—	Unverified
3	AIN	F1	94.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Wang et al., 2020	F1	92	—	Unverified
2	AIN	F1	91.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Def2Vec	AUC	93.07	—	Unverified