Token Reduction

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 78 papers

Title	Date	Tasks	Status	Hype
Token Reduction Should Go Beyond Efficiency in Generative Models -- From Vision, Language to Multimodality	May 23, 2025	In-Context LearningToken Reduction	CodeCode Available	3
LongVU: Spatiotemporal Adaptive Compression for Long Video-Language Understanding	Oct 22, 2024	Token ReductionVideo Question Answering	CodeCode Available	3
FrameFusion: Combining Similarity and Importance for Video Token Reduction on Large Visual Language Models	Dec 30, 2024	Question AnsweringToken Reduction	CodeCode Available	2
Discovering the Gems in Early Layers: Accelerating Long-Context LLMs with 1000x Input Token Reduction	Sep 25, 2024	GPUToken Reduction	CodeCode Available	2
LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models	Mar 22, 2024	Language ModellingLarge Language Model	CodeCode Available	2
One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory	May 29, 2025	Contrastive LearningText Retrieval	CodeCode Available	2
PACT: Pruning and Clustering-Based Token Reduction for Faster Visual Language Models	Apr 11, 2025	ClusteringLanguage Modeling	CodeCode Available	2
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning	Mar 10, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
SiLVR: A Simple Language-based Video Reasoning Framework	May 30, 2025	MathMME	CodeCode Available	1
Learning Compact Vision Tokens for Efficient Large Multimodal Models	Jun 8, 2025	Multimodal ReasoningToken Reduction	CodeCode Available	1
Which Tokens to Use? Investigating Token Reduction in Vision Transformers	Aug 9, 2023	Classificationimage-classification	CodeCode Available	1
Rethinking Token Reduction for State Space Models	Oct 16, 2024	MambaState Space Models	CodeCode Available	1
Less is More: A Simple yet Effective Token Reduction Method for Efficient Multi-modal LLMs	Sep 17, 2024	Question AnsweringToken Reduction	CodeCode Available	1
Faster Vision Mamba is Rebuilt in Minutes via Merged Token Re-training	Dec 17, 2024	MambaToken Reduction	CodeCode Available	1
Streamline Without Sacrifice -- Squeeze out Computation Redundancy in LMM	May 21, 2025	DecoderToken Reduction	CodeCode Available	1
AdaViT: Adaptive Tokens for Efficient Vision Transformer	Dec 14, 2021	Efficient ViTsimage-classification	CodeCode Available	1
Bridging Local Details and Global Context in Text-Attributed Graphs	Jun 18, 2024	Representation LearningToken Reduction	CodeCode Available	1
PuMer: Pruning and Merging Tokens for Efficient Vision Language Models	May 27, 2023	Token Reduction	CodeCode Available	1
CrossLMM: Decoupling Long Video Sequences from LMMs via Dual Cross-Attention Mechanisms	May 22, 2025	Token Reduction	CodeCode Available	1
FlowCut: Rethinking Redundancy via Information Flow for Efficient Vision-Language Models	May 26, 2025	Token Reduction	CodeCode Available	1
FOLDER: Accelerating Multi-modal Large Language Models with Enhanced Performance	Jan 5, 2025	Token Reduction	CodeCode Available	1
Content-aware Token Sharing for Efficient Semantic Segmentation with Vision Transformers	Jun 3, 2023	Computational Efficiencyimage-classification	CodeCode Available	1
TR-BERT: Dynamic Token Reduction for Accelerating BERT Inference	May 25, 2021	Token Reduction	CodeCode Available	1
Enhancing Multimodal Large Language Models Complex Reason via Similarity Computation	Dec 13, 2024	Token Reduction	CodeCode Available	1
FastAdaSP: Multitask-Adapted Efficient Inference for Large Speech Language Model	Oct 3, 2024	Emotion RecognitionLanguage Modeling	CodeCode Available	1
Hierarchical Context Merging: Better Long Context Understanding for Pre-trained LLMs	Apr 16, 2024	Long-Context UnderstandingToken Reduction	CodeCode Available	1
ALGM: Adaptive Local-then-Global Token Merging for Efficient Semantic Segmentation with Plain Vision Transformers	Jun 14, 2024	SegmentationSemantic Segmentation	CodeCode Available	1
Token Cropr: Faster ViTs for Quite a Few Tasks	Dec 1, 2024	image-classificationImage Classification	CodeCode Available	1
Inference Optimal VLMs Need Fewer Visual Tokens and More Parameters	Nov 5, 2024	Token ReductionVisual Reasoning	CodeCode Available	1
Window Token Concatenation for Efficient Visual Large Language Models	Apr 5, 2025	Token Reduction	CodeCode Available	1
ZipR1: Reinforcing Token Sparsity in MLLMs	Apr 23, 2025	Token Reduction	—Unverified	0
AdaFV: Rethinking of Visual-Language alignment for VLM acceleration	Jan 16, 2025	Token Reduction	—Unverified	0
Astraea: A GPU-Oriented Token-wise Acceleration Framework for Video Diffusion Transformers	Jun 5, 2025	GPUText-to-Video Generation	—Unverified	0
AsymRnR: Video Diffusion Transformers Acceleration with Asymmetric Reduction and Restoration	Dec 16, 2024	DenoisingToken Reduction	—Unverified	0
Cut the Crap: An Economical Communication Pipeline for LLM-based Multi-Agent Systems	Oct 3, 2024	Language ModellingLarge Language Model	—Unverified	0
Deploying Foundation Model Powered Agent Services: A Survey	Dec 18, 2024	modelModel Compression	—Unverified	0
DRP: Distilled Reasoning Pruning with Skill-aware Step Decomposition for Efficient Large Reasoning Models	May 20, 2025	GSM8KMathematical Reasoning	—Unverified	0
DyMU: Dynamic Merging and Virtual Unmerging for Efficient VLMs	Apr 23, 2025	Token ReductionVideo Understanding	—Unverified	0
Dynamic Token Reduction during Generation for Vision Language Models	Jan 24, 2025	DecoderToken Reduction	—Unverified	0
EcoSafeRAG: Efficient Security through Context Analysis in Retrieval-Augmented Generation	May 16, 2025	DiversityRAG	—Unverified	0
Efficient LLaMA-3.2-Vision by Trimming Cross-attended Visual Features	Apr 1, 2025	Token Reduction	—Unverified	0
Efficient Multi-modal Large Language Models via Visual Token Grouping	Nov 26, 2024	Image CaptioningQuestion Answering	—Unverified	0
FIT-RAG: Black-Box RAG with Factual Information and Token Reduction	Mar 21, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
freePruner: A Training-free Approach for Large Multimodal Model Acceleration	Nov 23, 2024	QuantizationQuestion Answering	—Unverified	0
Hypernym Mercury: Token Optimization Through Semantic Field Constriction And Reconstruction From Hypernyms. A New Text Compression Method	May 12, 2025	Semantic CompressionSemantic Similarity	—Unverified	0
ImagePiece: Content-aware Re-tokenization for Efficient Image Recognition	Dec 21, 2024	Efficient ViTsToken Reduction	—Unverified	0
Knowing When to Stop: Dynamic Context Cutoff for Large Language Models	Feb 3, 2025	Token Reduction	—Unverified	0
Learning Free Token Reduction for Multi-Modal Large Language Models	Jan 29, 2025	Language ModelingLanguage Modelling	—Unverified	0
Local Information Matters: Inference Acceleration For Grounded Conversation Generation Models Through Adaptive Local-Aware Token Pruning	Mar 31, 2025	Semantic SegmentationToken Reduction	—Unverified	0
MINT: Mitigating Hallucinations in Large Vision-Language Models via Token Reduction	Feb 2, 2025	HallucinationToken Reduction	—Unverified	0

Show:10 25 50

← PrevPage 1 of 2Next →

No leaderboard results yet.