Token Reduction

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 78 papers

Title	Date	Tasks	Status
Plan and Budget: Effective and Efficient Test-Time Scaling on Large Language Model Reasoning	May 22, 2025	Language ModelingLanguage Modelling	—Unverified
The Overthinker's DIET: Cutting Token Calories with DIfficulty-AwarE Training	May 25, 2025	Reinforcement Learning (RL)Token Reduction	—Unverified
Token Dynamics: Towards Efficient and Dynamic Video Token Representation for Video Large Language Models	Mar 21, 2025	Computational EfficiencyToken Reduction	—Unverified
TPC-ViT: Token Propagation Controller for Efficient Vision Transformer	Jan 3, 2024	Token Reduction	—Unverified
Token Transforming: A Unified and Training-Free Token Compression Framework for Vision Transformer Acceleration	Jun 6, 2025	Depth Estimationobject-detection	—Unverified
TORE: Token Reduction for Efficient Human Mesh Recovery with Transformer	Nov 19, 2022	3D geometryHuman Mesh Recovery	—Unverified
Towards Storage-Efficient Visual Document Retrieval: An Empirical Study on Reducing Patch-Level Embeddings	Jun 5, 2025	RetrievalToken Reduction	—Unverified
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation	Dec 10, 2024	General KnowledgeText Generation	—Unverified
Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers	Mar 14, 2025	GPUMamba	—Unverified
Vote&Mix: Plug-and-Play Token Reduction for Efficient Vision Transformer	Aug 30, 2024	Token Reduction	—Unverified
VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models	May 28, 2025	Language ModelingLanguage Modelling	—Unverified
Accelerating Multimodal Large Language Models by Searching Optimal Vision Token Reduction	Nov 30, 2024	Bayesian OptimizationToken Reduction	—Unverified
Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration	Nov 26, 2024	Token Reduction	—Unverified
PAR: Prompt-Aware Token Reduction Method for Efficient Large Multimodal Models	Oct 9, 2024	Question AnsweringRetrieval	—Unverified
Selective Structured State-Spaces for Long-Form Video Understanding	Mar 25, 2023	Contrastive LearningForm	—Unverified
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study	Mar 9, 2025	QuantizationToken Reduction	—Unverified
STAR: Stage-Wise Attention-Guided Token Reduction for Efficient Large Vision-Language Models Inference	May 18, 2025	Token Reduction	—Unverified
Not All Tokens Are What You Need In Thinking	May 23, 2025	AllToken Reduction	CodeCode Available
Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers	Dec 13, 2024	Token Reduction	CodeCode Available
Faster Parameter-Efficient Tuning with Token Redundancy Reduction	Mar 26, 2025	Token Reduction	CodeCode Available
Rethinking Token Reduction with Parameter-Efficient Fine-Tuning in ViT for Pixel-Level Tasks	Jan 1, 2025	Computational EfficiencyDiversity	CodeCode Available
BatchGEMBA: Token-Efficient Machine Translation Evaluation with Batched Prompting and Prompt Compression	Mar 4, 2025	Large Language ModelMachine Translation	CodeCode Available
Cross-Layer Cache Aggregation for Token Reduction in Ultra-Fine-Grained Image Recognition	Dec 31, 2024	Fine-Grained Image RecognitionToken Reduction	CodeCode Available
Dynamic Compressing Prompts for Efficient Inference of Large Language Models	Apr 15, 2025	Token Reduction	CodeCode Available
Layton: Latent Consistency Tokenizer for 1024-pixel Image Reconstruction and Generation by 256 Tokens	Mar 11, 2025	DecoderImage Generation	CodeCode Available

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.