Token Reduction

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 78 papers

Title	Date	Tasks	Status
Plan and Budget: Effective and Efficient Test-Time Scaling on Large Language Model Reasoning	May 22, 2025	Language ModelingLanguage Modelling	—Unverified
EcoSafeRAG: Efficient Security through Context Analysis in Retrieval-Augmented Generation	May 16, 2025	DiversityRAG	—Unverified
Dynamic Token Reduction during Generation for Vision Language Models	Jan 24, 2025	DecoderToken Reduction	—Unverified
Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration	Nov 26, 2024	Token Reduction	—Unverified
ZipR1: Reinforcing Token Sparsity in MLLMs	Apr 23, 2025	Token Reduction	—Unverified
PAR: Prompt-Aware Token Reduction Method for Efficient Large Multimodal Models	Oct 9, 2024	Question AnsweringRetrieval	—Unverified
Selective Structured State-Spaces for Long-Form Video Understanding	Mar 25, 2023	Contrastive LearningForm	—Unverified
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study	Mar 9, 2025	QuantizationToken Reduction	—Unverified
Accelerating Multimodal Large Language Models by Searching Optimal Vision Token Reduction	Nov 30, 2024	Bayesian OptimizationToken Reduction	—Unverified
STAR: Stage-Wise Attention-Guided Token Reduction for Efficient Large Vision-Language Models Inference	May 18, 2025	Token Reduction	—Unverified
DyMU: Dynamic Merging and Virtual Unmerging for Efficient VLMs	Apr 23, 2025	Token ReductionVideo Understanding	—Unverified
The Overthinker's DIET: Cutting Token Calories with DIfficulty-AwarE Training	May 25, 2025	Reinforcement Learning (RL)Token Reduction	—Unverified
DRP: Distilled Reasoning Pruning with Skill-aware Step Decomposition for Efficient Large Reasoning Models	May 20, 2025	GSM8KMathematical Reasoning	—Unverified
Token Dynamics: Towards Efficient and Dynamic Video Token Representation for Video Large Language Models	Mar 21, 2025	Computational EfficiencyToken Reduction	—Unverified
TPC-ViT: Token Propagation Controller for Efficient Vision Transformer	Jan 3, 2024	Token Reduction	—Unverified
Deploying Foundation Model Powered Agent Services: A Survey	Dec 18, 2024	modelModel Compression	—Unverified
Token Transforming: A Unified and Training-Free Token Compression Framework for Vision Transformer Acceleration	Jun 6, 2025	Depth Estimationobject-detection	—Unverified
TORE: Token Reduction for Efficient Human Mesh Recovery with Transformer	Nov 19, 2022	3D geometryHuman Mesh Recovery	—Unverified
Towards Storage-Efficient Visual Document Retrieval: An Empirical Study on Reducing Patch-Level Embeddings	Jun 5, 2025	RetrievalToken Reduction	—Unverified
Cut the Crap: An Economical Communication Pipeline for LLM-based Multi-Agent Systems	Oct 3, 2024	Language ModellingLarge Language Model	—Unverified
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation	Dec 10, 2024	General KnowledgeText Generation	—Unverified
Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers	Mar 14, 2025	GPUMamba	—Unverified
Vote&Mix: Plug-and-Play Token Reduction for Efficient Vision Transformer	Aug 30, 2024	Token Reduction	—Unverified
VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models	May 28, 2025	Language ModelingLanguage Modelling	—Unverified
Knowing When to Stop: Dynamic Context Cutoff for Large Language Models	Feb 3, 2025	Token Reduction	—Unverified

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.