Token Reduction

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 78 papers

Title	Date	Tasks	Status
Layton: Latent Consistency Tokenizer for 1024-pixel Image Reconstruction and Generation by 256 Tokens	Mar 11, 2025	DecoderImage Generation	CodeCode Available
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study	Mar 9, 2025	QuantizationToken Reduction	—Unverified
BatchGEMBA: Token-Efficient Machine Translation Evaluation with Batched Prompting and Prompt Compression	Mar 4, 2025	Large Language ModelMachine Translation	CodeCode Available
Knowing When to Stop: Dynamic Context Cutoff for Large Language Models	Feb 3, 2025	Token Reduction	—Unverified
MINT: Mitigating Hallucinations in Large Vision-Language Models via Token Reduction	Feb 2, 2025	HallucinationToken Reduction	—Unverified
Learning Free Token Reduction for Multi-Modal Large Language Models	Jan 29, 2025	Language ModelingLanguage Modelling	—Unverified
Dynamic Token Reduction during Generation for Vision Language Models	Jan 24, 2025	DecoderToken Reduction	—Unverified
AdaFV: Rethinking of Visual-Language alignment for VLM acceleration	Jan 16, 2025	Token Reduction	—Unverified
Cached Adaptive Token Merging: Dynamic Token Reduction and Redundant Computation Elimination in Diffusion Model	Jan 1, 2025	DenoisingToken Reduction	CodeCode Available
Rethinking Token Reduction with Parameter-Efficient Fine-Tuning in ViT for Pixel-Level Tasks	Jan 1, 2025	Computational EfficiencyDiversity	CodeCode Available
Cross-Layer Cache Aggregation for Token Reduction in Ultra-Fine-Grained Image Recognition	Dec 31, 2024	Fine-Grained Image RecognitionToken Reduction	CodeCode Available
ImagePiece: Content-aware Re-tokenization for Efficient Image Recognition	Dec 21, 2024	Efficient ViTsToken Reduction	—Unverified
Deploying Foundation Model Powered Agent Services: A Survey	Dec 18, 2024	modelModel Compression	—Unverified
AsymRnR: Video Diffusion Transformers Acceleration with Asymmetric Reduction and Restoration	Dec 16, 2024	DenoisingToken Reduction	—Unverified
Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers	Dec 13, 2024	Token Reduction	CodeCode Available
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation	Dec 10, 2024	General KnowledgeText Generation	—Unverified
Accelerating Multimodal Large Language Models by Searching Optimal Vision Token Reduction	Nov 30, 2024	Bayesian OptimizationToken Reduction	—Unverified
Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration	Nov 26, 2024	Token Reduction	—Unverified
Efficient Multi-modal Large Language Models via Visual Token Grouping	Nov 26, 2024	Image CaptioningQuestion Answering	—Unverified
freePruner: A Training-free Approach for Large Multimodal Model Acceleration	Nov 23, 2024	QuantizationQuestion Answering	—Unverified
PAR: Prompt-Aware Token Reduction Method for Efficient Large Multimodal Models	Oct 9, 2024	Question AnsweringRetrieval	—Unverified
Cut the Crap: An Economical Communication Pipeline for LLM-based Multi-Agent Systems	Oct 3, 2024	Language ModellingLarge Language Model	—Unverified
Vote&Mix: Plug-and-Play Token Reduction for Efficient Vision Transformer	Aug 30, 2024	Token Reduction	—Unverified
FIT-RAG: Black-Box RAG with Factual Information and Token Reduction	Mar 21, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
HaltingVT: Adaptive Token Halting Transformer for Efficient Video Recognition	Jan 10, 2024	Action RecognitionAction Recognition In Videos	CodeCode Available

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.