Token Reduction

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 78 papers

Title	Date	Tasks	Status	Hype
Local Information Matters: Inference Acceleration For Grounded Conversation Generation Models Through Adaptive Local-Aware Token Pruning	Mar 31, 2025	Semantic SegmentationToken Reduction	—Unverified	0
Faster Parameter-Efficient Tuning with Token Redundancy Reduction	Mar 26, 2025	Token Reduction	CodeCode Available	0
Token Dynamics: Towards Efficient and Dynamic Video Token Representation for Video Large Language Models	Mar 21, 2025	Computational EfficiencyToken Reduction	—Unverified	0
Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers	Mar 14, 2025	GPUMamba	—Unverified	0
Layton: Latent Consistency Tokenizer for 1024-pixel Image Reconstruction and Generation by 256 Tokens	Mar 11, 2025	DecoderImage Generation	CodeCode Available	0
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning	Mar 10, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study	Mar 9, 2025	QuantizationToken Reduction	—Unverified	0
BatchGEMBA: Token-Efficient Machine Translation Evaluation with Batched Prompting and Prompt Compression	Mar 4, 2025	Large Language ModelMachine Translation	CodeCode Available	0
Knowing When to Stop: Dynamic Context Cutoff for Large Language Models	Feb 3, 2025	Token Reduction	—Unverified	0
MINT: Mitigating Hallucinations in Large Vision-Language Models via Token Reduction	Feb 2, 2025	HallucinationToken Reduction	—Unverified	0
Learning Free Token Reduction for Multi-Modal Large Language Models	Jan 29, 2025	Language ModelingLanguage Modelling	—Unverified	0
Dynamic Token Reduction during Generation for Vision Language Models	Jan 24, 2025	DecoderToken Reduction	—Unverified	0
AdaFV: Rethinking of Visual-Language alignment for VLM acceleration	Jan 16, 2025	Token Reduction	—Unverified	0
FOLDER: Accelerating Multi-modal Large Language Models with Enhanced Performance	Jan 5, 2025	Token Reduction	CodeCode Available	1
Rethinking Token Reduction with Parameter-Efficient Fine-Tuning in ViT for Pixel-Level Tasks	Jan 1, 2025	Computational EfficiencyDiversity	CodeCode Available	0
Cached Adaptive Token Merging: Dynamic Token Reduction and Redundant Computation Elimination in Diffusion Model	Jan 1, 2025	DenoisingToken Reduction	CodeCode Available	0
Cross-Layer Cache Aggregation for Token Reduction in Ultra-Fine-Grained Image Recognition	Dec 31, 2024	Fine-Grained Image RecognitionToken Reduction	CodeCode Available	0
FrameFusion: Combining Similarity and Importance for Video Token Reduction on Large Visual Language Models	Dec 30, 2024	Question AnsweringToken Reduction	CodeCode Available	2
ImagePiece: Content-aware Re-tokenization for Efficient Image Recognition	Dec 21, 2024	Efficient ViTsToken Reduction	—Unverified	0
Deploying Foundation Model Powered Agent Services: A Survey	Dec 18, 2024	modelModel Compression	—Unverified	0
Faster Vision Mamba is Rebuilt in Minutes via Merged Token Re-training	Dec 17, 2024	MambaToken Reduction	CodeCode Available	1
AsymRnR: Video Diffusion Transformers Acceleration with Asymmetric Reduction and Restoration	Dec 16, 2024	DenoisingToken Reduction	—Unverified	0
Learning to Merge Tokens via Decoupled Embedding for Efficient Vision Transformers	Dec 13, 2024	Token Reduction	CodeCode Available	0
Enhancing Multimodal Large Language Models Complex Reason via Similarity Computation	Dec 13, 2024	Token Reduction	CodeCode Available	1
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation	Dec 10, 2024	General KnowledgeText Generation	—Unverified	0

Show:10 25 50

← PrevPage 2 of 4Next →

No leaderboard results yet.