Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 4925 papers

Title	Date	Tasks	Status
MCRB for Parameter Estimation from One-Bit Quantized and Oversampled Measurements	Mar 28, 2025	Direction of Arrival Estimationparameter estimation	—Unverified
Make Some Noise: Towards LLM audio reasoning and generation using sound tokens	Mar 28, 2025	Audio GenerationQuantization	—Unverified
Long-Tail Crisis in Nearest Neighbor Language Models	Mar 28, 2025	Language ModelingLanguage Modelling	—Unverified
MoQa: Rethinking MoE Quantization with Multi-stage Data-model Distribution Awareness	Mar 27, 2025	Language ModelingLanguage Modelling	—Unverified
A 71.2-μW Speech Recognition Accelerator with Recurrent Spiking Neural Network	Mar 27, 2025	Quantizationspeech-recognition	—Unverified
Q-MambaIR: Accurate Quantized Mamba for Efficient Image Restoration	Mar 27, 2025	Computational EfficiencyImage Restoration	—Unverified
HOT: Hadamard-based Optimized Training	Mar 27, 2025	Quantization	CodeCode Available
MAR-3D: Progressive Masked Auto-regressor for High-Resolution 3D Generation	Mar 26, 2025	3D GenerationDenoising	—Unverified
SINR: Sparsity Driven Compressed Implicit Neural Representations	Mar 25, 2025	Quantization	—Unverified
QUAD: Quantization and Parameter-Efficient Tuning of LLM with Activation Decomposition	Mar 25, 2025	parameter-efficient fine-tuningQuantization	CodeCode Available
Oaken: Fast and Efficient LLM Serving with Online-Offline Hybrid KV Cache Quantization	Mar 24, 2025	GPULarge Language Model	—Unverified
QSID-MPC: Model Predictive Control with System Identification from Quantized Data	Mar 24, 2025	Model Predictive ControlQuantization	—Unverified
GranQ: Granular Zero-Shot Quantization with Channel-Wise Activation Scaling in QAT	Mar 24, 2025	Neural Network CompressionQuantization	—Unverified
FFN Fusion: Rethinking Sequential Computation in Large Language Models	Mar 24, 2025	Quantization	—Unverified
4DGC: Rate-Aware 4D Gaussian Compression for Efficient Streamable Free-Viewpoint Video	Mar 24, 2025	3DGSQuantization	—Unverified
Energy-Aware LLMs: A step towards sustainable AI for downstream applications	Mar 22, 2025	Quantization	—Unverified
Variance Control via Weight Rescaling in LLM Pre-training	Mar 21, 2025	Language ModelingLanguage Modelling	CodeCode Available
Improving Quantization with Post-Training Model Expansion	Mar 21, 2025	Large Language Modelmodel	—Unverified
SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs	Mar 20, 2025	CPUGPU	—Unverified
Learning Linear Block Codes with Gradient Quantization	Mar 20, 2025	DecoderQuantization	—Unverified
Neural Networks: According to the Principles of Grassmann Algebra	Mar 20, 2025	Quantization	—Unverified
Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models	Mar 20, 2025	Quantization	—Unverified
Improving Autoregressive Image Generation through Coarse-to-Fine Token Prediction	Mar 20, 2025	Image GenerationLanguage Modeling	—Unverified
Bridging Continuous and Discrete Tokens for Autoregressive Visual Generation	Mar 20, 2025	Quantization	—Unverified
LeanTTA: A Backpropagation-Free and Stateless Approach to Quantized Test-Time Adaptation on Edge Devices	Mar 20, 2025	QuantizationTest-time Adaptation	—Unverified
PARQ: Piecewise-Affine Regularized Quantization	Mar 19, 2025	Quantization	—Unverified
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers	Mar 19, 2025	Image GenerationQuantization	CodeCode Available
RAG-based User Profiling for Precision Planning in Mixed-precision Over-the-Air Federated Learning	Mar 19, 2025	Federated LearningQuantization	—Unverified
Natural Quantization of Neural Networks	Mar 19, 2025	Quantization	CodeCode Available
Quantization-Free Autoregressive Action Transformer	Mar 18, 2025	Imitation LearningQuantization	CodeCode Available
Robust Machine Unlearning for Quantized Neural Networks via Adaptive Gradient Reweighting with Similar Labels	Mar 18, 2025	Machine UnlearningQuantization	—Unverified
MAG: Multi-Modal Aligned Autoregressive Co-Speech Gesture Generation without Vector Quantization	Mar 18, 2025	Gesture GenerationQuantization	—Unverified
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting	Mar 17, 2025	3DGS3D Reconstruction	—Unverified
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning	Mar 17, 2025	GPUModel Compression	—Unverified
ML-SpecQD: Multi-Level Speculative Decoding with Quantized Drafts	Mar 17, 2025	Quantization	—Unverified
ACT360: An Efficient 360-Degree Action Detection and Summarization Framework for Mission-Critical Training and Debriefing	Mar 17, 2025	Action DetectionDisaster Response	—Unverified
Versatile Physics-based Character Control with Hybrid Latent Representation	Mar 17, 2025	Motion Generationmotion in-betweening	—Unverified
Pathology Image Compression with Pre-trained Autoencoders	Mar 14, 2025	Computational EfficiencyImage Compression	—Unverified
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix	Mar 14, 2025	Neural Network CompressionQuantization	—Unverified
Understanding Flatness in Generative Models: Its Role and Benefits	Mar 14, 2025	Noise EstimationQuantization	—Unverified
Global synchronization of multi-agent systems with nonlinear interactions	Mar 13, 2025	Quantization	—Unverified
Dual Codebook VQ: Enhanced Image Reconstruction with Reduced Codebook Size	Mar 13, 2025	Face ReconstructionImage Reconstruction	—Unverified
OuroMamba: A Data-Free Quantization Framework for Vision Mamba Models	Mar 13, 2025	channel selectionContrastive Learning	—Unverified
Automated Tomato Maturity Estimation Using an Optimized Residual Model with Pruning and Quantization Techniques	Mar 13, 2025	ClassificationComputational Efficiency	—Unverified
Quantization for OpenAI's Whisper Models: A Comparative Analysis	Mar 12, 2025	Quantizationspeech-recognition	CodeCode Available
Sometimes Painful but Certainly Promising: Feasibility and Trade-offs of Language Model Inference at the Edge	Mar 12, 2025	CPUGPU	—Unverified
ViM-VQ: Efficient Post-Training Vector Quantization for Visual Mamba	Mar 12, 2025	MambaQuantization	—Unverified
Quantitative Analysis of Deeply Quantized Tiny Neural Networks Robust to Adversarial Attacks	Mar 12, 2025	Adversarial RobustnessQuantization	—Unverified
Accurate INT8 Training Through Dynamic Block-Level Fallback	Mar 11, 2025	Quantization	—Unverified
PRISM: Privacy-Preserving Improved Stochastic Masking for Federated Generative Models	Mar 11, 2025	Federated LearningPrivacy Preserving	CodeCode Available

Show:10 25 50

← PrevPage 24 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified