Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 4925 papers

Title	Date	Tasks	Status	Hype
Exploiting LLM Quantization	May 28, 2024	Code GenerationQuantization	CodeCode Available	1
Object Discovery from Motion-Guided Tokens	Mar 27, 2023	DecoderObject	CodeCode Available	1
Exploring the Connection Between Binary and Spiking Neural Networks	Feb 24, 2020	BinarizationQuantization	CodeCode Available	1
Evaluating the Generalization Ability of Quantized LLMs: Benchmark, Analysis, and Toolbox	Jun 15, 2024	Quantization	CodeCode Available	1
4-bit Shampoo for Memory-Efficient Network Training	May 28, 2024	image-classificationImage Classification	CodeCode Available	1
One Loss for All: Deep Hashing with a Single Cosine Similarity based Learning Objective	Sep 29, 2021	AllDeep Hashing	CodeCode Available	1
A Thorough Examination of Decoding Methods in the Era of LLMs	Feb 10, 2024	Quantization	CodeCode Available	1
Online Learned Continual Compression with Adaptive Quantization Modules	Nov 19, 2019	Continual LearningDecoder	CodeCode Available	1
AdANNS: A Framework for Adaptive Semantic Search	May 30, 2023	Natural QuestionsQuantization	CodeCode Available	1
Optimal ANN-SNN Conversion for High-accuracy and Ultra-low-latency Spiking Neural Networks	Mar 8, 2023	Quantization	CodeCode Available	1
Evaluation and Optimization of Gradient Compression for Distributed Deep Learning	Jun 15, 2023	Deep LearningGPU	CodeCode Available	1
Error Diffusion: Post Training Quantization with Block-Scaled Number Formats for Neural Networks	Oct 15, 2024	Quantization	CodeCode Available	1
AdaLog: Post-Training Quantization for Vision Transformers with Adaptive Logarithm Quantizer	Jul 17, 2024	Instance Segmentationobject-detection	CodeCode Available	1
EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search	Oct 18, 2024	Model CompressionQuantization	CodeCode Available	1
FAT: Learning Low-Bitwidth Parametric Representation via Frequency-Aware Transformation	Feb 15, 2021	Model CompressionNeural Network Compression	CodeCode Available	1
Enhancing Generalization of Universal Adversarial Perturbation through Gradient Aggregation	Aug 11, 2023	Quantization	CodeCode Available	1
Environmental Sound Classification on the Edge: A Pipeline for Deep Acoustic Networks on Extremely Resource-Constrained Devices	Mar 5, 2021	Audio ClassificationEnvironmental Sound Classification	CodeCode Available	1
EDA-DM: Enhanced Distribution Alignment for Post-Training Quantization of Diffusion Models	Jan 9, 2024	DenoisingImage Generation	CodeCode Available	1
Enabling Binary Neural Network Training on the Edge	Feb 8, 2021	Quantization	CodeCode Available	1
EMQ: Evolving Training-free Proxies for Automated Mixed Precision Quantization	Jul 20, 2023	Quantization	CodeCode Available	1
End-to-End Rate-Distortion Optimized 3D Gaussian Representation	Apr 9, 2024	3DGSQuantization	CodeCode Available	1
Embedding in Recommender Systems: A Survey	Oct 28, 2023	AutoMLCollaborative Filtering	CodeCode Available	1
End-to-End Rate-Distortion Optimized Learned Hierarchical Bi-Directional Video Compression	Dec 17, 2021	Motion EstimationMS-SSIM	CodeCode Available	1
EQ-Net: Elastic Quantization Neural Networks	Aug 15, 2023	Quantization	CodeCode Available	1
And the Bit Goes Down: Revisiting the Quantization of Neural Networks	Jul 12, 2019	CPUQuantization	CodeCode Available	1
Anchor-based Plain Net for Mobile Image Super-Resolution	May 20, 2021	Image Super-ResolutionQuantization	CodeCode Available	1
ActNN: Reducing Training Memory Footprint via 2-Bit Activation Compressed Training	Apr 29, 2021	Quantization	CodeCode Available	1
An Automatic Graph Construction Framework based on Large Language Models for Recommendation	Dec 24, 2024	graph constructionQuantization	CodeCode Available	1
Active Image Indexing	Oct 5, 2022	Copy DetectionQuantization	CodeCode Available	1
Efficient Quantized Sparse Matrix Operations on Tensor Cores	Sep 14, 2022	GPUQuantization	CodeCode Available	1
Active-Dormant Attention Heads: Mechanistically Demystifying Extreme-Token Phenomena in LLMs	Oct 17, 2024	Quantization	CodeCode Available	1
HAWQ: Hessian AWare Quantization of Neural Networks with Mixed-Precision	Apr 29, 2019	Quantization	CodeCode Available	1
Efficient and Robust Quantization-aware Training via Adaptive Coreset Selection	Jun 12, 2023	Model CompressionQuantization	CodeCode Available	1
Efficient-VDVAE: Less is more	Mar 25, 2022	Image GenerationQuantization	CodeCode Available	1
ERNIE-ViLG: Unified Generative Pre-training for Bidirectional Vision-Language Generation	Dec 31, 2021	Image CaptioningImage Generation	CodeCode Available	1
Graph-less Neural Networks: Teaching Old MLPs New Tricks via Distillation	Oct 17, 2021	Knowledge DistillationNode Classification	CodeCode Available	1
Edge AI-Based Vein Detector for Efficient Venipuncture in the Antecubital Fossa	Oct 27, 2023	Quantization	CodeCode Available	1
EdgeQAT: Entropy and Distribution Guided Quantization-Aware Training for the Acceleration of Lightweight LLMs on the Edge	Feb 16, 2024	Quantization	CodeCode Available	1
Dynamic Network Quantization for Efficient Video Inference	Aug 23, 2021	QuantizationVideo Recognition	CodeCode Available	1
A Benchmark for Gaussian Splatting Compression and Quality Assessment Study	Jul 19, 2024	AttributeData Compression	CodeCode Available	1
EasyQuant: Post-training Quantization via Scale Optimization	Jun 30, 2020	Quantization	CodeCode Available	1
EFaR 2023: Efficient Face Recognition Competition	Aug 8, 2023	Face RecognitionLightweight Face Recognition	CodeCode Available	1
DQS3D: Densely-matched Quantization-aware Semi-supervised 3D Detection	Apr 25, 2023	3D Object Detectionobject-detection	CodeCode Available	1
DVD-Quant: Data-free Video Diffusion Transformers Quantization	May 24, 2025	Data Free QuantizationQuantization	CodeCode Available	1
ABCD: Arbitrary Bitwise Coefficient for De-Quantization	Jan 1, 2023	Quantization	CodeCode Available	1
DQ-BART: Efficient Sequence-to-Sequence Model via Joint Distillation and Quantization	Mar 21, 2022	Knowledge DistillationModel Compression	CodeCode Available	1
Dynamic Dual Trainable Bounds for Ultra-low Precision Super-Resolution Networks	Mar 8, 2022	QuantizationSuper-Resolution	CodeCode Available	1
Effectiveness of self-supervised pre-training for speech recognition	Nov 10, 2019	Language ModellingQuantization	CodeCode Available	1
Do Emergent Abilities Exist in Quantized Large Language Models: An Empirical Study	Jul 16, 2023	In-Context LearningInstruction Following	CodeCode Available	1
DNN+NeuroSim V2.0: An End-to-End Benchmarking Framework for Compute-in-Memory Accelerators for On-chip Training	Mar 13, 2020	BenchmarkingQuantization	CodeCode Available	1

Show:10 25 50

← PrevPage 11 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified