Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3725 of 4925 papers

Title	Date	Tasks	Status
A Survey on Model Compression for Large Language Models	Aug 15, 2023	BenchmarkingKnowledge Distillation	—Unverified
A Survey on Transformer Compression	Feb 5, 2024	Knowledge DistillationMamba	—Unverified
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations	Oct 17, 2024	DecoderQuantization	—Unverified
Asymmetric Correlation Quantization Hashing for Cross-modal Retrieval	Jan 14, 2020	Cross-Modal RetrievalQuantization	—Unverified
Asymmetric Deep Semantic Quantization for Image Retrieval	Mar 29, 2019	Image RetrievalQuantization	—Unverified
Asymmetric Learned Image Compression with Multi-Scale Residual Block, Importance Map, and Post-Quantization Filtering	Jun 21, 2022	DecoderImage Compression	—Unverified
Asymmetric Learning Vector Quantization for Efficient Nearest Neighbor Classification in Dynamic Time Warping Spaces	Mar 24, 2017	ClassificationDynamic Time Warping	—Unverified
Asymptotically Optimal Closed-Form Phase Configuration of 1-bit RISs via Sign Alignment	Jul 18, 2024	FormQuantization	—Unverified
Asymptotic Analysis of One-bit Quantized Box-Constrained Precoding in Large-Scale Multi-User Systems	Feb 5, 2025	Quantization	—Unverified
Asymptotic Performance Analysis of Large-Scale Active IRS-Aided Wireless Network	May 31, 2023	Quantization	—Unverified
Asymptotic stabilization under homomorphic encryption: A re-encryption free method	Apr 12, 2025	Quantization	—Unverified
Asymptotic tracking control of dynamic reference over homomorphically encrypted data with finite modulus	Sep 27, 2024	Quantization	—Unverified
Asymptotic Unbiased Sample Sampling to Speed Up Sharpness-Aware Minimization	Jun 12, 2024	Computational EfficiencyPose Estimation	—Unverified
Asynchronous Federated Learning with Bidirectional Quantized Communications and Buffered Aggregation	Aug 1, 2023	Federated LearningQuantization	—Unverified
A System-Level Solution for Low-Power Object Detection	Sep 24, 2019	CPUObject	—Unverified
A Targeted Acceleration and Compression Framework for Low bit Neural Networks	Jul 9, 2019	BinarizationComputational Efficiency	—Unverified
ATHEENA: A Toolflow for Hardware Early-Exit Network Automation	Apr 17, 2023	Quantization	—Unverified
Athena: Efficient Block-Wise Post-Training Quantization for Large Language Models Using Second-Order Matrix Derivative Information	May 24, 2024	Edge-computingMachine Translation	—Unverified
A Tiny CNN Architecture for Medical Face Mask Detection for Resource-Constrained Endpoints	Nov 30, 2020	Quantization	—Unverified
A TinyML Platform for On-Device Continual Learning with Quantized Latent Replays	Oct 20, 2021	Continual LearningQuantization	—Unverified
Atleus: Accelerating Transformers on the Edge Enabled by 3D Heterogeneous Manycore Architectures	Jan 16, 2025	Model CompressionQuantization	—Unverified
Atomic Anatomy of Low-Inertia Power Systems	May 21, 2023	AnatomyQuantization	—Unverified
Atrous Space Bender U-Net (ASBU-Net/LogiNet)	Dec 16, 2022	QuantizationSegmentation	—Unverified
Attacking Binarized Neural Networks	Nov 1, 2017	Quantization	—Unverified
Attention Augmented Convolutional Transformer for Tabular Time-series	Oct 5, 2021	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 149 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified