Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2176–2200 of 4925 papers

Title	Date	Tasks	Status
Intelligent Fault Diagnosis of Type and Severity in Low-Frequency, Low Bit-Depth Signals	Nov 9, 2024	Fault DiagnosisQuantization	—Unverified
Interactions Across Blocks in Post-Training Quantization of Large Language Models	Nov 6, 2024	Quantization	—Unverified
Benchmarking the Robustness of Quantized Models	Apr 8, 2023	BenchmarkingQuantization	—Unverified
Differentiable Search for Finding Optimal Quantization Strategy	Apr 10, 2024	image-classificationImage Classification	—Unverified
Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models	May 21, 2023	GPUQuantization	—Unverified
Benchmarking the Reliability of Post-training Quantization: a Particular Focus on Worst-case Performance	Mar 23, 2023	BenchmarkingData Augmentation	—Unverified
Analog-digital Scheduling for Federated Learning: A Communication-Efficient Approach	Feb 1, 2024	Federated LearningQuantization	—Unverified
Integer Scale: A Free Lunch for Faster Fine-grained Quantization of LLMs	May 23, 2024	Quantization	—Unverified
Differentiable Product Quantization for Learning Compact Embedding Layers	Jan 1, 2020	Quantization	—Unverified
An Additive Latent Feature Model for Transparent Object Recognition	Dec 1, 2009	ObjectObject Recognition	—Unverified
Benchmarking quantized LLaMa-based models on the Brazilian Secondary School Exam	Sep 21, 2023	BenchmarkingComputational Efficiency	—Unverified
ACQ: Improving Generative Data-free Quantization Via Attention Correction	Jan 18, 2023	Data Free QuantizationPosition	—Unverified
Differentiable Joint Pruning and Quantization for Hardware Efficiency	Jul 20, 2020	Neural Network CompressionQuantization	—Unverified
An Adaptive Statistical Non-uniform Quantizer for Detail Wavelet Components in Lossy JPEG2000 Image Compression	May 9, 2013	Image CompressionQuantization	—Unverified
Acoustic Model Compression with MAP adaptation	May 1, 2017	Automatic Speech Recognition (ASR)model	—Unverified
Differentiable Dynamic Quantization with Mixed Precision and Adaptive Resolution	Jun 4, 2021	Quantization	—Unverified
Differentiable Discrete Device-to-System Codesign for Optical Neural Networks via Gumbel-Softmax	Sep 29, 2021	QuantizationScheduling	—Unverified
Benchmarking CFAR and CNN-based Peak Detection Algorithms in ISAC under Hardware Impairments	May 16, 2025	BenchmarkingIntegrated sensing and communication	—Unverified
A Bag of Tricks for Scaling CPU-based Deep FFMs to more than 300m Predictions per Second	Jul 14, 2024	Click-Through Rate PredictionCPU	—Unverified
Diagnostic data integration using deep neural networks for real-time plasma analysis	Oct 28, 2020	Data IntegrationDiagnostic	—Unverified
BELT:Bootstrapping Electroencephalography-to-Language Decoding and Zero-Shot Sentiment Classification by Natural Language Supervision	Sep 21, 2023	Brain DecodingContrastive Learning	—Unverified
DFTerNet: Towards 2-bit Dynamic Fusion Networks for Accurate Human Activity Recognition	Jul 31, 2018	Action DetectionActivity Detection	—Unverified
An adaptive random experiment design method for engineering experiment	Aug 27, 2020	Experimental DesignQuantization	—Unverified
2-bit Model Compression of Deep Convolutional Neural Network on ASIC Engine for Image Retrieval	May 8, 2019	Image RetrievalModel Compression	—Unverified
Integrating PHY Security Into NDN-IoT Networks By Exploiting MEC: Authentication Efficiency, Robustness, and Accuracy Enhancement	Oct 29, 2019	Decision MakingEdge-computing	—Unverified

Show:10 25 50

← PrevPage 88 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified