Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2401–2425 of 4925 papers

Title	Date	Tasks	Status
Deep Neural Network Models Compression	Mar 4, 2021	Knowledge DistillationQuantization	—Unverified
Design Space Exploration of Low-Bit Quantized Neural Networks for Visual Place Recognition	Dec 14, 2023	QuantizationVisual Place Recognition	—Unverified
Large Deviation Upper Bounds and Improved MSE Rates of Nonlinear SGD: Heavy-tailed Noise and Power of Symmetry	Oct 21, 2024	Quantization	—Unverified
Just CHOP: Embarrassingly Simple LLM Compression	May 24, 2023	Knowledge DistillationLanguage Modeling	—Unverified
Large Language Models For Text Classification: Case Study And Comprehensive Review	Jan 14, 2025	ArticlesBinary Classification	—Unverified
Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models	May 21, 2023	GPUQuantization	—Unverified
LASERS: LAtent Space Encoding for Representations with Sparsity for Generative Modeling	Sep 16, 2024	Dictionary LearningQuantization	—Unverified
LAST: Language Model Aware Speech Tokenization	Sep 5, 2024	Language ModelingLanguage Modelling	—Unverified
Latency-Distortion Tradeoffs in Communicating Classification Results over Noisy Channels	Apr 22, 2024	NavigateQuantization	—Unverified
A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Series	Dec 1, 2024	ImputationQuantization	—Unverified
Latent Representation Matters: Human-like Sketches in One-shot Drawing Tasks	Jun 10, 2024	Quantization	—Unverified
Lattice Functions for the Analysis of Analog-to-Digital Conversion	Mar 28, 2019	Quantization	—Unverified
Lattice Quantization	Sep 29, 2021	Quantization	—Unverified
Lattice Representation Learning	Sep 25, 2019	DecoderQuantization	—Unverified
A Low Memory Footprint Quantized Neural Network for Depth Completion of Very Sparse Time-of-Flight Depth Maps	May 25, 2022	DecoderDepth Completion	—Unverified
Layer-specific Optimization for Mixed Data Flow with Mixed Precision in FPGA Design for CNN-based Object Detectors	Sep 3, 2020	Bayesian OptimizationModel Compression	—Unverified
Learning with tree tensor networks: complexity estimates and model selection	Jul 2, 2020	Model SelectionQuantization	—Unverified
Layer-wise Quantization for Quantized Optimistic Dual Averaging	May 20, 2025	Quantization	—Unverified
LCDet: Low-Complexity Fully-Convolutional Neural Networks for Object Detection in Embedded Systems	May 16, 2017	Face Detectionimage-classification	—Unverified
LCQ: Low-Rank Codebook based Quantization for Large Language Models	May 31, 2024	Model CompressionQuantization	—Unverified
Integer-only Quantized Transformers for Embedded FPGA-based Time-series Forecasting in AIoT	Jul 6, 2024	QuantizationTime Series	—Unverified
LDPC Decoding with Degree-Specific Neural Message Weights and RCQ Decoding	Oct 24, 2023	DecoderQuantization	—Unverified
A Lottery Ticket Hypothesis Framework for Low-Complexity Device-Robust Neural Acoustic Scene Classification	Jul 3, 2021	Acoustic Scene ClassificationData Augmentation	—Unverified
Learning Task-Based Trainable Neuromorphic ADCs via Power-Aware Distillation	Sep 4, 2024	Quantization	—Unverified
Integer-arithmetic-only Certified Robustness for Quantized Neural Networks	Aug 21, 2021	Quantization	—Unverified

Show:10 25 50

← PrevPage 97 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified