Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 4925 papers

Title	Date	Tasks	Status
How Does Batch Normalization Help Binary Training?	Sep 18, 2019	Quantization	—Unverified
Computation-Efficient Quantization Method for Deep Neural Networks	Sep 27, 2018	Quantization	—Unverified
Countering Adversarial Examples: Combining Input Transformation and Noisy Training	Jun 25, 2021	Data AugmentationQuantization	—Unverified
Covariance Recovery for One-Bit Sampled Data With Time-Varying Sampling Thresholds-Part I: Stationary Signals	Mar 16, 2022	QuantizationRelation	—Unverified
Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression	Oct 8, 2024	Quantizationregression	—Unverified
COVIDLite: A depth-wise separable deep neural network with white balance and CLAHE for detection of COVID-19	Jun 19, 2020	Binary ClassificationDiagnostic	—Unverified
A Structurally Regularized Convolutional Neural Network for Image Classification using Wavelet-based SubBand Decomposition	Mar 2, 2021	ClassificationGeneral Classification	—Unverified
A Feature-map Discriminant Perspective for Pruning Deep Neural Networks	May 28, 2020	Network PruningQuantization	—Unverified
Accurate Block Quantization in LLMs with Outliers	Mar 29, 2024	Quantization	—Unverified
CPT-V: A Contrastive Approach to Post-Training Quantization of Vision Transformers	Nov 17, 2022	QuantizationSelf-Supervised Learning	—Unverified
3U-EdgeAI: Ultra-Low Memory Training, Ultra-Low BitwidthQuantization, and Ultra-Low Latency Acceleration	May 11, 2021	Model CompressionQuantization	—Unverified
CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with Application to Disk Shape Analysis from Lumbar Spine MRI Images	Oct 17, 2020	Quantization	—Unverified
Design Flow of Accelerating Hybrid Extremely Low Bit-width Neural Network in Embedded FPGA	Jul 31, 2018	Edge-computingGPU	—Unverified
CRB Analysis for Mixed-ADC Based DOA Estimation	Mar 14, 2024	QuantizationSparse Learning	—Unverified
Computational Complexity Evaluation of Neural Network Applications in Signal Processing	Jun 24, 2022	Quantization	—Unverified
Croesus: Multi-Stage Processing and Transactions for Video-Analytics in Edge-Cloud Systems	Dec 31, 2021	Model Compressionobject-detection	—Unverified
Crop Disease Classification using Support Vector Machines with Green Chromatic Coordinate (GCC) and Attention based feature extraction for IoT based Smart Agricultural Applications	Nov 1, 2023	NutritionQuantization	—Unverified
Cross-Dataset Propensity Estimation for Debiasing Recommender Systems	Dec 22, 2022	Causal InferenceQuantization	—Unverified
Cross-Layer Discrete Concept Discovery for Interpreting Language Models	Jun 24, 2025	DiversityQuantization	—Unverified
Cross-Layer Optimization for Fault-Tolerant Deep Learning	Dec 21, 2023	Bayesian OptimizationDeep Learning	—Unverified
Cross-Modal Discrete Representation Learning	Jun 10, 2021	Cross-Modal RetrievalQuantization	—Unverified
Atleus: Accelerating Transformers on the Edge Enabled by 3D Heterogeneous Manycore Architectures	Jan 16, 2025	Model CompressionQuantization	—Unverified
Computability of Classification and Deep Learning: From Theoretical Limits to Practical Feasibility through Quantization	Aug 12, 2024	Deep LearningQuantization	—Unverified
A Structurally Regularized CNN Architecture via Adaptive Subband Decomposition	Jun 29, 2023	image-classificationImage Classification	—Unverified
Compress, Then Prompt: Improving Accuracy-Efficiency Trade-off of LLM Inference with Transferable Prompt	May 17, 2023	GPUModel Compression	—Unverified
Compress Polyphone Pronunciation Prediction Model with Shared Labels	Oct 1, 2020	PredictionQuantization	—Unverified
A Fast Network Exploration Strategy to Profile Low Energy Consumption for Keyword Spotting	Feb 4, 2022	Keyword SpottingQuantization	—Unverified
Compressive Spectrum Sensing with 1-bit ADCs	Nov 7, 2024	compressed sensingQuantization	—Unverified
Compressive Sensing Using Iterative Hard Thresholding with Low Precision Data Representation: Theory and Applications	Feb 14, 2018	AstronomyCompressive Sensing	—Unverified
Compressive Quantization for Fast Object Instance Search in Videos	Oct 1, 2017	Instance SearchObject	—Unverified
Compressive Estimation of a Stochastic Process with Unknown Autocorrelation Function	May 9, 2017	Quantization	—Unverified
Associative Memories to Accelerate Approximate Nearest Neighbor Search	Nov 10, 2016	QuantizationRetrieval	—Unverified
A Faster Approach to Spiking Deep Convolutional Neural Networks	Oct 31, 2022	Dimensionality ReductionQuantization	—Unverified
Accuracy to Throughput Trade-offs for Reduced Precision Neural Networks on Reconfigurable Logic	Jul 17, 2018	Quantization	—Unverified
Compressive Beam Alignment for Indoor Millimeter-Wave Systems	Jun 12, 2024	compressed sensingQuantization	—Unverified
Compression without Quantization	Sep 25, 2019	DecoderImage Compression	—Unverified
A Speed Odyssey for Deployable Quantization of LLMs	Nov 16, 2023	Language ModelingLanguage Modelling	—Unverified
Compression strategies and space-conscious representations for deep neural networks	Jul 15, 2020	Quantizationregression	—Unverified
Adverse Weather Removal with Codebook Priors	Jan 1, 2023	Quantization	—Unverified
Compression Scaling Laws:Unifying Sparsity and Quantization	Feb 23, 2025	Quantization	—Unverified
Compression-Realized Deep Structural Network for Video Quality Enhancement	May 10, 2024	DenoisingMotion Estimation	—Unverified
A SOT-MRAM-based Processing-In-Memory Engine for Highly Compressed DNN Implementation	Nov 24, 2019	Model CompressionQuantization	—Unverified
Compression of Site-Specific Deep Neural Networks for Massive MIMO Precoding	Feb 12, 2025	Neural Architecture SearchNeural Network Compression	—Unverified
Compression of Recurrent Neural Networks for Efficient Language Modeling	Feb 6, 2019	Language ModelingLanguage Modelling	—Unverified
ASI++: Towards Distributionally Balanced End-to-End Generative Retrieval	May 23, 2024	Information RetrievalQuantization	—Unverified
Sparsity Turns Adversarial: Energy and Latency Attacks on Deep Neural Networks	Jun 14, 2020	Computational EfficiencyQuantization	—Unverified
3LC: Lightweight and Effective Traffic Compression for Distributed Machine Learning	Feb 21, 2018	BIG-bench Machine LearningData Compression	—Unverified
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search	Oct 7, 2024	Fire DetectionNeural Architecture Search	—Unverified
Compression of Generative Pre-trained Language Models via Quantization	Mar 21, 2022	Model CompressionQuantization	—Unverified
Compression of Deep Neural Networks on the Fly	Sep 29, 2015	Object RecognitionQuantization	—Unverified

Show:10 25 50

← PrevPage 21 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified