Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 4925 papers

Title	Date	Tasks	Status
Gradient _1 Regularization for Quantization Robustness	Feb 18, 2020	Quantization	—Unverified
Gradient-Free Neural Network Training on the Edge	Oct 13, 2024	Quantization	—Unverified
Synaptic Modulation using Interspike Intervals Increases Energy Efficiency of Spiking Neural Networks	Aug 6, 2024	Quantization	—Unverified
GradiVeQ: Vector Quantization for Bandwidth-Efficient Gradient Aggregation in Distributed CNN Training	Nov 8, 2018	Dimensionality ReductionQuantization	—Unverified
FastMamba: A High-Speed and Efficient Mamba Accelerator on FPGA with Accurate Quantization	May 25, 2025	Computational EfficiencyCPU	—Unverified
Granger Causality from Quantized Measurements	Jun 3, 2021	Gaussian ProcessesQuantization	—Unverified
Communication-efficient Variance-reduced Stochastic Gradient Descent	Mar 10, 2020	Distributed OptimizationQuantization	—Unverified
Fast Low-rank Representation based Spatial Pyramid Matching for Image Classification	Sep 22, 2014	General Classificationimage-classification	—Unverified
Graph-Based Depth Denoising & Dequantization for Point Cloud Enhancement	Nov 9, 2021	DenoisingGraph Learning	—Unverified
Graph-Collaborated Auto-Encoder Hashing for Multi-view Binary Clustering	Jan 6, 2023	ClusteringQuantization	—Unverified
Communication-Efficient Split Learning via Adaptive Feature-Wise Compression	Jul 20, 2023	Quantization	—Unverified
Fast learning rates with heavy-tailed losses	Sep 29, 2016	ClusteringQuantization	—Unverified
Greedy Selection for Heterogeneous Sensors	Jul 3, 2023	Quantization	—Unverified
Greener yet Powerful: Taming Large Code Generation Models with Quantization	Mar 9, 2023	Code GenerationCode Summarization	—Unverified
Fast Large-Scale Discrete Optimization Based on Principal Coordinate Descent	Sep 16, 2019	Quantization	—Unverified
Fast Jet Tagging with MLP-Mixers on FPGAs	Mar 5, 2025	Jet TaggingQuantization	—Unverified
Fast Inference of Tree Ensembles on ARM Devices	May 15, 2023	Quantization	—Unverified
Gridless Angular Domain Channel Estimation for mmWave Massive MIMO System With One-Bit Quantization Via Approximate Message Passing	Sep 23, 2019	compressed sensingQuantization	—Unverified
Communication Efficient SGD via Gradient Sampling With Bayes Prior	Jun 19, 2021	image-classificationImage Classification	—Unverified
Group channel pruning and spatial attention distilling for object detection	Jun 2, 2023	Knowledge DistillationModel Compression	—Unverified
Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free	May 2, 2025	Quantization	—Unverified
Group Invariant Deep Representations for Image Instance Retrieval	Jan 9, 2016	Dimensionality Reductionimage-classification	—Unverified
AddNet: Deep Neural Networks Using FPGA-Optimized Multipliers	Nov 19, 2019	Quantization	—Unverified
GroupReduce: Block-Wise Low-Rank Approximation for Neural Language Model Shrinking	Jun 18, 2018	Language ModelingLanguage Modelling	—Unverified
Fast Implementation of 4-bit Convolutional Neural Networks for Mobile Devices	Sep 14, 2020	Optical Character Recognition (OCR)Quantization	—Unverified
FastICARL: Fast Incremental Classifier and Representation Learning with Efficient Budget Allocation in Audio Sensing Applications	Jun 14, 2021	Incremental LearningQuantization	—Unverified
Communication-efficient k-Means for Edge-based Machine Learning	Feb 8, 2021	BIG-bench Machine LearningDimensionality Reduction	—Unverified
Arbitrary Bit-width Network: A Joint Layer-Wise Quantization and Adaptive Inference Approach	Apr 21, 2022	Quantization	—Unverified
Guaranteed Quantization Error Computation for Neural Network Model Compression	Apr 26, 2023	Model CompressionNeural Network Compression	—Unverified
Faster Neural Net Inference via Forests of Sparse Oblique Decision Trees	Sep 29, 2021	Quantization	—Unverified
Faster Inference of Integer SWIN Transformer by Removing the GELU Activation	Feb 2, 2024	GPUimage-classification	—Unverified
Communication-Efficient Federated Learning by Quantized Variance Reduction for Heterogeneous Wireless Edge Networks	Jan 20, 2025	Federated LearningQuantization	—Unverified
Gull: A Generative Multifunctional Audio Codec	Apr 7, 2024	Audio CompressionAudio Source Separation	—Unverified
GWQ: Gradient-Aware Weight Quantization for Large Language Models	Oct 30, 2024	Outlier DetectionQuantization	—Unverified
Haar Wavelet Feature Compression for Quantized Graph Convolutional Networks	Oct 10, 2021	Feature CompressionNode Classification	—Unverified
Fastening the Initial Access in 5G NR Sidelink for 6G V2X Networks	Jun 10, 2021	PositionQuantization	—Unverified
HACK: Homomorphic Acceleration via Compression of the Key-Value Cache for Disaggregated LLM Inference	Feb 5, 2025	Language ModelingLanguage Modelling	—Unverified
Arabic Compact Language Modelling for Resource Limited Devices	Apr 1, 2021	Language ModelingLanguage Modelling	—Unverified
Hadamard Domain Training with Integers for Class Incremental Quantized Learning	Oct 5, 2023	Activity Recognitionclass-incremental learning	—Unverified
HadaNets: Flexible Quantization Strategies for Neural Networks	May 26, 2019	Model CompressionQuantization	—Unverified
HadaNorm: Diffusion Transformer Quantization through Mean-Centered Transformations	Jun 11, 2025	Image GenerationQuantization	—Unverified
HALL-E: Hierarchical Neural Codec Language Model for Minute-Long Zero-Shot Text-to-Speech Synthesis	Oct 6, 2024	Language ModelingLanguage Modelling	—Unverified
Additive Quantization for Extreme Vector Compression	Jun 1, 2014	General Classificationimage-classification	—Unverified
Acceleration for Compressed Gradient Descent in Distributed Optimization	Jan 1, 2020	Distributed OptimizationFederated Learning	—Unverified
FAST: DNN Training Under Variable Precision Block Floating Point with Stochastic Rounding	Oct 28, 2021	Quantization	—Unverified
LANA: Latency Aware Network Acceleration	Jul 12, 2021	CPUGPU	—Unverified
Fast DistilBERT on CPUs	Oct 27, 2022	Knowledge DistillationModel Compression	—Unverified
Communication-Efficient Federated Learning over Capacity-Limited Wireless Networks	Jul 20, 2023	Federated LearningQuantization	—Unverified
Communication-Efficient Federated Learning via Quantized Compressed Sensing	Nov 30, 2021	compressed sensingFederated Learning	—Unverified
AQUILA: Communication Efficient Federated Learning with Adaptive Quantization in Device Selection Strategy	Aug 1, 2023	Federated LearningPrivacy Preserving	—Unverified

Show:10 25 50

← PrevPage 41 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified