Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 4925 papers

Title	Date	Tasks	Status
Forward Link Analysis for Full-Duplex Cellular Networks with Low Resolution ADC/DAC	Mar 7, 2022	Quantization	—Unverified
Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own	Oct 4, 2023	Quantizationreinforcement-learning	—Unverified
Compression of Generative Pre-trained Language Models via Quantization	Mar 21, 2022	Model CompressionQuantization	—Unverified
FoVolNet: Fast Volume Rendering using Foveated Deep Neural Networks	Sep 20, 2022	Data VisualizationImage Reconstruction	—Unverified
BitPruning: Learning Bitlengths for Aggressive and Accurate Quantization	Feb 8, 2020	Quantization	—Unverified
DQ-SGD: Dynamic Quantization in SGD for Communication-Efficient Distributed Learning	Jul 30, 2021	Quantization	—Unverified
A New Learning Method for Inference Accuracy, Core Occupation, and Performance Co-optimization on TrueNorth Chip	Apr 3, 2016	General ClassificationQuantization	—Unverified
DQ-Data2vec: Decoupling Quantization for Multilingual Speech Recognition	Jan 23, 2025	QuantizationRepresentation Learning	—Unverified
FP8-BERT: Post-Training Quantization for Transformer	Dec 10, 2023	Quantization	—Unverified
BitNet b1.58 Reloaded: State-of-the-art Performance Also on Smaller Networks	Jun 24, 2024	Quantization	—Unverified
DQA: An Efficient Method for Deep Quantization of Deep Neural Network Activations	Dec 12, 2024	image-classificationImage Classification	—Unverified
FP8 versus INT8 for efficient deep learning inference	Mar 31, 2023	Deep LearningQuantization	—Unverified
A new heuristic algorithm for fast k-segmentation	Sep 2, 2020	QuantizationSegmentation	—Unverified
FPGA Resource-aware Structured Pruning for Real-Time Neural Networks	Aug 9, 2023	Classificationimage-classification	—Unverified
Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test	Jun 8, 2025	Quantization	—Unverified
FPRaker: A Processing Element For Accelerating Neural Network Training	Oct 15, 2020	Quantization	—Unverified
FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion	Jun 5, 2025	DenoisingQuantization	—Unverified
FPTQ: Fine-grained Post-Training Quantization for Large Language Models	Aug 30, 2023	Quantization	—Unverified
FPTQuant: Function-Preserving Transforms for LLM Quantization	Jun 5, 2025	Quantization	—Unverified
FP=xINT:A Low-Bit Series Expansion Algorithm for Post-Training Quantization	Dec 9, 2024	Quantization	—Unverified
FQ-Conv: Fully Quantized Convolution for Efficient and Accurate Inference	Dec 19, 2019	Quantization	—Unverified
On the Convergence of Differentially Private Federated Learning on Non-Lipschitz Objectives, and with Normalized Client Updates	Jun 13, 2021	BenchmarkingFederated Learning	—Unverified
DP-Net: Dynamic Programming Guided Deep Neural Network Compression	Mar 21, 2020	ClusteringNeural Network Compression	—Unverified
A "Network Pruning Network" Approach to Deep Model Compression	Jan 15, 2020	Knowledge DistillationModel Compression	—Unverified
Downlink MIMO Channel Estimation from Bits: Recoverability and Algorithm	Nov 25, 2024	Quantization	—Unverified
Bit-Mixer: Mixed-precision networks with runtime bit-width selection	Mar 31, 2021	AutoMLBinarization	—Unverified
Frame Quantization of Neural Networks	Apr 11, 2024	Quantization	—Unverified
Free Bits: Latency Optimization of Mixed-Precision Quantized Neural Networks on the Edge	Jul 6, 2023	NavigateQuantization	—Unverified
An End-to-End DNN Inference Framework for the SpiNNaker2 Neuromorphic MPSoC	Jul 18, 2025	QuantizationScheduling	—Unverified
Frequency Autoregressive Image Generation with Continuous Tokens	Mar 7, 2025	Image GenerationLanguage Modeling	—Unverified
Frequency-Biased Synergistic Design for Image Compression and Compensation	Jan 1, 2025	Image CompressionQuantization	—Unverified
Frequency Disentangled Features in Neural Image Compression	Aug 4, 2023	DisentanglementImage Compression	—Unverified
Downlink Clustering-Based Scheduling of IRS-Assisted Communications With Reconfiguration Constraints	May 23, 2023	ClusteringQuantization	—Unverified
From Algorithm to Hardware: A Survey on Efficient and Safe Deployment of Deep Neural Networks	May 9, 2024	Knowledge DistillationModel Compression	—Unverified
Double Viterbi: Weight Encoding for High Compression Ratio and Fast On-Chip Reconstruction for Deep Neural Network	May 1, 2019	Model CompressionQuantization	—Unverified
Double Quantization for Communication-Efficient Distributed Optimization	May 25, 2018	Distributed OptimizationQuantization	—Unverified
From Hard to Soft: Understanding Deep Network Nonlinearities via Vector Quantization and Statistical Inference	Oct 22, 2018	Quantization	—Unverified
From Large to Super-Tiny: End-to-End Optimization for Cost-Efficient LLMs	Apr 18, 2025	Knowledge DistillationModel Compression	—Unverified
From Text to Source: Results in Detecting Large Language Model-Generated Content	Sep 23, 2023	AttributeLanguage Modeling	—Unverified
Double JPEG Detection in Mixed JPEG Quality Factors using Deep Convolutional Neural Network	Sep 1, 2018	Quantization	—Unverified
Fronthaul Compression and Passive Beamforming Design for Intelligent Reflecting Surface-aided Cloud Radio Access Networks	Feb 25, 2021	Quantization	—Unverified
Fronthaul-Constrained Distributed Radar Sensing	Sep 26, 2024	Quantization	—Unverified
Fronthaul Quantization-Aware MU-MIMO Precoding for Sum Rate Maximization	Jun 27, 2024	Quantization	—Unverified
FSNet: Compression of Deep Convolutional Neural Networks by Filter Summary	Feb 8, 2019	General Classificationimage-classification	—Unverified
Bit Efficient Quantization for Deep Neural Networks	Oct 7, 2019	ClusteringQuantization	—Unverified
FTL: A universal framework for training low-bit DNNs via Feature Transfer	Aug 1, 2020	QuantizationTransfer Learning	—Unverified
A blob method for inhomogeneous diffusion with applications to multi-agent control and sampling	Feb 25, 2022	Quantization	—Unverified
Full-Duplex Beyond Self-Interference: The Unlimited Sensing Way	Apr 12, 2024	Quantization	—Unverified
GradiVeQ: Vector Quantization for Bandwidth-Efficient Gradient Aggregation in Distributed CNN Training	Nov 8, 2018	Dimensionality ReductionQuantization	—Unverified
GranQ: Granular Zero-Shot Quantization with Channel-Wise Activation Scaling in QAT	Mar 24, 2025	Neural Network CompressionQuantization	—Unverified

Show:10 25 50

← PrevPage 38 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified