Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2200 of 4925 papers

Title	Date	Tasks	Status
Intuitive Analysis of the Quantization-based Optimization: From Stochastic and Quantum Mechanical Perspective	Dec 31, 2024	global-optimizationQuantization	—Unverified
Direct Quantization for Training Highly Accurate Low Bit-width Deep Neural Networks	Dec 26, 2020	image-classificationImage Classification	—Unverified
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression	Jun 25, 2025	Model CompressionQuantization	—Unverified
Dimension-Free Bounds for Low-Precision Training	May 1, 2019	Quantization	—Unverified
Dimensionality-Dependent Generalization Bounds for k-Dimensional Coding Schemes	Jan 3, 2016	ClusteringDictionary Learning	—Unverified
Analysis and Optimization for RIS-Aided Multi-Pair Communications Relying on Statistical CSI	Jul 22, 2020	Quantization	—Unverified
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning	Oct 18, 2023	Offline RLQuantization	—Unverified
DILEMMA: Joint LLM Quantization and Distributed LLM Inference Over Edge Computing Systems	Mar 3, 2025	Edge-computingKnowledge Distillation	—Unverified
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation	Sep 22, 2024	Image GenerationKnowledge Distillation	—Unverified
Beyond Neighbourhood-Preserving Transformations for Quantization-Based Unsupervised Hashing	Oct 1, 2021	Quantization	—Unverified
Diffusion Product Quantization	Nov 19, 2024	Quantization	—Unverified
Analog Spiking Neuron in CMOS 28 nm Towards Large-Scale Neuromorphic Processors	Aug 14, 2024	Quantization	—Unverified
CDFGNN: a Systematic Design of Cache-based Distributed Full-Batch Graph Neural Network Training with Communication Reduction	Aug 1, 2024	Graph Neural NetworkQuantization	—Unverified
Reconfigurable Intelligent Surface-induced Randomness for mmWave Key Generation	Oct 31, 2021	Quantization	—Unverified
Beyond Discreteness: Finite-Sample Analysis of Straight-Through Estimator for Quantization	May 23, 2025	compressed sensingQuantization	—Unverified
Better Schedules for Low Precision Training of Deep Neural Networks	Mar 4, 2024	Node ClassificationQuantization	—Unverified
Diffusion-based Perceptual Neural Video Compression with Temporal Diffusion Information Reuse	Jan 23, 2025	Image CompressionQuantization	—Unverified
Differential Privacy with Random Projections and Sign Random Projections	May 22, 2023	Information RetrievalQuantization	—Unverified
ACT360: An Efficient 360-Degree Action Detection and Summarization Framework for Mission-Critical Training and Debriefing	Mar 17, 2025	Action DetectionDisaster Response	—Unverified
Differential Modulation in Massive MIMO With Low-Resolution ADCs	Nov 9, 2021	Quantization	—Unverified
Differential error feedback for communication-efficient decentralized learning	Jun 26, 2024	Quantization	—Unverified
BeST -- A Novel Source Selection Metric for Transfer Learning	Jan 19, 2025	QuantizationTransfer Learning	—Unverified
Differential Deep Detection in Massive MIMO With One-Bit ADC	Oct 27, 2021	Quantization	—Unverified
Differentiable Training for Hardware Efficient LightNNs	Oct 20, 2018	Quantization	—Unverified
Bernoulli Embeddings for Graphs	Mar 25, 2018	Information RetrievalQuantization	—Unverified
Intelligent Fault Diagnosis of Type and Severity in Low-Frequency, Low Bit-Depth Signals	Nov 9, 2024	Fault DiagnosisQuantization	—Unverified
Interactions Across Blocks in Post-Training Quantization of Large Language Models	Nov 6, 2024	Quantization	—Unverified
Benchmarking the Robustness of Quantized Models	Apr 8, 2023	BenchmarkingQuantization	—Unverified
Differentiable Search for Finding Optimal Quantization Strategy	Apr 10, 2024	image-classificationImage Classification	—Unverified
Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models	May 21, 2023	GPUQuantization	—Unverified
Benchmarking the Reliability of Post-training Quantization: a Particular Focus on Worst-case Performance	Mar 23, 2023	BenchmarkingData Augmentation	—Unverified
Analog-digital Scheduling for Federated Learning: A Communication-Efficient Approach	Feb 1, 2024	Federated LearningQuantization	—Unverified
Integer Scale: A Free Lunch for Faster Fine-grained Quantization of LLMs	May 23, 2024	Quantization	—Unverified
Differentiable Product Quantization for Learning Compact Embedding Layers	Jan 1, 2020	Quantization	—Unverified
An Additive Latent Feature Model for Transparent Object Recognition	Dec 1, 2009	ObjectObject Recognition	—Unverified
Benchmarking quantized LLaMa-based models on the Brazilian Secondary School Exam	Sep 21, 2023	BenchmarkingComputational Efficiency	—Unverified
ACQ: Improving Generative Data-free Quantization Via Attention Correction	Jan 18, 2023	Data Free QuantizationPosition	—Unverified
Differentiable Joint Pruning and Quantization for Hardware Efficiency	Jul 20, 2020	Neural Network CompressionQuantization	—Unverified
An Adaptive Statistical Non-uniform Quantizer for Detail Wavelet Components in Lossy JPEG2000 Image Compression	May 9, 2013	Image CompressionQuantization	—Unverified
Acoustic Model Compression with MAP adaptation	May 1, 2017	Automatic Speech Recognition (ASR)model	—Unverified
Differentiable Dynamic Quantization with Mixed Precision and Adaptive Resolution	Jun 4, 2021	Quantization	—Unverified
Differentiable Discrete Device-to-System Codesign for Optical Neural Networks via Gumbel-Softmax	Sep 29, 2021	QuantizationScheduling	—Unverified
Benchmarking CFAR and CNN-based Peak Detection Algorithms in ISAC under Hardware Impairments	May 16, 2025	BenchmarkingIntegrated sensing and communication	—Unverified
A Bag of Tricks for Scaling CPU-based Deep FFMs to more than 300m Predictions per Second	Jul 14, 2024	Click-Through Rate PredictionCPU	—Unverified
Diagnostic data integration using deep neural networks for real-time plasma analysis	Oct 28, 2020	Data IntegrationDiagnostic	—Unverified
BELT:Bootstrapping Electroencephalography-to-Language Decoding and Zero-Shot Sentiment Classification by Natural Language Supervision	Sep 21, 2023	Brain DecodingContrastive Learning	—Unverified
DFTerNet: Towards 2-bit Dynamic Fusion Networks for Accurate Human Activity Recognition	Jul 31, 2018	Action DetectionActivity Detection	—Unverified
An adaptive random experiment design method for engineering experiment	Aug 27, 2020	Experimental DesignQuantization	—Unverified
2-bit Model Compression of Deep Convolutional Neural Network on ASIC Engine for Image Retrieval	May 8, 2019	Image RetrievalModel Compression	—Unverified
Integrating PHY Security Into NDN-IoT Networks By Exploiting MEC: Authentication Efficiency, Robustness, and Accuracy Enhancement	Oct 29, 2019	Decision MakingEdge-computing	—Unverified

Show:10 25 50

← PrevPage 44 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified