Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4051–4100 of 4925 papers

Title	Date	Tasks	Status
Countering Adversarial Examples: Combining Input Transformation and Noisy Training	Jun 25, 2021	Data AugmentationQuantization	—Unverified
Covariance Recovery for One-Bit Sampled Data With Time-Varying Sampling Thresholds-Part I: Stationary Signals	Mar 16, 2022	QuantizationRelation	—Unverified
Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression	Oct 8, 2024	Quantizationregression	—Unverified
COVIDLite: A depth-wise separable deep neural network with white balance and CLAHE for detection of COVID-19	Jun 19, 2020	Binary ClassificationDiagnostic	—Unverified
CPTQuant -- A Novel Mixed Precision Post-Training Quantization Techniques for Large Language Models	Dec 3, 2024	Language ModelingLanguage Modelling	—Unverified
CPT-V: A Contrastive Approach to Post-Training Quantization of Vision Transformers	Nov 17, 2022	QuantizationSelf-Supervised Learning	—Unverified
CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with Application to Disk Shape Analysis from Lumbar Spine MRI Images	Oct 17, 2020	Quantization	—Unverified
CRB Analysis for Mixed-ADC Based DOA Estimation	Mar 14, 2024	QuantizationSparse Learning	—Unverified
CREW: Computation Reuse and Efficient Weight Storage for Hardware-accelerated MLPs and RNNs	Jul 20, 2021	Quantization	—Unverified
Croesus: Multi-Stage Processing and Transactions for Video-Analytics in Edge-Cloud Systems	Dec 31, 2021	Model Compressionobject-detection	—Unverified
Crop Disease Classification using Support Vector Machines with Green Chromatic Coordinate (GCC) and Attention based feature extraction for IoT based Smart Agricultural Applications	Nov 1, 2023	NutritionQuantization	—Unverified
Cross-Dataset Propensity Estimation for Debiasing Recommender Systems	Dec 22, 2022	Causal InferenceQuantization	—Unverified
Cross-Layer Discrete Concept Discovery for Interpreting Language Models	Jun 24, 2025	DiversityQuantization	—Unverified
Cross-Layer Optimization for Fault-Tolerant Deep Learning	Dec 21, 2023	Bayesian OptimizationDeep Learning	—Unverified
Cross-Modal Discrete Representation Learning	Jun 10, 2021	Cross-Modal RetrievalQuantization	—Unverified
CrossQuant: A Post-Training Quantization Method with Smaller Quantization Kernel for Precise Large Language Model Compression	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
Cross-Scale Vector Quantization for Scalable Neural Speech Coding	Jul 7, 2022	Quantization	—Unverified
CRVQ: Channel-relaxed Vector Quantization for Extreme Compression of LLMs	Dec 12, 2024	Quantization	—Unverified
CSMPQ:Class Separability Based Mixed-Precision Quantization	Dec 20, 2022	Quantization	—Unverified
CSPLADE: Learned Sparse Retrieval with Causal Language Models	Apr 15, 2025	Information RetrievalQuantization	—Unverified
CSQ: Centered Symmetric Quantization for Extremely Low Bit Neural Networks	Sep 29, 2021	Quantization	—Unverified
CSQ: Growing Mixed-Precision Quantization Scheme with Bi-level Continuous Sparsification	Dec 6, 2022	Quantization	—Unverified
CSR:Achieving 1 Bit Key-Value Cache via Sparse Representation	Dec 16, 2024	Quantization	—Unverified
CTMQ: Cyclic Training of Convolutional Neural Networks with Multiple Quantization Steps	Jun 26, 2022	Quantization	—Unverified
CURSOR-BASED ADAPTIVE QUANTIZATION FOR DEEP NEURAL NETWORK	Sep 25, 2019	Quantization	—Unverified
Curvature in the Looking-Glass: Optimal Methods to Exploit Curvature of Expectation in the Loss Landscape	Nov 25, 2024	Quantization	—Unverified
Custom Gradient Estimators are Straight-Through Estimators in Disguise	May 8, 2024	Quantization	—Unverified
D^2MoE: Dual Routing and Dynamic Scheduling for Efficient On-Device MoE-based LLM Serving	Apr 17, 2025	Mixture-of-ExpertsModel Compression	—Unverified
DAdaQuant: Doubly-adaptive quantization for communication-efficient Federated Learning	Oct 31, 2021	Federated LearningPrivacy Preserving	—Unverified
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation	Oct 10, 2024	DenoisingImage Generation	—Unverified
DART: Disentanglement of Accent and Speaker Representation in Multispeaker Text-to-Speech	Oct 17, 2024	DisentanglementQuantization	—Unverified
DASNet: Dynamic Activation Sparsity for Neural Network Efficiency Improvement	Sep 13, 2019	Quantization	—Unverified
Data Augmentations in Deep Weight Spaces	Nov 15, 2023	Data AugmentationNetwork Pruning	—Unverified
Data Clustering using a Hybrid of Fuzzy C-Means and Quantum-behaved Particle Swarm Optimization	Dec 15, 2017	ClusteringQuantization	—Unverified
Data-Driven Deep Learning Based Hybrid Beamforming for Aerial Massive MIMO-OFDM Systems with Implicit CSI	Jan 18, 2022	QuantizationTransfer Learning	—Unverified
Data-Driven Depth Map Refinement via Multi-Scale Sparse Representation	Jun 1, 2015	Dictionary LearningMissing Values	—Unverified
Data-driven Dynamic Event-triggered Control	Jan 7, 2024	Quantization	—Unverified
Data-Driven Sparsity-Based Restoration of JPEG-Compressed Images in Dual Transform-Pixel Domain	Jun 1, 2015	Quantization	—Unverified
Dataflow-based Joint Quantization of Weights and Activations for Deep Neural Networks	Jan 4, 2019	Quantization	—Unverified
Data-Free Group-Wise Fully Quantized Winograd Convolution via Learnable Scales	Dec 27, 2024	image-classificationImage Classification	—Unverified
Data-free mixed-precision quantization using novel sensitivity metric	Mar 18, 2021	QuantizationSensitivity	—Unverified
Data-Free Network Compression via Parametric Non-Uniform Mixed Precision Quantization	Jan 1, 2022	Quantization	—Unverified
Data-Free Quantization via Mixed-Precision Compensation without Fine-Tuning	Jul 2, 2023	Data Free QuantizationModel Compression	—Unverified
Data-Free Quantization via Pseudo-label Filtering	Jan 1, 2024	Data Free QuantizationModel Compression	—Unverified
Data-Free Quantization with Accurate Activation Clipping and Adaptive Batch Normalization	Apr 8, 2022	Data Free QuantizationQuantization	—Unverified
Data-freeWeight Compress and Denoise for Large Language Models	Feb 26, 2024	GPUQuantization	—Unverified
Data Quality-aware Mixed-precision Quantization via Hybrid Reinforcement Learning	Feb 9, 2023	Quantizationreinforcement-learning	—Unverified
Dataset Distillation as Pushforward Optimal Quantization	Jan 13, 2025	Dataset DistillationDecoder	—Unverified
DB-LLM: Accurate Dual-Binarization for Efficient LLMs	Feb 19, 2024	BinarizationComputational Efficiency	—Unverified
DBQ: A Differentiable Branch Quantizer for Lightweight Deep Neural Networks	Jul 19, 2020	Quantization	—Unverified

Show:10 25 50

← PrevPage 82 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified