Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2650 of 4925 papers

Title	Date	Tasks	Status
Constraint Guided Model Quantization of Neural Networks	Sep 30, 2024	modelQuantization	—Unverified
Constructing High-Order Signed Distance Maps from Computed Tomography Data with Application to Bone Morphometry	Nov 2, 2021	Quantization	—Unverified
Contextual Compression Encoding for Large Language Models: A Novel Framework for Multi-Layered Parameter Space Pruning	Feb 12, 2025	Computational EfficiencyQuantization	—Unverified
Continual Learning of Generative Models with Limited Data: From Wasserstein-1 Barycenter to Adaptive Coalescence	Jan 22, 2021	Continual LearningQuantization	—Unverified
Continual Quantization-Aware Pre-Training: When to transition from 16-bit to 1.58-bit pre-training for BitNet language models?	Feb 17, 2025	Quantization	—Unverified
Continuous Approximations for Improving Quantization Aware Training of LLMs	Oct 6, 2024	MMLUModel Compression	—Unverified
Continuous Autoregressive Modeling with Stochastic Monotonic Alignment for Speech Synthesis	Feb 3, 2025	QuantizationSpeech Synthesis	—Unverified
Continuous Control with Action Quantization from Demonstrations	Oct 19, 2021	continuous-controlContinuous Control	—Unverified
Continuous Speech Synthesis using per-token Latent Diffusion	Oct 21, 2024	Image GenerationQuantization	—Unverified
Contrastive Mutual Information Maximization for Binary Neural Networks	Sep 29, 2021	BinarizationContrastive Learning	—Unverified
CoST: Contrastive Quantization based Semantic Tokenization for Generative Recommendation	Apr 23, 2024	DecoderLanguage Modelling	—Unverified
Contrastive Quant: Quantization Makes Stronger Contrastive Learning	Sep 29, 2021	Contrastive LearningQuantization	—Unverified
Convergence of Federated Learning over a Noisy Downlink	Aug 25, 2020	Federated LearningQuantization	—Unverified
Convergence rate of sign stochastic gradient descent for non-convex functions	Jan 1, 2018	Distributed OptimizationQuantization	—Unverified
Convergence rate of Tsallis entropic regularized optimal transport	Apr 13, 2023	Quantization	—Unverified
Convergence Rates for Regularized Optimal Transport via Quantization	Aug 30, 2022	Quantization	—Unverified
Convergence Theory of Generalized Distributed Subgradient Method with Random Quantization	Jul 22, 2022	Distributed OptimizationQuantization	—Unverified
Convex Quantization Preserves Logconcavity	Jun 11, 2022	Quantization	—Unverified
Convolutional neural network compression for natural language processing	May 28, 2018	Neural Network CompressionQuantization	—Unverified
Convolutional Neural Network Quantization using Generalized Gamma Distribution	Oct 31, 2018	Quantization	—Unverified
Convolutional Neural Networks Quantization with Attention	Sep 30, 2022	Quantization	—Unverified
Coordinated Per-Antenna Power Minimization for Multicell Massive MIMO Systems with Low-Resolution Data Converters	Aug 8, 2022	Quantization	—Unverified
CorBin-FL: A Differentially Private Federated Learning Mechanism using Common Randomness	Sep 20, 2024	Federated LearningQuantization	—Unverified
Coreset-Based Neural Network Compression	Jul 25, 2018	Neural Network CompressionQuantization	—Unverified
Correlated quantization for distributed mean estimation and optimization	Mar 9, 2022	Distributed OptimizationQuantization	—Unverified
Correlated Quantization for Faster Nonconvex Distributed Optimization	Jan 10, 2024	Distributed OptimizationQuantization	—Unverified
Correlation Hashing Network for Efficient Cross-Modal Retrieval	Feb 22, 2016	Cross-Modal RetrievalQuantization	—Unverified
CosSGD: Communication-Efficient Federated Learning with a Simple Cosine-Based Quantization	Dec 15, 2020	Federated Learningimage-classification	—Unverified
Cost-Aware Routing for Efficient Text-To-Image Generation	Jun 17, 2025	DenoisingImage Generation	—Unverified
Cost-Driven Hardware-Software Co-Optimization of Machine Learning Pipelines	Oct 11, 2023	Quantization	—Unverified
Countering Adversarial Examples: Combining Input Transformation and Noisy Training	Jun 25, 2021	Data AugmentationQuantization	—Unverified
Covariance Recovery for One-Bit Sampled Data With Time-Varying Sampling Thresholds-Part I: Stationary Signals	Mar 16, 2022	QuantizationRelation	—Unverified
Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression	Oct 8, 2024	Quantizationregression	—Unverified
COVIDLite: A depth-wise separable deep neural network with white balance and CLAHE for detection of COVID-19	Jun 19, 2020	Binary ClassificationDiagnostic	—Unverified
CPTQuant -- A Novel Mixed Precision Post-Training Quantization Techniques for Large Language Models	Dec 3, 2024	Language ModelingLanguage Modelling	—Unverified
CPT-V: A Contrastive Approach to Post-Training Quantization of Vision Transformers	Nov 17, 2022	QuantizationSelf-Supervised Learning	—Unverified
CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with Application to Disk Shape Analysis from Lumbar Spine MRI Images	Oct 17, 2020	Quantization	—Unverified
CRB Analysis for Mixed-ADC Based DOA Estimation	Mar 14, 2024	QuantizationSparse Learning	—Unverified
CREW: Computation Reuse and Efficient Weight Storage for Hardware-accelerated MLPs and RNNs	Jul 20, 2021	Quantization	—Unverified
Croesus: Multi-Stage Processing and Transactions for Video-Analytics in Edge-Cloud Systems	Dec 31, 2021	Model Compressionobject-detection	—Unverified
Crop Disease Classification using Support Vector Machines with Green Chromatic Coordinate (GCC) and Attention based feature extraction for IoT based Smart Agricultural Applications	Nov 1, 2023	NutritionQuantization	—Unverified
Cross-Dataset Propensity Estimation for Debiasing Recommender Systems	Dec 22, 2022	Causal InferenceQuantization	—Unverified
Cross-Layer Discrete Concept Discovery for Interpreting Language Models	Jun 24, 2025	DiversityQuantization	—Unverified
Cross-Layer Optimization for Fault-Tolerant Deep Learning	Dec 21, 2023	Bayesian OptimizationDeep Learning	—Unverified
Cross-Modal Discrete Representation Learning	Jun 10, 2021	Cross-Modal RetrievalQuantization	—Unverified
CrossQuant: A Post-Training Quantization Method with Smaller Quantization Kernel for Precise Large Language Model Compression	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
Cross-Scale Vector Quantization for Scalable Neural Speech Coding	Jul 7, 2022	Quantization	—Unverified
CRVQ: Channel-relaxed Vector Quantization for Extreme Compression of LLMs	Dec 12, 2024	Quantization	—Unverified
CSMPQ:Class Separability Based Mixed-Precision Quantization	Dec 20, 2022	Quantization	—Unverified
CSPLADE: Learned Sparse Retrieval with Causal Language Models	Apr 15, 2025	Information RetrievalQuantization	—Unverified

Show:10 25 50

← PrevPage 53 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified