Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2651–2700 of 4925 papers

Title	Date	Tasks	Status
CSQ: Centered Symmetric Quantization for Extremely Low Bit Neural Networks	Sep 29, 2021	Quantization	—Unverified
CSQ: Growing Mixed-Precision Quantization Scheme with Bi-level Continuous Sparsification	Dec 6, 2022	Quantization	—Unverified
CSR:Achieving 1 Bit Key-Value Cache via Sparse Representation	Dec 16, 2024	Quantization	—Unverified
CTMQ: Cyclic Training of Convolutional Neural Networks with Multiple Quantization Steps	Jun 26, 2022	Quantization	—Unverified
CURSOR-BASED ADAPTIVE QUANTIZATION FOR DEEP NEURAL NETWORK	Sep 25, 2019	Quantization	—Unverified
Curvature in the Looking-Glass: Optimal Methods to Exploit Curvature of Expectation in the Loss Landscape	Nov 25, 2024	Quantization	—Unverified
Custom Gradient Estimators are Straight-Through Estimators in Disguise	May 8, 2024	Quantization	—Unverified
D^2MoE: Dual Routing and Dynamic Scheduling for Efficient On-Device MoE-based LLM Serving	Apr 17, 2025	Mixture-of-ExpertsModel Compression	—Unverified
DAdaQuant: Doubly-adaptive quantization for communication-efficient Federated Learning	Oct 31, 2021	Federated LearningPrivacy Preserving	—Unverified
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation	Oct 10, 2024	DenoisingImage Generation	—Unverified
DART: Disentanglement of Accent and Speaker Representation in Multispeaker Text-to-Speech	Oct 17, 2024	DisentanglementQuantization	—Unverified
DASNet: Dynamic Activation Sparsity for Neural Network Efficiency Improvement	Sep 13, 2019	Quantization	—Unverified
Data Augmentations in Deep Weight Spaces	Nov 15, 2023	Data AugmentationNetwork Pruning	—Unverified
Data Clustering using a Hybrid of Fuzzy C-Means and Quantum-behaved Particle Swarm Optimization	Dec 15, 2017	ClusteringQuantization	—Unverified
Data-Driven Deep Learning Based Hybrid Beamforming for Aerial Massive MIMO-OFDM Systems with Implicit CSI	Jan 18, 2022	QuantizationTransfer Learning	—Unverified
Data-Driven Depth Map Refinement via Multi-Scale Sparse Representation	Jun 1, 2015	Dictionary LearningMissing Values	—Unverified
Data-driven Dynamic Event-triggered Control	Jan 7, 2024	Quantization	—Unverified
Data-Driven Sparsity-Based Restoration of JPEG-Compressed Images in Dual Transform-Pixel Domain	Jun 1, 2015	Quantization	—Unverified
Dataflow-based Joint Quantization of Weights and Activations for Deep Neural Networks	Jan 4, 2019	Quantization	—Unverified
Data-Free Group-Wise Fully Quantized Winograd Convolution via Learnable Scales	Dec 27, 2024	image-classificationImage Classification	—Unverified
Data-free mixed-precision quantization using novel sensitivity metric	Mar 18, 2021	QuantizationSensitivity	—Unverified
Data-Free Network Compression via Parametric Non-Uniform Mixed Precision Quantization	Jan 1, 2022	Quantization	—Unverified
Data-Free Quantization via Mixed-Precision Compensation without Fine-Tuning	Jul 2, 2023	Data Free QuantizationModel Compression	—Unverified
Data-Free Quantization via Pseudo-label Filtering	Jan 1, 2024	Data Free QuantizationModel Compression	—Unverified
Data-Free Quantization with Accurate Activation Clipping and Adaptive Batch Normalization	Apr 8, 2022	Data Free QuantizationQuantization	—Unverified
Data-freeWeight Compress and Denoise for Large Language Models	Feb 26, 2024	GPUQuantization	—Unverified
Data Quality-aware Mixed-precision Quantization via Hybrid Reinforcement Learning	Feb 9, 2023	Quantizationreinforcement-learning	—Unverified
Dataset Distillation as Pushforward Optimal Quantization	Jan 13, 2025	Dataset DistillationDecoder	—Unverified
DB-LLM: Accurate Dual-Binarization for Efficient LLMs	Feb 19, 2024	BinarizationComputational Efficiency	—Unverified
DBQ: A Differentiable Branch Quantizer for Lightweight Deep Neural Networks	Jul 19, 2020	Quantization	—Unverified
DCNGAN: A Deformable Convolutional-Based GAN with QP Adaptation for Perceptual Quality Enhancement of Compressed Video	Jan 22, 2022	Generative Adversarial NetworkQuantization	—Unverified
DC-PCN: Point Cloud Completion Network with Dual-Codebook Guided Quantization	Jan 19, 2025	DecoderPoint Cloud Completion	—Unverified
Discrete Cosine Transform Based Decorrelated Attention for Vision Transformers	May 22, 2024	Quantization	—Unverified
Decentralized Low-Rank Fine-Tuning of Large Language Models	Jan 26, 2025	Federated Learningparameter-efficient fine-tuning	—Unverified
Decentralized Optimization on Compact Submanifolds by Quantized Riemannian Gradient Tracking	Jun 9, 2025	Distributed OptimizationQuantization	—Unverified
Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression	Mar 18, 2024	EthicsFairness	—Unverified
Decomposing Normal and Abnormal Features of Medical Images into Discrete Latent Codes for Content-Based Image Retrieval	Mar 23, 2021	AnatomyContent-Based Image Retrieval	—Unverified
DeCoR: Defy Knowledge Forgetting by Predicting Earlier Audio Codes	May 29, 2023	Acoustic Scene ClassificationContinual Learning	—Unverified
Decoupled Greedy Learning of CNNs for Synchronous and Asynchronous Distributed Learning	Jun 11, 2021	image-classificationImage Classification	—Unverified
DEED: A General Quantization Scheme for Communication Efficiency in Bits	Jun 19, 2020	Distributed OptimizationFederated Learning	—Unverified
Deep activity propagation via weight initialization in spiking neural networks	Oct 1, 2024	Quantization	—Unverified
Deep and Shallow Covariance Feature Quantization for 3D Facial Expression Recognition	May 12, 2021	3D Facial Expression RecognitionFacial Expression Recognition	—Unverified
Deep Asymmetric Hashing with Dual Semantic Regression and Class Structure Quantization	Oct 24, 2021	Deep HashingImage Retrieval	—Unverified
Deep Attentive Generative Adversarial Network for Photo-Realistic Image De-Quantization	Apr 7, 2020	Generative Adversarial NetworkQuantization	—Unverified
Deep Autoencoder-based Z-Interference Channels with Perfect and Imperfect CSI	Oct 23, 2023	Quantization	—Unverified
Deep Compression of Neural Networks for Fault Detection on Tennessee Eastman Chemical Processes	Jan 18, 2021	ClusteringFault Detection	—Unverified
Deep Conditional Measure Quantization	Jan 17, 2023	Quantization	—Unverified
Deep Convolutional Compression for Massive MIMO CSI Feedback	Jul 2, 2019	DiversityQuantization	—Unverified
Deep data compression for approximate ultrasonic image formation	Sep 4, 2020	Data CompressionDecoder	—Unverified
DeepEvolution: A Search-Based Testing Approach for Deep Neural Networks	Sep 5, 2019	Autonomous VehiclesDiversity	—Unverified

Show:10 25 50

← PrevPage 54 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified