Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4250 of 4925 papers

Title	Date	Tasks	Status
Device Interoperability for Learned Image Compression with Weights and Activations Quantization	Dec 2, 2022	Image CompressionQuantization	—Unverified
DFTerNet: Towards 2-bit Dynamic Fusion Networks for Accurate Human Activity Recognition	Jul 31, 2018	Action DetectionActivity Detection	—Unverified
Diagnostic data integration using deep neural networks for real-time plasma analysis	Oct 28, 2020	Data IntegrationDiagnostic	—Unverified
Differentiable Discrete Device-to-System Codesign for Optical Neural Networks via Gumbel-Softmax	Sep 29, 2021	QuantizationScheduling	—Unverified
Differentiable Dynamic Quantization with Mixed Precision and Adaptive Resolution	Jun 4, 2021	Quantization	—Unverified
Differentiable Joint Pruning and Quantization for Hardware Efficiency	Jul 20, 2020	Neural Network CompressionQuantization	—Unverified
Differentiable Product Quantization for Learning Compact Embedding Layers	Jan 1, 2020	Quantization	—Unverified
Differentiable Search for Finding Optimal Quantization Strategy	Apr 10, 2024	image-classificationImage Classification	—Unverified
Differentiable Training for Hardware Efficient LightNNs	Oct 20, 2018	Quantization	—Unverified
Differential Deep Detection in Massive MIMO With One-Bit ADC	Oct 27, 2021	Quantization	—Unverified
Differential error feedback for communication-efficient decentralized learning	Jun 26, 2024	Quantization	—Unverified
Differential Modulation in Massive MIMO With Low-Resolution ADCs	Nov 9, 2021	Quantization	—Unverified
Differential Privacy with Random Projections and Sign Random Projections	May 22, 2023	Information RetrievalQuantization	—Unverified
Diffusion-based Perceptual Neural Video Compression with Temporal Diffusion Information Reuse	Jan 23, 2025	Image CompressionQuantization	—Unverified
Diffusion Product Quantization	Nov 19, 2024	Quantization	—Unverified
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation	Sep 22, 2024	Image GenerationKnowledge Distillation	—Unverified
DILEMMA: Joint LLM Quantization and Distributed LLM Inference Over Edge Computing Systems	Mar 3, 2025	Edge-computingKnowledge Distillation	—Unverified
Dimensionality-Dependent Generalization Bounds for k-Dimensional Coding Schemes	Jan 3, 2016	ClusteringDictionary Learning	—Unverified
Dimension-Free Bounds for Low-Precision Training	May 1, 2019	Quantization	—Unverified
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression	Jun 25, 2025	Model CompressionQuantization	—Unverified
Direct Quantization for Training Highly Accurate Low Bit-width Deep Neural Networks	Dec 26, 2020	image-classificationImage Classification	—Unverified
DI-Retinex: Digital-Imaging Retinex Theory for Low-Light Image Enhancement	Apr 4, 2024	Image EnhancementLow-Light Image Enhancement	—Unverified
Dirichlet Mixture Model based VQ Performance Prediction for Line Spectral Frequency	Aug 2, 2018	Quantization	—Unverified
Disco Intelligent Omni-Surfaces: 360-degree Fully-Passive Jamming Attacks	Nov 20, 2024	Quantization	—Unverified
Disco Intelligent Reflecting Surfaces: Active Channel Aging for Fully-Passive Jamming Attacks	Feb 1, 2023	Quantization	—Unverified
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding	Nov 29, 2024	Motion SynthesisQuantization	—Unverified
Discovering Low-Precision Networks Close to Full-Precision Networks for Efficient Embedded Inference	Sep 11, 2018	General ClassificationQuantization	—Unverified
Discovering Patterns in Time-Varying Graphs: A Triclustering Approach	Aug 29, 2016	ClusteringQuantization	—Unverified
Discrete Audio Representation as an Alternative to Mel-Spectrograms for Speaker and Speech Recognition	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified
Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving	Mar 7, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified
Discrete-Valued Neural Communication	Jul 6, 2021	QuantizationSystematic Generalization	—Unverified
Discrete-Valued Neural Networks Using Variational Inference	Jan 1, 2018	QuantizationVariational Inference	—Unverified
Discriminative Cross-View Binary Representation Learning	Apr 4, 2018	Image RetrievalQuantization	—Unverified
Disentangled Representation Learning for Unsupervised Neural Quantization	Jan 1, 2023	QuantizationRepresentation Learning	—Unverified
Disentangling segmental and prosodic factors to non-native speech comprehensibility	Aug 20, 2024	QuantizationVoice Similarity	—Unverified
DiskANN++: Efficient Page-based Search over Isomorphic Mapped Graph Index using Query-sensitivity Entry Vertex	Sep 30, 2023	QuantizationSensitivity	—Unverified
Dissecting the Runtime Performance of the Training, Fine-tuning, and Inference of Large Language Models	Nov 7, 2023	GPUQuantization	—Unverified
Distance-aware Quantization	Aug 16, 2021	Quantization	—Unverified
Distance Encoded Product Quantization	Jun 1, 2014	Quantization	—Unverified
Distance-Weighted Graph Neural Networks on FPGAs for Real-Time Particle Reconstruction in High Energy Physics	Aug 8, 2020	ClusteringJet Tagging	—Unverified
Distilled Low Rank Neural Radiance Field with Quantization for Light Field Compression	Jul 30, 2022	NeRFQuantization	—Unverified
Distilling Vision-Language Pretraining for Efficient Cross-Modal Retrieval	May 23, 2024	Cross-Modal RetrievalQuantization	—Unverified
Distinctive Feature Codec: Adaptive Segmentation for Efficient Speech Representation	May 24, 2025	QuantizationRepresentation Learning	—Unverified
Distinguished Quantized Guidance for Diffusion-based Sequence Recommendation	Jan 29, 2025	DenoisingQuantization	—Unverified
Distinguishing Posed and Spontaneous Smiles by Facial Dynamics	Jan 6, 2017	ClassificationFace Model	—Unverified
Distortion-Controlled Dithering with Reduced Recompression Rate	Feb 26, 2024	Data CompressionImage Compression	—Unverified
Distributed Average Consensus under Quantized Communication via Event-Triggered Mass Summation	Jun 22, 2018	Quantization	—Unverified
Distributed Average Consensus under Quantized Communication via Event-Triggered Mass Splitting	Jul 23, 2019	Quantization	—Unverified
Distributed Chernoff Test: Optimal decision systems over networks	Sep 12, 2018	Decision MakingQuantization	—Unverified
Distributed Computation of Exact Average Degree and Network Size in Finite Number of Steps under Quantized Communication	Nov 29, 2022	Quantization	—Unverified

Show:10 25 50

← PrevPage 85 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified