Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2150 of 4925 papers

Title	Date	Tasks	Status
Distinctive Feature Codec: Adaptive Segmentation for Efficient Speech Representation	May 24, 2025	QuantizationRepresentation Learning	—Unverified
BiLiMO: Bit-Limited MIMO Radar via Task-Based Quantization	Oct 1, 2020	Quantization	—Unverified
An Analysis on Quantizing Diffusion Transformers	Jun 16, 2024	Conditional Image GenerationDenoising	—Unverified
End-to-End Supervised Product Quantization for Image Search and Retrieval	Nov 23, 2017	General ClassificationImage Retrieval	—Unverified
Inpainting Computational Fluid Dynamics with Deep Learning	Feb 27, 2024	Deep LearningQuantization	—Unverified
JAQ: Joint Efficient Architecture Design and Low-Bit Quantization with Hardware-Software Co-Exploration	Jan 9, 2025	Quantization	—Unverified
Distilling Vision-Language Pretraining for Efficient Cross-Modal Retrieval	May 23, 2024	Cross-Modal RetrievalQuantization	—Unverified
SpeedLimit: Neural Architecture Search for Quantized Transformer Models	Sep 25, 2022	Neural Architecture SearchQuantization	—Unverified
Activation Map-based Vector Quantization for 360-degree Image Semantic Communication	Jun 7, 2024	QuantizationSemantic Communication	—Unverified
Distilled Low Rank Neural Radiance Field with Quantization for Light Field Compression	Jul 30, 2022	NeRFQuantization	—Unverified
Analyzing Quantization in TVM	Aug 19, 2023	Quantization	—Unverified
IMSSA: Deploying modern state-space models on memristive in-memory compute hardware	Dec 28, 2024	GPUQuantization	—Unverified
Distance-Weighted Graph Neural Networks on FPGAs for Real-Time Particle Reconstruction in High Energy Physics	Aug 8, 2020	ClusteringJet Tagging	—Unverified
Distance Encoded Product Quantization	Jun 1, 2014	Quantization	—Unverified
Distance-aware Quantization	Aug 16, 2021	Quantization	—Unverified
Bifocal Neural ASR: Exploiting Keyword Spotting for Inference Optimization	Aug 3, 2021	Inference OptimizationKeyword Spotting	—Unverified
Analyzing Compression Techniques for Computer Vision	May 14, 2023	Knowledge DistillationQuantization	—Unverified
Fine-Tuning, Quantization, and LLMs: Navigating Unintended Outcomes	Apr 5, 2024	Quantization	—Unverified
Dissecting the Runtime Performance of the Training, Fine-tuning, and Inference of Large Language Models	Nov 7, 2023	GPUQuantization	—Unverified
DiskANN++: Efficient Page-based Search over Isomorphic Mapped Graph Index using Query-sensitivity Entry Vertex	Sep 30, 2023	QuantizationSensitivity	—Unverified
Analytical aspects of non-differentiable neural networks	Nov 3, 2020	Quantization	—Unverified
Disentangling segmental and prosodic factors to non-native speech comprehensibility	Aug 20, 2024	QuantizationVoice Similarity	—Unverified
Bielik 11B v2 Technical Report	May 5, 2025	Language ModelingLanguage Modelling	—Unverified
Analysis of the influence of final resolution on ADC accuracy	Jul 1, 2023	Quantization	—Unverified
Activation Functions for Generalized Learning Vector Quantization - A Performance Comparison	Jan 17, 2019	ClassificationGeneral Classification	—Unverified
Disentangled Representation Learning for Unsupervised Neural Quantization	Jan 1, 2023	QuantizationRepresentation Learning	—Unverified
Discriminative Cross-View Binary Representation Learning	Apr 4, 2018	Image RetrievalQuantization	—Unverified
Discrete-Valued Neural Networks Using Variational Inference	Jan 1, 2018	QuantizationVariational Inference	—Unverified
BICM-compatible Rate Adaptive Geometric Constellation Shaping Using Optimized Many-to-one Labeling	Nov 10, 2023	Quantization	—Unverified
Improving the Robustness of Quantized Deep Neural Networks to White-Box Attacks using Stochastic Quantization and Information-Theoretic Ensemble Training	Nov 30, 2023	DiversityInformation Plane	—Unverified
Increasing Compactness Of Deep Learning Based Speech Enhancement Models With Parameter Pruning And Quantization Techniques	May 31, 2019	DenoisingQuantization	—Unverified
Discrete-Valued Neural Communication	Jul 6, 2021	QuantizationSystematic Generalization	—Unverified
Improving Robustness Against Adversarial Attacks with Deeply Quantized Neural Networks	Apr 25, 2023	Adversarial RobustnessQuantization	—Unverified
Analysis of Quantized Models	May 1, 2019	Quantization	—Unverified
Improving Quantization with Post-Training Model Expansion	Mar 21, 2025	Large Language Modelmodel	—Unverified
Improving Statistical Significance in Human Evaluation of Automatic Metrics via Soft Pairwise Accuracy	Sep 15, 2024	Quantization	—Unverified
BF-IMNA: A Bit Fluid In-Memory Neural Architecture for Neural Network Acceleration	Nov 3, 2024	Quantization	—Unverified
Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving	Mar 7, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified
Activation Density based Mixed-Precision Quantization for Energy Efficient Neural Networks	Jan 12, 2021	Model CompressionQuantization	—Unverified
Beyond Throughput and Compression Ratios: Towards High End-to-end Utility of Gradient Compression	Jul 1, 2024	Quantization	—Unverified
Discrete Audio Representation as an Alternative to Mel-Spectrograms for Speaker and Speech Recognition	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified
Analysis of Quantization on MLP-based Vision Models	Sep 14, 2022	Model CompressionQuantization	—Unverified
Improving Quantization-aware Training of Low-Precision Network via Block Replacement on Full-Precision Counterpart	Dec 20, 2024	Quantization	—Unverified
Improving the accuracy of neural networks in analog computing-in-memory systems by a generalized quantization method	Jan 1, 2021	image-classificationImage Classification	—Unverified
Beyond the Tip of Efficiency: Uncovering the Submerged Threats of Jailbreak Attacks in Small Language Models	Feb 27, 2025	Knowledge DistillationModel Compression	—Unverified
Discovering Patterns in Time-Varying Graphs: A Triclustering Approach	Aug 29, 2016	ClusteringQuantization	—Unverified
Analysis of Oversampling in Uplink Massive MIMO-OFDM with Low-Resolution ADCs	Jun 30, 2023	Quantization	—Unverified
Discovering Low-Precision Networks Close to Full-Precision Networks for Efficient Embedded Inference	Sep 11, 2018	General ClassificationQuantization	—Unverified
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding	Nov 29, 2024	Motion SynthesisQuantization	—Unverified
Beyond Task Vectors: Selective Task Arithmetic Based on Importance Metrics	Nov 25, 2024	Knowledge DistillationMulti-Task Learning	—Unverified

Show:10 25 50

← PrevPage 43 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified