Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4776–4800 of 4925 papers

Title	Date	Tasks	Status
HarmLevelBench: Evaluating Harm-Level Compliance and the Impact of Quantization on Model Alignment	Nov 11, 2024	Quantization	—Unverified
Harnessing Unrecognizable Faces for Improving Face Recognition	Jun 8, 2021	Face RecognitionQuantization	—Unverified
Harnessing Your DRAM and SSD for Sustainable and Accessible LLM Inference with Mixed-Precision and Multi-level Caching	Oct 17, 2024	GPUQuantization	—Unverified
HARP-Net: Hyper-Autoencoded Reconstruction Propagation for Scalable Neural Audio Coding	Jul 22, 2021	DecoderQuantization	—Unverified
Hashing in the Zero Shot Framework with Domain Adaptation	Feb 7, 2017	Domain AdaptationImage Retrieval	—Unverified
Hashing on Nonlinear Manifolds	Dec 2, 2014	image-classificationImage Classification	—Unverified
NeuroNAS: Enhancing Efficiency of Neuromorphic In-Memory Computing for Intelligent Mobile Agents through Hardware-Aware Spiking Neural Architecture Search	Jun 30, 2024	Neural Architecture SearchQuantization	—Unverified
HCE: Improving Performance and Efficiency with Heterogeneously Compressed Neural Network Ensemble	Jan 18, 2023	DiversityEnsemble Learning	—Unverified
HCLAE: High Capacity Locally Aggregating Encodings for Approximate Nearest Neighbor Search	Sep 17, 2015	QuantizationVocal Bursts Intensity Prediction	—Unverified
HCM: Hardware-Aware Complexity Metric for Neural Network Architectures	Apr 19, 2020	Quantizationspeech-recognition	—Unverified
HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates	Feb 11, 2025	Image CompressionImage Reconstruction	—Unverified
HDR Imaging With One-Bit Quantization	Sep 7, 2023	Quantization	—Unverified
HeatViT: Hardware-Efficient Adaptive Token Pruning for Vision Transformers	Nov 15, 2022	Quantization	—Unverified
HEMP: High-order Entropy Minimization for neural network comPression	Jul 12, 2021	Neural Network CompressionQuantization	—Unverified
HEPPO: Hardware-Efficient Proximal Policy Optimization -- A Universal Pipelined Architecture for Generalized Advantage Estimation	Jan 22, 2025	CPUGPU	—Unverified
HEQuant: Marrying Homomorphic Encryption and Quantization for Communication-Efficient Private Inference	Jan 29, 2024	Quantization	—Unverified
QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering	Jul 4, 2024	Computational EfficiencyEdge-computing	—Unverified
Heterogeneous quantization regularizes spiking neural network activity	Sep 27, 2024	DenoisingQuantization	—Unverified
Hexcute: A Tile-based Programming Language with Automatic Layout and Task-Mapping Synthesis	Apr 22, 2025	GPUQuantization	—Unverified
HideNseek: Federated Lottery Ticket via Server-side Pruning and Sign Supermask	Jun 9, 2022	Federated LearningModel Compression	—Unverified
Hierarchical Frequency-based Upsampling and Refining for Compressed Video Quality Enhancement	Mar 18, 2024	QuantizationVideo Compression	—Unverified
Hierarchical Modeling of Multidimensional Data in Regularly Decomposed Spaces: Synthesis and Perspective	Jan 13, 2020	DescriptiveImage Segmentation	—Unverified
Hierarchical Federated Learning with Quantization: Convergence Analysis and System Design	Mar 26, 2021	Federated LearningQuantization	—Unverified
High-Accuracy Inference in Neuromorphic Circuits using Hardware-Aware Training	Sep 13, 2018	QuantizationVocal Bursts Intensity Prediction	—Unverified
High-contrast, speckle-free, true 3D holography via binary CGH optimization	Jan 7, 2022	3D HolographyQuantization	—Unverified

Show:10 25 50

← PrevPage 192 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified