Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4751–4800 of 4925 papers

Title	Date	Tasks	Status
Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free	May 2, 2025	Quantization	—Unverified
Group Invariant Deep Representations for Image Instance Retrieval	Jan 9, 2016	Dimensionality Reductionimage-classification	—Unverified
Group Quantization of Quadratic Hamiltonians in Finance	Feb 10, 2021	Quantization	—Unverified
GroupReduce: Block-Wise Low-Rank Approximation for Neural Language Model Shrinking	Jun 18, 2018	Language ModelingLanguage Modelling	—Unverified
Group Sparse Coding	Dec 1, 2009	Computational EfficiencyGeneral Classification	—Unverified
GSVR: 2D Gaussian-based Video Representation for 800+ FPS with Hybrid Deformation Field	Jul 8, 2025	QuantizationVideo Compression	—Unverified
Guaranteed Quantization Error Computation for Neural Network Model Compression	Apr 26, 2023	Model CompressionNeural Network Compression	—Unverified
Gull: A Generative Multifunctional Audio Codec	Apr 7, 2024	Audio CompressionAudio Source Separation	—Unverified
GWQ: Gradient-Aware Weight Quantization for Large Language Models	Oct 30, 2024	Outlier DetectionQuantization	—Unverified
Haar Wavelet Feature Compression for Quantized Graph Convolutional Networks	Oct 10, 2021	Feature CompressionNode Classification	—Unverified
HACK: Homomorphic Acceleration via Compression of the Key-Value Cache for Disaggregated LLM Inference	Feb 5, 2025	Language ModelingLanguage Modelling	—Unverified
Hadamard Domain Training with Integers for Class Incremental Quantized Learning	Oct 5, 2023	Activity Recognitionclass-incremental learning	—Unverified
HadaNets: Flexible Quantization Strategies for Neural Networks	May 26, 2019	Model CompressionQuantization	—Unverified
HadaNorm: Diffusion Transformer Quantization through Mean-Centered Transformations	Jun 11, 2025	Image GenerationQuantization	—Unverified
HALL-E: Hierarchical Neural Codec Language Model for Minute-Long Zero-Shot Text-to-Speech Synthesis	Oct 6, 2024	Language ModelingLanguage Modelling	—Unverified
HALO: Hardware-aware quantization with low critical-path-delay weights for LLM acceleration	Feb 27, 2025	Quantization	—Unverified
LANA: Latency Aware Network Acceleration	Jul 12, 2021	CPUGPU	—Unverified
HAO: Hardware-aware neural Architecture Optimization for Efficient Inference	Apr 26, 2021	Hardware Aware Neural Architecture Searchimage-classification	—Unverified
Hardware Acceleration of Sparse and Irregular Tensor Computations of ML Models: A Survey and Insights	Jul 2, 2020	Medical DiagnosisQuantization	—Unverified
Hardware-Aware DNN Compression via Diverse Pruning and Mixed-Precision Quantization	Dec 23, 2023	QuantizationReinforcement Learning (RL)	—Unverified
Hardware-Centric AutoML for Mixed-Precision Quantization	Aug 11, 2020	AutoMLQuantization	—Unverified
Hardware-friendly Deep Learning by Network Quantization and Binarization	Dec 1, 2021	BinarizationDeep Learning	—Unverified
Hardware-Friendly Static Quantization Method for Video Diffusion Transformers	Feb 20, 2025	QuantizationVideo Generation	—Unverified
Hardware Implementation of Task-based Quantization in Multi-user Signal Recovery	Jan 27, 2023	Quantization	—Unverified
Hardware Limitations and Optimization Approach in 1-Bit RIS Design at 28 GHz	Jun 10, 2025	Quantization	—Unverified
HarmLevelBench: Evaluating Harm-Level Compliance and the Impact of Quantization on Model Alignment	Nov 11, 2024	Quantization	—Unverified
Harnessing Unrecognizable Faces for Improving Face Recognition	Jun 8, 2021	Face RecognitionQuantization	—Unverified
Harnessing Your DRAM and SSD for Sustainable and Accessible LLM Inference with Mixed-Precision and Multi-level Caching	Oct 17, 2024	GPUQuantization	—Unverified
HARP-Net: Hyper-Autoencoded Reconstruction Propagation for Scalable Neural Audio Coding	Jul 22, 2021	DecoderQuantization	—Unverified
Hashing in the Zero Shot Framework with Domain Adaptation	Feb 7, 2017	Domain AdaptationImage Retrieval	—Unverified
Hashing on Nonlinear Manifolds	Dec 2, 2014	image-classificationImage Classification	—Unverified
NeuroNAS: Enhancing Efficiency of Neuromorphic In-Memory Computing for Intelligent Mobile Agents through Hardware-Aware Spiking Neural Architecture Search	Jun 30, 2024	Neural Architecture SearchQuantization	—Unverified
HCE: Improving Performance and Efficiency with Heterogeneously Compressed Neural Network Ensemble	Jan 18, 2023	DiversityEnsemble Learning	—Unverified
HCLAE: High Capacity Locally Aggregating Encodings for Approximate Nearest Neighbor Search	Sep 17, 2015	QuantizationVocal Bursts Intensity Prediction	—Unverified
HCM: Hardware-Aware Complexity Metric for Neural Network Architectures	Apr 19, 2020	Quantizationspeech-recognition	—Unverified
HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates	Feb 11, 2025	Image CompressionImage Reconstruction	—Unverified
HDR Imaging With One-Bit Quantization	Sep 7, 2023	Quantization	—Unverified
HeatViT: Hardware-Efficient Adaptive Token Pruning for Vision Transformers	Nov 15, 2022	Quantization	—Unverified
HEMP: High-order Entropy Minimization for neural network comPression	Jul 12, 2021	Neural Network CompressionQuantization	—Unverified
HEPPO: Hardware-Efficient Proximal Policy Optimization -- A Universal Pipelined Architecture for Generalized Advantage Estimation	Jan 22, 2025	CPUGPU	—Unverified
HEQuant: Marrying Homomorphic Encryption and Quantization for Communication-Efficient Private Inference	Jan 29, 2024	Quantization	—Unverified
QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering	Jul 4, 2024	Computational EfficiencyEdge-computing	—Unverified
Heterogeneous quantization regularizes spiking neural network activity	Sep 27, 2024	DenoisingQuantization	—Unverified
Hexcute: A Tile-based Programming Language with Automatic Layout and Task-Mapping Synthesis	Apr 22, 2025	GPUQuantization	—Unverified
HideNseek: Federated Lottery Ticket via Server-side Pruning and Sign Supermask	Jun 9, 2022	Federated LearningModel Compression	—Unverified
Hierarchical Frequency-based Upsampling and Refining for Compressed Video Quality Enhancement	Mar 18, 2024	QuantizationVideo Compression	—Unverified
Hierarchical Modeling of Multidimensional Data in Regularly Decomposed Spaces: Synthesis and Perspective	Jan 13, 2020	DescriptiveImage Segmentation	—Unverified
Hierarchical Federated Learning with Quantization: Convergence Analysis and System Design	Mar 26, 2021	Federated LearningQuantization	—Unverified
High-Accuracy Inference in Neuromorphic Circuits using Hardware-Aware Training	Sep 13, 2018	QuantizationVocal Bursts Intensity Prediction	—Unverified
High-contrast, speckle-free, true 3D holography via binary CGH optimization	Jan 7, 2022	3D HolographyQuantization	—Unverified

Show:10 25 50

← PrevPage 96 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified