Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4751–4800 of 4925 papers

Title	Date	Tasks	Status
Cross-Modal Epileptic Signal Harmonization: Frequency Domain Mapping Quantization for Pre-training a Unified Neurophysiological Transformer	Jun 20, 2025	EEGQuantization	CodeCode Available
Uncovering the Hidden Cost of Model Compression	Aug 29, 2023	modelModel Compression	CodeCode Available
Power Law Graph Transformer for Machine Translation and Representation Learning	Jun 27, 2021	Machine TranslationQuantization	CodeCode Available
The Cost of Compression: Investigating the Impact of Compression on Parametric Knowledge in Language Models	Dec 1, 2023	DecoderQuantization	CodeCode Available
Vector and Line Quantization for Billion-scale Similarity Search on GPUs	Jan 2, 2019	CPUGPU	CodeCode Available
HQOD: Harmonious Quantization for Object Detection	Aug 5, 2024	Objectobject-detection	CodeCode Available
The Distributed Discrete Gaussian Mechanism for Federated Learning with Secure Aggregation	Feb 12, 2021	Federated LearningQuantization	CodeCode Available
PP-ShiTu: A Practical Lightweight Image Recognition System	Nov 1, 2021	Face RecognitionKnowledge Distillation	CodeCode Available
The Ecological Footprint of Neural Machine Translation Systems	Feb 4, 2022	GPUMachine Translation	CodeCode Available
Effective Quantization Methods for Recurrent Neural Networks	Nov 30, 2016	Quantization	CodeCode Available
Effective Communication with Dynamic Feature Compression	Jan 29, 2024	Deep Reinforcement LearningFeature Compression	CodeCode Available
Training Thinner and Deeper Neural Networks: Jumpstart Regularization	Jan 30, 2022	Model CompressionQuantization	CodeCode Available
The Effect of Points Dispersion on the k-nn Search in Random Projection Forests	Aug 1, 2022	Quantization	CodeCode Available
PQV-Mobile: A Combined Pruning and Quantization Toolkit to Optimize Vision Transformers for Mobile Applications	Aug 15, 2024	Quantization	CodeCode Available
HyperFlow: Representing 3D Objects as Surfaces	Jun 15, 2020	Autonomous DrivingObject	CodeCode Available
EdgeProfiler: A Fast Profiling Framework for Lightweight LLMs on Edge Using Analytical Model	Jun 6, 2025	Natural Language UnderstandingQuantization	CodeCode Available
The Effect of Points Dispersion on the k-nn Search in Random Projection Forests	Feb 25, 2023	Instance SearchQuantization	CodeCode Available
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant	Sep 17, 2024	HallucinationInstruction Following	CodeCode Available
Sparsified SGD with Memory	Sep 20, 2018	Distributed OptimizationQuantization	CodeCode Available
Resource Constrained Semantic Segmentation for Waste Sorting	Oct 30, 2023	QuantizationSemantic Segmentation	CodeCode Available
Cauchy-Schwarz Regularizers	Mar 3, 2025	Quantization	CodeCode Available
Resource-efficient DNNs for Keyword Spotting using Neural Architecture Search and Quantization	Dec 18, 2020	Keyword SpottingNeural Architecture Search	CodeCode Available
CQIL: Inference Latency Optimization with Concurrent Computation of Quasi-Independent Layers	Apr 10, 2024	Quantization	CodeCode Available
The HalluRAG Dataset: Detecting Closed-Domain Hallucinations in RAG Applications Using an LLM's Internal States	Dec 22, 2024	QuantizationRAG	CodeCode Available
Hybrid coarse-fine classification for head pose estimation	Jan 21, 2019	3D ReconstructionClassification	CodeCode Available
CAT: Compression-Aware Training for bandwidth reduction	Sep 25, 2019	Quantization	CodeCode Available
Resource-Efficient Speech Quality Prediction through Quantization Aware Training and Binary Activation Maps	Jul 5, 2024	Quantization	CodeCode Available
APSQ: Additive Partial Sum Quantization with Algorithm-Hardware Co-Design	Apr 10, 2025	Model CompressionQuantization	CodeCode Available
EdgeCodec: Onboard Lightweight High Fidelity Neural Compressor with Residual Vector Quantization	Jul 8, 2025	Quantization	CodeCode Available
ECQ^x: Explainability-Driven Quantization for Low-Bit and Sparse DNNs	Sep 9, 2021	Explainable Artificial Intelligence (XAI)Quantization	CodeCode Available
The Impact of Inference Acceleration Strategies on Bias of LLMs	Oct 29, 2024	Quantization	CodeCode Available
A Programmable Approach to Neural Network Compression	Nov 6, 2019	Bayesian OptimizationImage Classification	CodeCode Available
ECG Beats Fast Classification Base on Sparse Dictionaries	Sep 8, 2020	ClassificationDictionary Learning	CodeCode Available
A LoRA-Based Approach to Fine-Tuning LLMs for Educational Guidance in Resource-Constrained Settings	Apr 22, 2025	Computational EfficiencyGPU	CodeCode Available
ECG beats classification via online sparse dictionary and time pyramid matching	Aug 15, 2020	ClassificationDictionary Learning	CodeCode Available
Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models	Sep 27, 2023	HumanEvalLanguage Modeling	CodeCode Available
Rethinking Data-Free Quantization as a Zero-Sum Game	Feb 19, 2023	Data Free QuantizationQuantization	CodeCode Available
Transductive Zero-Shot Hashing for Multilabel Image Retrieval	Nov 17, 2019	Image RetrievalMulti-Label Image Retrieval	CodeCode Available
Hybrid Binary Networks: Optimizing for Accuracy, Efficiency and Memory	Apr 11, 2018	BinarizationModel Compression	CodeCode Available
All You Need is a Few Shifts: Designing Efficient Convolutional Neural Networks for Image Classification	Mar 13, 2019	AllGeneral Classification	CodeCode Available
The model of an anomaly detector for HiLumi LHC magnets based on Recurrent Neural Networks and adaptive quantization	Sep 28, 2017	Anomaly DetectionQuantization	CodeCode Available
Approximate spectral clustering using both reference vectors and topology of the network generated by growing neural gas	Sep 15, 2020	ClusteringQuantization	CodeCode Available
Coresets for Archetypal Analysis	Dec 1, 2019	Quantization	CodeCode Available
HOT: Hadamard-based Optimized Training	Mar 27, 2025	Quantization	CodeCode Available
PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters	Apr 7, 2025	CPUGPU	CodeCode Available
Primary quantization matrix estimation of double compressed JPEG images via CNN	Aug 9, 2019	Quantization	CodeCode Available
Homology-constrained vector quantization entropy regularizer	Nov 25, 2022	Quantization	CodeCode Available
PRISM: Privacy-Preserving Improved Stochastic Masking for Federated Generative Models	Mar 11, 2025	Federated LearningPrivacy Preserving	CodeCode Available
Privacy-Aware Randomized Quantization via Linear Programming	Jun 1, 2024	Quantization	CodeCode Available
Highly Optimized Kernels and Fine-Grained Codebooks for LLM Inference on Arm CPUs	Dec 23, 2024	Quantization	CodeCode Available

Show:10 25 50

← PrevPage 96 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified