Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4751–4775 of 4925 papers

Title	Date	Tasks	Status
Cross-Modal Epileptic Signal Harmonization: Frequency Domain Mapping Quantization for Pre-training a Unified Neurophysiological Transformer	Jun 20, 2025	EEGQuantization	CodeCode Available
Uncovering the Hidden Cost of Model Compression	Aug 29, 2023	modelModel Compression	CodeCode Available
Power Law Graph Transformer for Machine Translation and Representation Learning	Jun 27, 2021	Machine TranslationQuantization	CodeCode Available
The Cost of Compression: Investigating the Impact of Compression on Parametric Knowledge in Language Models	Dec 1, 2023	DecoderQuantization	CodeCode Available
Vector and Line Quantization for Billion-scale Similarity Search on GPUs	Jan 2, 2019	CPUGPU	CodeCode Available
HQOD: Harmonious Quantization for Object Detection	Aug 5, 2024	Objectobject-detection	CodeCode Available
The Distributed Discrete Gaussian Mechanism for Federated Learning with Secure Aggregation	Feb 12, 2021	Federated LearningQuantization	CodeCode Available
PP-ShiTu: A Practical Lightweight Image Recognition System	Nov 1, 2021	Face RecognitionKnowledge Distillation	CodeCode Available
The Ecological Footprint of Neural Machine Translation Systems	Feb 4, 2022	GPUMachine Translation	CodeCode Available
Effective Quantization Methods for Recurrent Neural Networks	Nov 30, 2016	Quantization	CodeCode Available
Effective Communication with Dynamic Feature Compression	Jan 29, 2024	Deep Reinforcement LearningFeature Compression	CodeCode Available
Training Thinner and Deeper Neural Networks: Jumpstart Regularization	Jan 30, 2022	Model CompressionQuantization	CodeCode Available
The Effect of Points Dispersion on the k-nn Search in Random Projection Forests	Aug 1, 2022	Quantization	CodeCode Available
PQV-Mobile: A Combined Pruning and Quantization Toolkit to Optimize Vision Transformers for Mobile Applications	Aug 15, 2024	Quantization	CodeCode Available
HyperFlow: Representing 3D Objects as Surfaces	Jun 15, 2020	Autonomous DrivingObject	CodeCode Available
EdgeProfiler: A Fast Profiling Framework for Lightweight LLMs on Edge Using Analytical Model	Jun 6, 2025	Natural Language UnderstandingQuantization	CodeCode Available
The Effect of Points Dispersion on the k-nn Search in Random Projection Forests	Feb 25, 2023	Instance SearchQuantization	CodeCode Available
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant	Sep 17, 2024	HallucinationInstruction Following	CodeCode Available
Sparsified SGD with Memory	Sep 20, 2018	Distributed OptimizationQuantization	CodeCode Available
Resource Constrained Semantic Segmentation for Waste Sorting	Oct 30, 2023	QuantizationSemantic Segmentation	CodeCode Available
Cauchy-Schwarz Regularizers	Mar 3, 2025	Quantization	CodeCode Available
Resource-efficient DNNs for Keyword Spotting using Neural Architecture Search and Quantization	Dec 18, 2020	Keyword SpottingNeural Architecture Search	CodeCode Available
CQIL: Inference Latency Optimization with Concurrent Computation of Quasi-Independent Layers	Apr 10, 2024	Quantization	CodeCode Available
The HalluRAG Dataset: Detecting Closed-Domain Hallucinations in RAG Applications Using an LLM's Internal States	Dec 22, 2024	QuantizationRAG	CodeCode Available
Hybrid coarse-fine classification for head pose estimation	Jan 21, 2019	3D ReconstructionClassification	CodeCode Available

Show:10 25 50

← PrevPage 191 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified