Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1526–1550 of 4925 papers

Title	Date	Tasks	Status	Score
Fast and Slow Gradient Approximation for Binary Neural Network Optimization	Dec 16, 2024	Quantization	CodeCode Available	5
Federated Classification in Hyperbolic Spaces via Secure Aggregation of Convex Hulls	Aug 14, 2023	Federated Learninggraph partitioning	CodeCode Available	5
Quantization for OpenAI's Whisper Models: A Comparative Analysis	Mar 12, 2025	Quantizationspeech-recognition	CodeCode Available	5
Flexible Mixed Precision Quantization for Learned Image Compression	Jun 2, 2025	Image CompressionQuantization	CodeCode Available	5
FairGLVQ: Fairness in Partition-Based Classification	Oct 16, 2024	ClassificationFairness	CodeCode Available	5
Extracting Usable Predictions from Quantized Networks through Uncertainty Quantification for OOD Detection	Mar 2, 2024	QuantizationUncertainty Quantification	CodeCode Available	5
FALCON: Feature-Label Constrained Graph Net Collapse for Memory Efficient GNNs	Dec 27, 2023	BenchmarkingGPU	CodeCode Available	5
Exploring Post-Training Quantization of Protein Language Models	Oct 30, 2023	Protein Structure PredictionQuantization	CodeCode Available	5
Audio Spectral Enhancement: Leveraging Autoencoders for Low Latency Reconstruction of Long, Lossy Audio Sequences	Aug 8, 2021	Audio CompressionQuantization	CodeCode Available	5
Exploring Quantization and Mapping Synergy in Hardware-Aware Deep Neural Network Accelerators	Apr 8, 2024	QuantizationScheduling	CodeCode Available	5
Exploring Embedding Methods in Binary Hyperdimensional Computing: A Case Study for Motor-Imagery based Brain-Computer Interfaces	Dec 13, 2018	Brain Computer InterfaceEEG	CodeCode Available	5
Fast Adjustable Threshold For Uniform Neural Network Quantization (Winning solution of LPIRC-II)	Dec 19, 2018	Quantization	CodeCode Available	5
Explaining Reject Options of Learning Vector Quantization Classifiers	Feb 15, 2022	counterfactualQuantization	CodeCode Available	5
Expansion Quantization Network: An Efficient Micro-emotion Annotation and Detection Framework	Nov 9, 2024	Emotion Detection and ClassificationQuantization	CodeCode Available	5
ExpandNet: A Deep Convolutional Neural Network for High Dynamic Range Expansion from Low Dynamic Range Content	Mar 6, 2018	inverse tone mappingInverse-Tone-Mapping	CodeCode Available	5
Exploiting the Partly Scratch-off Lottery Ticket for Quantization-Aware Training	Nov 12, 2022	Quantization	CodeCode Available	5
DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMs	Oct 16, 2024	Quantization	CodeCode Available	5
Exact Backpropagation in Binary Weighted Networks with Group Weight Transformations	Jul 3, 2021	BinarizationClassification with Binary Weight Network	CodeCode Available	5
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available	5
Adaptive Prediction-Powered AutoEval with Reliability and Efficiency Guarantees	May 24, 2025	Quantization	CodeCode Available	5
Exploiting vulnerabilities of deep neural networks for privacy protection	Jul 19, 2020	Adversarial AttackQuantization	CodeCode Available	5
Fast Adversarial Robustness Certification of Nearest Prototype Classifiers for Arbitrary Seminorms	Dec 1, 2020	Adversarial RobustnessQuantization	CodeCode Available	5
Evaluating Quantized Large Language Models for Code Generation on Low-Resource Language Benchmarks	Oct 18, 2024	Code GenerationGPU	CodeCode Available	5
ACIQ: Analytical Clipping for Integer Quantization of neural networks	May 1, 2019	Quantization	CodeCode Available	5
Evaluating Single Event Upsets in Deep Neural Networks for Semantic Segmentation: an embedded system perspective	Dec 4, 2024	Autonomous DrivingQuantization	CodeCode Available	5

Show:10 25 50

← PrevPage 62 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified