Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4276–4300 of 4925 papers

Title	Date	Tasks	Status
Accelerating PoT Quantization on Edge Devices	Sep 30, 2024	CPUQuantization	CodeCode Available
Federated Classification in Hyperbolic Spaces via Secure Aggregation of Convex Hulls	Aug 14, 2023	Federated Learninggraph partitioning	CodeCode Available
QSGD: Communication-Efficient SGD via Gradient Quantization and Encoding	Oct 7, 2016	image-classificationImage Classification	CodeCode Available
StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction	Jul 24, 2018	Depth EstimationDepth Prediction	CodeCode Available
MorpheusNet: Resource efficient sleep stage classifier for embedded on-line systems	Jan 14, 2024	Quantization	CodeCode Available
TinySubNets: An efficient and low capacity continual learning strategy	Dec 14, 2024	Continual LearningQuantization	CodeCode Available
Additive Powers-of-Two Quantization: An Efficient Non-uniform Discretization for Neural Networks	Sep 28, 2019	Computational EfficiencyQuantization	CodeCode Available
MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion	Oct 10, 2024	Denoisingparameter-efficient fine-tuning	CodeCode Available
AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantization	Sep 25, 2024	Quantization	CodeCode Available
Mirror Descent View for Neural Network Quantization	Oct 18, 2019	Quantizationvalid	CodeCode Available
MINT: Multiplier-less INTeger Quantization for Energy Efficient Spiking Neural Networks	May 16, 2023	Quantization	CodeCode Available
Minimize Quantization Output Error with Bias Compensation	Apr 2, 2024	Quantization	CodeCode Available
Qsparse-local-SGD: Distributed SGD with Quantization, Sparsification and Local Computations	Dec 1, 2019	Distributed OptimizationQuantization	CodeCode Available
Minimal Random Code Learning: Getting Bits Back from Compressed Model Parameters	Sep 30, 2018	Neural Network CompressionQuantization	CodeCode Available
TreeLUT: An Efficient Alternative to Deep Neural Networks for Inference Acceleration Using Gradient Boosted Decision Trees	Jan 2, 2025	Quantization	CodeCode Available
MetaAug: Meta-Data Augmentation for Post-Training Quantization	Jul 20, 2024	Data AugmentationMeta-Learning	CodeCode Available
BinaryRelax: A Relaxation Approach For Training Deep Neural Networks With Quantized Weights	Jan 19, 2018	Quantization	CodeCode Available
Stochastic Monkeys at Play: Random Augmentations Cheaply Break LLM Safety Alignment	Nov 5, 2024	QuantizationSafety Alignment	CodeCode Available
Feature Distillation: DNN-Oriented JPEG Compression Against Adversarial Examples	Mar 14, 2018	ClassificationGeneral Classification	CodeCode Available
FDDH: Fast Discriminative Discrete Hashing for Large-Scale Cross-Modal Retrieval	May 15, 2021	Cross-Modal RetrievalQuantization	CodeCode Available
AMED: Automatic Mixed-Precision Quantization for Edge Devices	May 30, 2022	Quantization	CodeCode Available
Discrete representations in neural models of spoken language	May 12, 2021	AttributeQuantization	CodeCode Available
QTTNet: Quantized Tensor Train Neural Networks for 3D Object and Video Recognition.	Sep 20, 2021	QuantizationVideo Recognition	CodeCode Available
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization	Mar 25, 2024	Quantization	CodeCode Available
Discrete Factorization Machines for Fast Feature-based Recommendation	May 6, 2018	BinarizationQuantization	CodeCode Available

Show:10 25 50

← PrevPage 172 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified