Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2076–2100 of 4925 papers

Title	Date	Tasks	Status
Communication and Energy Efficient Federated Learning using Zero-Order Optimization Technique	Sep 24, 2024	Federated LearningQuantization	—Unverified
Extreme Image Compression using Fine-tuned VQGANs	Jul 17, 2023	Image CompressionQuantization	—Unverified
COMET: Towards Partical W4A4KV4 LLMs Serving	Oct 16, 2024	QuantizationScheduling	—Unverified
Extreme Compression for Pre-trained Transformers Made Simple and Efficient	Jun 4, 2022	Knowledge DistillationQuantization	—Unverified
Post Training Quantization of Large Language Models with Microscaling Formats	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Bracket Diffusion: HDR Image Generation by Consistent LDR Denoising	May 23, 2024	DenoisingImage Generation	—Unverified
Exposing Hardware Building Blocks to Machine Learning Frameworks	Apr 10, 2020	BIG-bench Machine LearningQuantization	—Unverified
Combining Compressions for Multiplicative Size Scaling on Natural Language Tasks	Aug 20, 2022	Knowledge DistillationNeural Network Compression	—Unverified
A QP-adaptive Mechanism for CNN-based Filter in Video Coding	Oct 25, 2020	Quantization	—Unverified
AdderNet and its Minimalist Hardware Design for Energy-Efficient Artificial Intelligence	Jan 25, 2021	Quantization	—Unverified
Exploring Semantic Segmentation on the DCT Representation	Jul 23, 2019	QuantizationSegmentation	—Unverified
Collaborative Quantization for Cross-Modal Similarity Search	Feb 2, 2019	Quantization	—Unverified
Collaborative Quantization Embeddings for Intra-Subject Prostate MR Image Registration	Jul 13, 2022	Image RegistrationQuantization	—Unverified
Exploring Neural Networks Quantization via Layer-Wise Quantization Analysis	Dec 15, 2020	Quantization	—Unverified
Exploring Model Invariance with Discrete Search for Ultra-Low-Bit Quantization	Feb 6, 2025	Quantization	—Unverified
Collaborative Multi-Teacher Knowledge Distillation for Learning Low Bit-width Deep Neural Networks	Oct 27, 2022	Knowledge DistillationQuantization	—Unverified
APTQ: Attention-aware Post-Training Mixed-Precision Quantization for Large Language Models	Feb 21, 2024	Quantization	—Unverified
A Data and Compute Efficient Design for Limited-Resources Deep Learning	Apr 21, 2020	Deep LearningQuantization	—Unverified
Exploring FPGA designs for MX and beyond	Jul 1, 2024	Efficient Neural NetworkQuantization	—Unverified
Exploring Extreme Quantization in Spiking Language Models	May 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Collaborative Filtering with Smooth Reconstruction of the Preference Function	Jan 1, 2021	Collaborative FilteringQuantization	—Unverified
Exploring Automatic Gym Workouts Recognition Locally On Wearable Resource-Constrained Devices	Jan 13, 2023	Activity RecognitionQuantization	—Unverified
Collaborative Edge AI Inference over Cloud-RAN	Apr 9, 2024	Quantization	—Unverified
Explore the Potential of CNN Low Bit Training	Jan 1, 2021	Quantization	—Unverified
Explore Cross-Codec Quality-Rate Convex Hulls Relation for Adaptive Streaming	Aug 16, 2024	QuantizationRelation	—Unverified

Show:10 25 50

← PrevPage 84 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified