Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1875 of 4925 papers

Title	Date	Tasks	Status	Hype
Deep Hashing via Householder Quantization	Nov 7, 2023	BinarizationDeep Hashing	CodeCode Available	0
Generative Diffusion Models for Lattice Field Theory	Nov 6, 2023	Quantization	—Unverified	0
Learned layered coding for Successive Refinement in the Wyner-Ziv Problem	Nov 6, 2023	Quantization	—Unverified	0
Attention or Convolution: Transformer Encoders in Audio Language Models for Inference Efficiency	Nov 5, 2023	Quantization	—Unverified	0
AFPQ: Asymmetric Floating Point Quantization for LLMs	Nov 3, 2023	Quantization	CodeCode Available	1
Effective Quantization for Diffusion Models on CPUs	Nov 2, 2023	Quantization	—Unverified	0
Divergent Token Metrics: Measuring degradation to prune away LLM components -- and optimize quantization	Nov 2, 2023	ManagementModel Compression	—Unverified	0
AWEQ: Post-Training Quantization with Activation-Weight Equalization for Large Language Models	Nov 2, 2023	Quantization	—Unverified	0
The bottleneck and ceiling effects in quantized tracking control of heterogeneous multi-agent systems under DoS attacks	Nov 1, 2023	Quantization	—Unverified	0
Crop Disease Classification using Support Vector Machines with Green Chromatic Coordinate (GCC) and Attention based feature extraction for IoT based Smart Agricultural Applications	Nov 1, 2023	NutritionQuantization	—Unverified	0
Efficient LLM Inference on CPUs	Nov 1, 2023	Quantization	CodeCode Available	2
Q-Learning for Stochastic Control under General Information Structures and Non-Markovian Environments	Oct 31, 2023	Q-LearningQuantization	—Unverified	0
Exploring Post-Training Quantization of Protein Language Models	Oct 30, 2023	Protein Structure PredictionQuantization	CodeCode Available	0
A Principled Hierarchical Deep Learning Approach to Joint Image Compression and Classification	Oct 30, 2023	Decoderimage-classification	—Unverified	0
Resource Constrained Semantic Segmentation for Waste Sorting	Oct 30, 2023	QuantizationSemantic Segmentation	CodeCode Available	0
Conditional Denoising Diffusion Probabilistic Models for Data Reconstruction Enhancement in Wireless Communications	Oct 30, 2023	DenoisingQuantization	—Unverified	0
QWID: Quantized Weed Identification Deep neural network	Oct 29, 2023	QuantizationTransfer Learning	CodeCode Available	0
Atom: Low-bit Quantization for Efficient and Accurate LLM Serving	Oct 29, 2023	GPUQuantization	CodeCode Available	2
High-probability Convergence Bounds for Nonlinear Stochastic Gradient Descent Under Heavy-tailed Noise	Oct 28, 2023	Quantization	—Unverified	0
Embedding in Recommender Systems: A Survey	Oct 28, 2023	AutoMLCollaborative Filtering	CodeCode Available	1
Med-DANet V2: A Flexible Dynamic Architecture for Efficient Medical Volumetric Segmentation	Oct 28, 2023	Computational EfficiencyMRI segmentation	—Unverified	0
NIF: A Fast Implicit Image Compression with Bottleneck Layers and Modulated Sinusoidal Activations	Oct 27, 2023	Image CompressionQuantization	CodeCode Available	0
Edge AI-Based Vein Detector for Efficient Venipuncture in the Antecubital Fossa	Oct 27, 2023	Quantization	CodeCode Available	1
Distributed Delay-Tolerant Strategies for Equality-Constraint Sum-Preserving Resource Allocation	Oct 27, 2023	AllCPU	—Unverified	0
ZeroQuant-HERO: Hardware-Enhanced Robust Optimized Post-Training Quantization Framework for W8A8 Transformers	Oct 26, 2023	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 75 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified