Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1876–1900 of 4925 papers

Title	Date	Tasks	Status
OSPC: Artificial VLM Features for Hateful Meme Detection	Jul 3, 2024	Computational EfficiencyFeature Engineering	—Unverified
How Does Quantization Affect Multilingual LLMs?	Jul 3, 2024	Mathematical ReasoningQuantization	—Unverified
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks	Jul 1, 2024	Quantization	CodeCode Available
Exploring FPGA designs for MX and beyond	Jul 1, 2024	Efficient Neural NetworkQuantization	—Unverified
Beyond Throughput and Compression Ratios: Towards High End-to-end Utility of Gradient Compression	Jul 1, 2024	Quantization	—Unverified
PQCache: Product Quantization-based KVCache for Long Context LLM Inference	Jul 1, 2024	GPUQuantization	—Unverified
Linear and Nonlinear MMSE Estimation in One-Bit Quantized Systems under a Gaussian Mixture Prior	Jul 1, 2024	Quantization	—Unverified
NeuroNAS: Enhancing Efficiency of Neuromorphic In-Memory Computing for Intelligent Mobile Agents through Hardware-Aware Spiking Neural Architecture Search	Jun 30, 2024	Neural Architecture SearchQuantization	—Unverified
Toward a Diffusion-Based Generalist for Dense Vision Tasks	Jun 29, 2024	Conditional Image GenerationImage Generation	—Unverified
Rateless Stochastic Coding for Delay-Constrained Semantic Communication	Jun 28, 2024	DecoderPerceptual Distance	—Unverified
Deep Fusion Model for Brain Tumor Classification Using Fine-Grained Gradient Preservation	Jun 28, 2024	Brain Tumor ClassificationClassification	—Unverified
Reliable edge machine learning hardware for scientific applications	Jun 27, 2024	Quantizationscientific discovery	—Unverified
Fronthaul Quantization-Aware MU-MIMO Precoding for Sum Rate Maximization	Jun 27, 2024	Quantization	—Unverified
Efficient course recommendations with T5-based ranking and summarization	Jun 27, 2024	In-Context LearningQuantization	CodeCode Available
MCNC: Manifold Constrained Network Compression	Jun 27, 2024	Model CompressionQuantization	—Unverified
OutlierTune: Efficient Channel-Wise Quantization for Large Language Models	Jun 27, 2024	Quantization	—Unverified
FedAQ: Communication-Efficient Federated Edge Learning via Joint Uplink and Downlink Adaptive Quantization	Jun 26, 2024	Federated LearningQuantization	—Unverified
A Quantization-based Technique for Privacy Preserving Distributed Learning	Jun 26, 2024	Privacy PreservingQuantization	—Unverified
Differential error feedback for communication-efficient decentralized learning	Jun 26, 2024	Quantization	—Unverified
CDQuant: Greedy Coordinate Descent for Accurate LLM Quantization	Jun 25, 2024	Quantization	—Unverified
Layer-Wise Quantization: A Pragmatic and Effective Method for Quantizing LLMs Beyond Integer Bit-Levels	Jun 25, 2024	Language ModellingLarge Language Model	CodeCode Available
Reducing the Memory Footprint of 3D Gaussian Splatting	Jun 24, 2024	Novel View SynthesisQuantization	—Unverified
Compensate Quantization Errors: Make Weights Hierarchical to Compensate Each Other	Jun 24, 2024	Quantization	—Unverified
Approximate DCT and Quantization Techniques for Energy-Constrained Image Sensors	Jun 24, 2024	Quantization	—Unverified
BitNet b1.58 Reloaded: State-of-the-art Performance Also on Smaller Networks	Jun 24, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 76 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified