Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1925 of 4925 papers

Title	Date	Tasks	Status
BitNet b1.58 Reloaded: State-of-the-art Performance Also on Smaller Networks	Jun 24, 2024	Quantization	—Unverified
Towards Real-Time Neural Volumetric Rendering on Mobile Devices: A Measurement Study	Jun 23, 2024	NeRFQuantization	—Unverified
Received Power Maximization Using Nonuniform Discrete Phase Shifts for RISs With a Limited Phase Range	Jun 23, 2024	2kQuantization	—Unverified
HLQ: Fast and Efficient Backpropagation via Hadamard Low-rank Quantization	Jun 21, 2024	Quantization	—Unverified
FLoCoRA: Federated learning compression with low-rank adaptation	Jun 20, 2024	Federated LearningModel Compression	CodeCode Available
Predicting Probabilities of Error to Combine Quantization and Early Exiting: QuEE	Jun 20, 2024	Quantization	—Unverified
xCOMET-lite: Bridging the Gap Between Efficiency and Quality in Learned MT Evaluation Metrics	Jun 20, 2024	Machine TranslationQuantization	CodeCode Available
Q-SNNs: Quantized Spiking Neural Networks	Jun 19, 2024	Quantization	—Unverified
High-Fidelity Facial Albedo Estimation via Texture Quantization	Jun 19, 2024	3D Face ReconstructionFace Reconstruction	—Unverified
SDQ: Sparse Decomposed Quantization for LLM Inference	Jun 19, 2024	Model CompressionQuantization	—Unverified
Attention-aware Post-training Quantization without Backpropagation	Jun 19, 2024	Quantization	—Unverified
MSE Minimization in RIS-Aided MU-MIMO with Discrete Phase Shifts and Fronthaul Quantization	Jun 18, 2024	Quantization	—Unverified
Bayesian-LoRA: LoRA based Parameter Efficient Fine-Tuning using Optimal Quantization levels and Rank Values trough Differentiable Bayesian Gates	Jun 18, 2024	parameter-efficient fine-tuningQuantization	—Unverified
Prefixing Attention Sinks can Mitigate Activation Outliers for Large Language Model Quantization	Jun 17, 2024	Language ModelingLanguage Modelling	—Unverified
Deep-Learning-Based Channel Estimation for Distributed MIMO with 1-bit Radio-Over-Fiber Fronthaul	Jun 17, 2024	Quantization	—Unverified
Promoting Data and Model Privacy in Federated Learning through Quantized LoRA	Jun 16, 2024	Federated Learningparameter-efficient fine-tuning	—Unverified
Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization	Jun 16, 2024	QuantizationTensor Decomposition	—Unverified
An Analysis on Quantizing Diffusion Transformers	Jun 16, 2024	Conditional Image GenerationDenoising	—Unverified
Optimization of Armv9 architecture general large language model inference performance based on Llama.cpp	Jun 16, 2024	Compiler OptimizationLanguage Modeling	CodeCode Available
How Should We Extract Discrete Audio Tokens from Self-Supervised Models?	Jun 15, 2024	QuantizationSelf-Supervised Learning	—Unverified
Memory Faults in Activation-sparse Quantized Deep Neural Networks: Analysis and Mitigation using Sharpness-aware Training	Jun 15, 2024	Quantization	—Unverified
GEB-1.3B: Open Lightweight Large Language Model	Jun 14, 2024	CPULanguage Modeling	—Unverified
Precipitation Nowcasting Using Physics Informed Discriminator Generative Models	Jun 14, 2024	Generative Adversarial NetworkQuantization	—Unverified
Optimizing Byte-level Representation for End-to-end ASR	Jun 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
One-pass Multiple Conformer and Foundation Speech Systems Compression and Quantization Using An All-in-one Neural Model	Jun 14, 2024	AllQuantization	—Unverified

Show:10 25 50

← PrevPage 77 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified