Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2200 of 4925 papers

Title	Date	Tasks	Status	Hype
Magnificent Minified Models	Jun 16, 2023	Quantization	—Unverified	0
ZeRO++: Extremely Efficient Collective Communication for Giant Model Training	Jun 16, 2023	GPUQuantization	—Unverified	0
HiNeRV: Video Compression with Hierarchical Encoding-based Neural Representation	Jun 16, 2023	Model CompressionQuantization	CodeCode Available	1
Evaluation and Optimization of Gradient Compression for Distributed Deep Learning	Jun 15, 2023	Deep LearningGPU	CodeCode Available	1
Neural Network Compression using Binarization and Few Full-Precision Weights	Jun 15, 2023	BinarizationCPU	—Unverified	0
PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with Dual-Discriminators	Jun 15, 2023	Image EnhancementQuantization	CodeCode Available	0
High-performance deep spiking neural networks with 0.3 spikes per neuron	Jun 14, 2023	image-classificationImage Classification	—Unverified	0
GQFedWAvg: Optimization-Based Quantized Federated Learning in General Edge Computing Systems	Jun 13, 2023	Edge-computingFederated Learning	CodeCode Available	0
INT2.1: Towards Fine-Tunable Quantized Large Language Models with Error Correction through Low-Rank Adaptation	Jun 13, 2023	Language ModelingLanguage Modelling	CodeCode Available	4
SqueezeLLM: Dense-and-Sparse Quantization	Jun 13, 2023	GPUQuantization	CodeCode Available	6
Discrete Graph Auto-Encoder	Jun 13, 2023	Graph GenerationQuantization	—Unverified	0
MFSN: Multi-perspective Fusion Search Network For Pre-training Knowledge in Speech Emotion Recognition	Jun 12, 2023	Emotion RecognitionQuantization	—Unverified	0
NF4 Isn't Information Theoretically Optimal (and that's Good)	Jun 12, 2023	Quantization	CodeCode Available	1
Resource Efficient Neural Networks Using Hessian Based Pruning	Jun 12, 2023	GPUimage-classification	—Unverified	0
Efficient and Robust Quantization-aware Training via Adaptive Coreset Selection	Jun 12, 2023	Model CompressionQuantization	CodeCode Available	1
Sparse-Inductive Generative Adversarial Hashing for Nearest Neighbor Search	Jun 12, 2023	compressed sensingQuantization	—Unverified	0
High-Fidelity Audio Compression with Improved RVQGAN	Jun 11, 2023	Audio CompressionAudio Generation	CodeCode Available	3
End-to-End Neural Network Compression via _1_2 Regularized Latency Surrogates	Jun 9, 2023	Neural Architecture SearchNeural Network Compression	—Unverified	0
Mixed-TD: Efficient Neural Network Accelerator with Layer-Specific Tensor Decomposition	Jun 8, 2023	Efficient Neural NetworkQuantization	CodeCode Available	0
Precision-aware Latency and Energy Balancing on Multi-Accelerator Platforms for DNN Inference	Jun 8, 2023	Quantization	—Unverified	0
Iterative Signal Processing for Integrated Sensing and Communication Systems	Jun 8, 2023	Integrated sensing and communicationISAC	—Unverified	0
Augmenting Hessians with Inter-Layer Dependencies for Mixed-Precision Post-Training Quantization	Jun 8, 2023	Quantization	—Unverified	0
MobileNMT: Enabling Translation in 15MB and 30ms	Jun 7, 2023	Model CompressionNMT	CodeCode Available	1
SpQR: A Sparse-Quantized Representation for Near-Lossless LLM Weight Compression	Jun 5, 2023	GPULanguage Modelling	CodeCode Available	2
Sensitivity-Aware Finetuning for Accuracy Recovery on Deep Learning Hardware	Jun 5, 2023	Deep LearningQuantization	—Unverified	0
OWQ: Outlier-Aware Weight Quantization for Efficient Fine-Tuning and Inference of Large Language Models	Jun 4, 2023	parameter-efficient fine-tuningQuantization	CodeCode Available	1
Temporal Dynamic Quantization for Diffusion Models	Jun 4, 2023	Quantization	—Unverified	0
Modular Transformers: Compressing Transformers into Modularized Layers for Flexible Efficient Inference	Jun 4, 2023	DecoderKnowledge Distillation	—Unverified	0
An Information-Theoretic Analysis of Self-supervised Discrete Representations of Speech	Jun 4, 2023	QuantizationRepresentation Learning	CodeCode Available	0
Binary and Ternary Natural Language Generation	Jun 2, 2023	Machine TranslationQuantization	CodeCode Available	1
Group channel pruning and spatial attention distilling for object detection	Jun 2, 2023	Knowledge DistillationModel Compression	—Unverified	0
Adaptive Message Quantization and Parallelization for Distributed Full-graph GNN Training	Jun 2, 2023	Quantization	CodeCode Available	1
Quantization-Aware and Tensor-Compressed Training of Transformers for Natural Language Understanding	Jun 1, 2023	Natural Language UnderstandingQuantization	—Unverified	0
Towards Learning Discrete Representations via Self-Supervision for Wearables-Based Human Activity Recognition	Jun 1, 2023	Activity RecognitionHuman Activity Recognition	—Unverified	0
FlexRound: Learnable Rounding based on Element-wise Division for Post-Training Quantization	Jun 1, 2023	image-classificationImage Classification	CodeCode Available	0
On the Effectiveness of Hybrid Mutual Information Estimation	Jun 1, 2023	Mutual Information EstimationQuantization	—Unverified	0
Dynamic quantized consensus under DoS attacks: Towards a tight zooming-out factor	Jun 1, 2023	Quantization	—Unverified	0
AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration	Jun 1, 2023	Autonomous DrivingCloud Computing	CodeCode Available	6
Asymptotic Performance Analysis of Large-Scale Active IRS-Aided Wireless Network	May 31, 2023	Quantization	—Unverified	0
Fast-SNN: Fast Spiking Neural Network by Converting Quantized ANN	May 31, 2023	image-classificationImage Classification	CodeCode Available	1
MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training	May 31, 2023	Language ModellingQuantization	CodeCode Available	2
Compression with Bayesian Implicit Neural Representations	May 30, 2023	Audio CompressionQuantization	CodeCode Available	1
AdANNS: A Framework for Adaptive Semantic Search	May 30, 2023	Natural QuestionsQuantization	CodeCode Available	1
PreQuant: A Task-agnostic Quantization Approach for Pre-trained Language Models	May 30, 2023	parameter-efficient fine-tuningQuantization	—Unverified	0
Low Precision Quantization-aware Training in Spiking Neural Networks with Differentiable Quantization Function	May 30, 2023	Edge-computingQuantization	—Unverified	0
Implementation of a framework for deploying AI inference engines in FPGAs	May 30, 2023	QuantizationResynthesis	—Unverified	0
Intriguing Properties of Quantization at Scale	May 30, 2023	Quantization	—Unverified	0
Towards Accurate Post-training Quantization for Diffusion Models	May 30, 2023	Data Free QuantizationImage Generation	CodeCode Available	1
Stochastic Gradient Langevin Dynamics Based on Quantization with Increasing Resolution	May 30, 2023	Quantization	—Unverified	0
Global-QSGD: Practical Floatless Quantization for Distributed Learning with Theoretical Guarantees	May 29, 2023	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 44 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified