Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2501–2550 of 4925 papers

Title	Date	Tasks	Status
Sensitivity-Aware Mixed-Precision Quantization and Width Optimization of Deep Neural Networks Through Cluster-Based Tree-Structured Parzen Estimation	Aug 12, 2023	QuantizationSensitivity	—Unverified
NUPES : Non-Uniform Post-Training Quantization via Power Exponent Search	Aug 10, 2023	Quantization	—Unverified
ReLU and Addition-based Gated RNN	Aug 10, 2023	CPUHandwritten Text Recognition	—Unverified
FPGA Resource-aware Structured Pruning for Real-Time Neural Networks	Aug 9, 2023	Classificationimage-classification	—Unverified
SAfER: Layer-Level Sensitivity Assessment for Efficient and Robust Neural Network Inference	Aug 9, 2023	Autonomous DrivingQuantization	—Unverified
Vector quantization loss analysis in VQGANs: a single-GPU ablation study for image-to-image synthesis	Aug 9, 2023	GPUImage Generation	CodeCode Available
Quantization Aware Factorization for Deep Neural Network Compression	Aug 8, 2023	Neural Network CompressionQuantization	—Unverified
FLIQS: One-Shot Mixed-Precision Floating-Point and Integer Quantization Search	Aug 7, 2023	Quantization	—Unverified
Communication-Efficient Decentralized Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control	Aug 4, 2023	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
RobustMQ: Benchmarking Robustness of Quantized Models	Aug 4, 2023	Adversarial RobustnessBenchmarking	—Unverified
Frequency Disentangled Features in Neural Image Compression	Aug 4, 2023	DisentanglementImage Compression	—Unverified
Reducing Channel Estimation and Feedback Overhead in IRS-Aided Downlink System: A Quantize-then-Estimate Approach	Aug 4, 2023	Quantization	—Unverified
Bees Local Phase Quantization Feature Selection for RGB-D Facial Expressions Recognition	Aug 3, 2023	feature selectionQuantization	CodeCode Available
Improved Knowledge Distillation for Crowd Counting on IoT Device	Aug 2, 2023	Crowd CountingKnowledge Distillation	CodeCode Available
Tango: rethinking quantization for graph neural network training on GPUs	Aug 2, 2023	Graph Neural NetworkQuantization	—Unverified
Error Analysis of CORDIC Processor with FPGA Implementation	Aug 2, 2023	Quantization	—Unverified
Asynchronous Federated Learning with Bidirectional Quantized Communications and Buffered Aggregation	Aug 1, 2023	Federated LearningQuantization	—Unverified
AQUILA: Communication Efficient Federated Learning with Adaptive Quantization in Device Selection Strategy	Aug 1, 2023	Federated LearningPrivacy Preserving	—Unverified
MRQ:Support Multiple Quantization Schemes through Model Re-Quantization	Aug 1, 2023	modelQuantization	—Unverified
Alternate Learning based Sparse Semantic Communications for Visual Transmission	Jul 31, 2023	QuantizationSemantic Communication	—Unverified
An Automata-Theoretic Approach to Synthesizing Binarized Neural Networks	Jul 29, 2023	FairnessQuantization	—Unverified
METTS: Multilingual Emotional Text-to-Speech by Cross-speaker and Cross-lingual Emotion Transfer	Jul 29, 2023	DisentanglementDiversity	—Unverified
Incrementally-Computable Neural Networks: Efficient Inference for Dynamic Inputs	Jul 27, 2023	Document ClassificationKnowledge Distillation	—Unverified
Overcoming Distribution Mismatch in Quantizing Image Super-Resolution Networks	Jul 25, 2023	Image ClassificationImage Super-Resolution	CodeCode Available
High-Resolution Volumetric Reconstruction for Clothed Humans	Jul 25, 2023	Quantization	—Unverified
A Model for Every User and Budget: Label-Free and Personalized Mixed-Precision Quantization	Jul 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Model Compression Methods for YOLOv5: A Review	Jul 21, 2023	Knowledge Distillationmodel	—Unverified
Communication-Efficient Federated Learning over Capacity-Limited Wireless Networks	Jul 20, 2023	Federated LearningQuantization	—Unverified
Quantized Feature Distillation for Network Quantization	Jul 20, 2023	image-classificationImage Classification	—Unverified
Communication-Efficient Split Learning via Adaptive Feature-Wise Compression	Jul 20, 2023	Quantization	—Unverified
ZeroQuant-FP: A Leap Forward in LLMs Post-Training W4A8 Quantization Using Floating-Point Formats	Jul 19, 2023	Computational EfficiencyQuantization	—Unverified
Grounded Object Centric Learning	Jul 18, 2023	ObjectObject Discovery	—Unverified
Extreme Image Compression using Fine-tuned VQGANs	Jul 17, 2023	Image CompressionQuantization	—Unverified
Low bit rate binaural link for improved ultra low-latency low-complexity multichannel speech enhancement in Hearing Aids	Jul 17, 2023	QuantizationSpeech Enhancement	—Unverified
A Survey of Techniques for Optimizing Transformer Inference	Jul 16, 2023	Knowledge DistillationNeural Architecture Search	—Unverified
Self-Distilled Quantization: Achieving High Compression Rates in Transformer-Based Language Models	Jul 12, 2023	QuantizationXLM-R	—Unverified
Learning Kernel-Modulated Neural Representation for Efficient Light Field Compression	Jul 12, 2023	DescriptiveQuantization	—Unverified
Mixed-Precision Quantization for Deep Vision Models with Integer Quadratic Programming	Jul 11, 2023	QuantizationSensitivity	CodeCode Available
Minimax Excess Risk of First-Order Methods for Statistical Learning with Data-Dependent Oracles	Jul 10, 2023	Federated Learningparameter estimation	—Unverified
InfLoR-SNN: Reducing Information Loss for Spiking Neural Networks	Jul 10, 2023	Quantization	—Unverified
Q-YOLOP: Quantization-aware You Only Look Once for Panoptic Driving Perception	Jul 10, 2023	Autonomous DrivingData Augmentation	—Unverified
QBitOpt: Fast and Accurate Bitwidth Reallocation during Training	Jul 10, 2023	Quantization	—Unverified
Towards Efficient In-memory Computing Hardware for Quantized Neural Networks: State-of-the-art, Open Challenges and Perspectives	Jul 8, 2023	Quantization	—Unverified
KP2Dtiny: Quantized Neural Keypoint Detection and Description on the Edge	Jul 7, 2023	Homography EstimationKeypoint Detection	CodeCode Available
ITA: An Energy-Efficient Attention and Softmax Accelerator for Quantized Transformers	Jul 7, 2023	Quantization	—Unverified
Free Bits: Latency Optimization of Mixed-Precision Quantized Neural Networks on the Edge	Jul 6, 2023	NavigateQuantization	—Unverified
Dequantization and Color Transfer with Diffusion Models	Jul 6, 2023	ColorizationImage Colorization	CodeCode Available
Fast Private Kernel Density Estimation via Locality Sensitive Quantization	Jul 4, 2023	Density EstimationQuantization	CodeCode Available
Greedy Selection for Heterogeneous Sensors	Jul 3, 2023	Quantization	—Unverified
Data-Free Quantization via Mixed-Precision Compensation without Fine-Tuning	Jul 2, 2023	Data Free QuantizationModel Compression	—Unverified

Show:10 25 50

← PrevPage 51 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified