Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2051–2100 of 4925 papers

Title	Date	Tasks	Status
Fast, Compact, and High Quality LSTM-RNN Based Statistical Parametric Speech Synthesizers for Mobile Devices	Jun 20, 2016	QuantizationSpeech Synthesis	—Unverified
Communication-Efficient Federated Learning via Optimal Client Sampling	Jul 30, 2020	Federated LearningLanguage Modeling	—Unverified
Fast binary embeddings, and quantized compressed sensing with structured matrices	Jan 26, 2018	compressed sensingQuantization	—Unverified
Fast Autoregressive Models for Continuous Latent Generation	Apr 24, 2025	DenoisingImage Generation	—Unverified
Communication Efficient Federated Learning over Multiple Access Channels	Jan 23, 2020	Federated LearningInformativeness	—Unverified
Quantum Block-Matching Algorithm using Dissimilarity Measure	Sep 27, 2023	ClusteringImage Clustering	—Unverified
Communication-Efficient Federated Distillation	Dec 1, 2020	Federated Learningimage-classification	—Unverified
FAQS: Communication-efficient Federate DNN Architecture and Quantization Co-Search for personalized Hardware-aware Preferences	Oct 16, 2022	Neural Architecture SearchQuantization	—Unverified
FAQ: Mitigating the Impact of Faults in the Weight Memory of DNN Accelerators through Fault-Aware Quantization	May 21, 2023	Quantization	—Unverified
FantastIC4: A Hardware-Software Co-Design Approach for Efficiently Running 4bit-Compact Multilayer Perceptrons	Dec 17, 2020	Quantization	—Unverified
FAMES: Fast Approximate Multiplier Substitution for Mixed-Precision Quantized DNNs--Down to 2 Bits!	Nov 27, 2024	Quantization	—Unverified
Communication Efficient Distributed Learning with Censored, Quantized, and Generalized Group ADMM	Sep 14, 2020	Quantization	—Unverified
Reducing Channel Estimation and Feedback Overhead in IRS-Aided Downlink System: A Quantize-then-Estimate Approach	Aug 4, 2023	Quantization	—Unverified
Accelerating RNN-based Speech Enhancement on a Multi-Core MCU with Mixed FP16-INT8 Post-Training Quantization	Oct 14, 2022	QuantizationSpeech Enhancement	—Unverified
3DMolNet: A Generative Network for Molecular Structures	Oct 8, 2020	QuantizationTranslation	—Unverified
False Detection (Positives and Negatives) in Object Detection	Aug 16, 2020	Objectobject-detection	—Unverified
Communication-Efficient Decentralized Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control	Aug 4, 2023	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
FactorizeNet: Progressive Depth Factorization for Efficient Network Architecture Exploration Under Quantization Constraints	Nov 30, 2020	Quantization	—Unverified
A Quantization-based Technique for Privacy Preserving Distributed Learning	Jun 26, 2024	Privacy PreservingQuantization	—Unverified
Factorized Visual Tokenization and Generation	Nov 25, 2024	DisentanglementImage Generation	—Unverified
Face recognition using color local binary pattern from mutually independent color channels	Dec 31, 2014	Face DetectionFace Recognition	—Unverified
Extremely Low Bit Transformer Quantization for On-Device Neural Machine Translation	Sep 16, 2020	Machine TranslationNMT	—Unverified
Communication Compression for Tensor Parallel LLM Inference	Nov 14, 2024	Quantization	—Unverified
A Quantitative Approach To The Temporal Dependency in Video Coding	Aug 26, 2021	Motion CompensationQuantization	—Unverified
Extremely Low Bit Neural Network: Squeeze the Last Bit Out with ADMM	Jul 24, 2017	object-detectionObject Detection	—Unverified
Communication and Energy Efficient Federated Learning using Zero-Order Optimization Technique	Sep 24, 2024	Federated LearningQuantization	—Unverified
Extreme Image Compression using Fine-tuned VQGANs	Jul 17, 2023	Image CompressionQuantization	—Unverified
COMET: Towards Partical W4A4KV4 LLMs Serving	Oct 16, 2024	QuantizationScheduling	—Unverified
Extreme Compression for Pre-trained Transformers Made Simple and Efficient	Jun 4, 2022	Knowledge DistillationQuantization	—Unverified
Post Training Quantization of Large Language Models with Microscaling Formats	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Bracket Diffusion: HDR Image Generation by Consistent LDR Denoising	May 23, 2024	DenoisingImage Generation	—Unverified
Exposing Hardware Building Blocks to Machine Learning Frameworks	Apr 10, 2020	BIG-bench Machine LearningQuantization	—Unverified
Combining Compressions for Multiplicative Size Scaling on Natural Language Tasks	Aug 20, 2022	Knowledge DistillationNeural Network Compression	—Unverified
A QP-adaptive Mechanism for CNN-based Filter in Video Coding	Oct 25, 2020	Quantization	—Unverified
AdderNet and its Minimalist Hardware Design for Energy-Efficient Artificial Intelligence	Jan 25, 2021	Quantization	—Unverified
Exploring Semantic Segmentation on the DCT Representation	Jul 23, 2019	QuantizationSegmentation	—Unverified
Collaborative Quantization for Cross-Modal Similarity Search	Feb 2, 2019	Quantization	—Unverified
Collaborative Quantization Embeddings for Intra-Subject Prostate MR Image Registration	Jul 13, 2022	Image RegistrationQuantization	—Unverified
Exploring Neural Networks Quantization via Layer-Wise Quantization Analysis	Dec 15, 2020	Quantization	—Unverified
Exploring Model Invariance with Discrete Search for Ultra-Low-Bit Quantization	Feb 6, 2025	Quantization	—Unverified
Collaborative Multi-Teacher Knowledge Distillation for Learning Low Bit-width Deep Neural Networks	Oct 27, 2022	Knowledge DistillationQuantization	—Unverified
APTQ: Attention-aware Post-Training Mixed-Precision Quantization for Large Language Models	Feb 21, 2024	Quantization	—Unverified
A Data and Compute Efficient Design for Limited-Resources Deep Learning	Apr 21, 2020	Deep LearningQuantization	—Unverified
Exploring FPGA designs for MX and beyond	Jul 1, 2024	Efficient Neural NetworkQuantization	—Unverified
Exploring Extreme Quantization in Spiking Language Models	May 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Collaborative Filtering with Smooth Reconstruction of the Preference Function	Jan 1, 2021	Collaborative FilteringQuantization	—Unverified
Exploring Automatic Gym Workouts Recognition Locally On Wearable Resource-Constrained Devices	Jan 13, 2023	Activity RecognitionQuantization	—Unverified
Collaborative Edge AI Inference over Cloud-RAN	Apr 9, 2024	Quantization	—Unverified
Explore the Potential of CNN Low Bit Training	Jan 1, 2021	Quantization	—Unverified
Explore Cross-Codec Quality-Rate Convex Hulls Relation for Adaptive Streaming	Aug 16, 2024	QuantizationRelation	—Unverified

Show:10 25 50

← PrevPage 42 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified