Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1651–1700 of 4925 papers

Title	Date	Tasks	Status
Experimental results on palmvein-based personal recognition by multi-snapshot fusion of textural features	Jul 13, 2020	Quantization	—Unverified
Co-Designing Binarized Transformer and Hardware Accelerator for Efficient End-to-End Edge Deployment	Jul 16, 2024	QuantizationScheduling	—Unverified
Explicit Loss-Error-Aware Quantization for Low-Bit Deep Neural Networks	Jun 1, 2018	Quantization	—Unverified
Exploiting Change Blindness for Video Coding: Perspectives from a Less Promising User Study	Jul 31, 2024	Computational EfficiencyQuantization	—Unverified
Exploiting Intelligent Reflecting Surfaces in NOMA Networks: Joint Beamforming Optimization	Oct 30, 2019	Quantization	—Unverified
Exploiting Latent Properties to Optimize Neural Codecs	Jan 2, 2025	DecoderQuantization	—Unverified
Optimizing Learned Image Compression on Scalar and Entropy-Constraint Quantization	Jun 10, 2025	Image CompressionQuantization	—Unverified
Exploiting Modern Hardware for High-Dimensional Nearest Neighbor Search	Dec 8, 2017	BIG-bench Machine LearningInformation Retrieval	—Unverified
Exploiting Non-uniform Quantization for Enhanced ILC in Wideband Digital Pre-distortion	Feb 12, 2025	Quantization	—Unverified
Exploiting Offset-guided Network for Pose Estimation and Tracking	Jun 4, 2019	Human DetectionPose Estimation	—Unverified
Cognitive Coding of Speech	Oct 8, 2021	Dimensionality ReductionQuantization	—Unverified
A Probabilistic Reformulation Technique for Discrete RIS Optimization in Wireless Systems	Mar 1, 2023	Quantization	—Unverified
Dynamic Stashing Quantization for Efficient Transformer Training	Mar 9, 2023	Quantization	—Unverified
Exploration of Activation Fault Reliability in Quantized Systolic Array-Based DNN Accelerators	Jan 17, 2024	Quantization	—Unverified
Explore Cross-Codec Quality-Rate Convex Hulls Relation for Adaptive Streaming	Aug 16, 2024	QuantizationRelation	—Unverified
Explore the Potential of CNN Low Bit Training	Jan 1, 2021	Quantization	—Unverified
Exploring Automatic Gym Workouts Recognition Locally On Wearable Resource-Constrained Devices	Jan 13, 2023	Activity RecognitionQuantization	—Unverified
Collaborative Edge AI Inference over Cloud-RAN	Apr 9, 2024	Quantization	—Unverified
Exploring Extreme Quantization in Spiking Language Models	May 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Exploring FPGA designs for MX and beyond	Jul 1, 2024	Efficient Neural NetworkQuantization	—Unverified
Exploring Model Invariance with Discrete Search for Ultra-Low-Bit Quantization	Feb 6, 2025	Quantization	—Unverified
Exploring Neural Networks Quantization via Layer-Wise Quantization Analysis	Dec 15, 2020	Quantization	—Unverified
Dynamic Signal Measurements Based on Quantized Data	Apr 26, 2018	Quantization	—Unverified
Collaborative Quantization Embeddings for Intra-Subject Prostate MR Image Registration	Jul 13, 2022	Image RegistrationQuantization	—Unverified
Dynamic quantized consensus under DoS attacks: Towards a tight zooming-out factor	Jun 1, 2023	Quantization	—Unverified
Dynamic Quantized Consensus of General Linear Multi-agent Systems under Denial-of-Service Attacks	Apr 28, 2020	Quantization	—Unverified
Exploring Semantic Segmentation on the DCT Representation	Jul 23, 2019	QuantizationSegmentation	—Unverified
Blind-Adaptive Quantizers	Sep 6, 2024	Quantization	—Unverified
An Extra RMSNorm is All You Need for Fine Tuning to 1.58 Bits	May 12, 2025	AllKnowledge Distillation	—Unverified
Bracket Diffusion: HDR Image Generation by Consistent LDR Denoising	May 23, 2024	DenoisingImage Generation	—Unverified
Post Training Quantization of Large Language Models with Microscaling Formats	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Extreme Compression for Pre-trained Transformers Made Simple and Efficient	Jun 4, 2022	Knowledge DistillationQuantization	—Unverified
Dynamic Q&A of Clinical Documents with Large Language Models	Jan 19, 2024	ChatbotDecision Making	—Unverified
Extreme Image Compression using Fine-tuned VQGANs	Jul 17, 2023	Image CompressionQuantization	—Unverified
Dynamic Probabilistic Pruning: A general framework for hardware-constrained pruning at different granularities	May 26, 2021	image-classificationImage Classification	—Unverified
Extremely Low Bit Neural Network: Squeeze the Last Bit Out with ADMM	Jul 24, 2017	object-detectionObject Detection	—Unverified
Blending Low and High-Level Semantics of Time Series for Better Masked Time Series Generation	Aug 29, 2024	QuantizationSelf-Supervised Learning	—Unverified
Dynamic Predictive Sampling Analog to Digital Converter for Sparse Signal Sensing	Nov 17, 2022	Data CompressionQuantization	—Unverified
Face recognition using color local binary pattern from mutually independent color channels	Dec 31, 2014	Face DetectionFace Recognition	—Unverified
Factorized Visual Tokenization and Generation	Nov 25, 2024	DisentanglementImage Generation	—Unverified
Blended Coarse Gradient Descent for Full Quantization of Deep Neural Networks	Aug 15, 2018	BinarizationQuantization	—Unverified
FactorizeNet: Progressive Depth Factorization for Efficient Network Architecture Exploration Under Quantization Constraints	Nov 30, 2020	Quantization	—Unverified
Communication-Efficient Decentralized Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control	Aug 4, 2023	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
False Detection (Positives and Negatives) in Object Detection	Aug 16, 2020	Objectobject-detection	—Unverified
ADaPTION: Toolbox and Benchmark for Training Convolutional Neural Networks with Reduced Numerical Precision Weights and Activation	Nov 13, 2017	Quantization	—Unverified
FantastIC4: A Hardware-Software Co-Design Approach for Efficiently Running 4bit-Compact Multilayer Perceptrons	Dec 17, 2020	Quantization	—Unverified
FAQ: Mitigating the Impact of Faults in the Weight Memory of DNN Accelerators through Fault-Aware Quantization	May 21, 2023	Quantization	—Unverified
FAQS: Communication-efficient Federate DNN Architecture and Quantization Co-Search for personalized Hardware-aware Preferences	Oct 16, 2022	Neural Architecture SearchQuantization	—Unverified
Fixed Point Quantization of Deep Convolutional Networks	Nov 19, 2015	Quantization	—Unverified
FlashAttention on a Napkin: A Diagrammatic Approach to Deep Learning IO-Awareness	Dec 4, 2024	GPUQuantization	—Unverified

Show:10 25 50

← PrevPage 34 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified