Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1600 of 4925 papers

Title	Date	Tasks	Status
End-to-End Optimized Speech Coding with Deep Neural Networks	Oct 25, 2017	CPUFeature Engineering	—Unverified
End-to-end Quantized Training via Log-Barrier Extensions	Jan 1, 2021	Quantization	—Unverified
End-to-End Rate-Distortion Optimization for Bi-Directional Learned Video Compression	Aug 11, 2020	Motion EstimationQuantization	—Unverified
FastQuery: Communication-efficient Embedding Table Query for Private LLM Inference	May 25, 2024	Quantization	—Unverified
EdgeBERT: Sentence-Level Energy Optimizations for Latency-Aware Multi-Task NLP Inference	Nov 28, 2020	Edge-computingGPU	—Unverified
Edge AI: Evaluation of Model Compression Techniques for Convolutional Neural Networks	Sep 2, 2024	Edge-computingimage-classification	—Unverified
Energy-Aware LLMs: A step towards sustainable AI for downstream applications	Mar 22, 2025	Quantization	—Unverified
Energy awareness in low precision neural networks	Feb 6, 2022	Quantization	—Unverified
Energy Efficiency Maximization Precoding for Quantized Massive MIMO Systems	Aug 6, 2021	Quantization	—Unverified
Energy Efficiency Optimization for Millimeter Wave System with Resolution-Adaptive ADCs	May 18, 2020	Quantization	—Unverified
Energy-Efficient Distributed Learning Algorithms for Coarsely Quantized Signals	Jan 13, 2021	parameter estimationQuantization	—Unverified
Energy-efficient Knowledge Distillation for Spiking Neural Networks	Jun 14, 2021	Knowledge DistillationModel Compression	—Unverified
Energy Efficient Learning with Low Resolution Stochastic Domain Wall Synapse Based Deep Neural Networks	Nov 14, 2021	Quantization	—Unverified
Energy-Efficient Respiratory Anomaly Detection in Premature Newborn Infants	Feb 21, 2022	Anomaly DetectionModel Selection	—Unverified
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification	Feb 23, 2025	ClassificationInference Optimization	—Unverified
Engineering the Neural Automatic Passenger Counter	Mar 2, 2022	Quantization	—Unverified
BMPQ: Bit-Gradient Sensitivity Driven Mixed-Precision Quantization of DNNs from Scratch	Dec 24, 2021	QuantizationSensitivity	—Unverified
Edge AI-Enabled Chicken Health Detection Based on Enhanced FCOS-Lite and Knowledge Distillation	Jul 3, 2024	Knowledge DistillationQuantization	—Unverified
An Implementation of Vector Quantization using the Genetic Algorithm Approach	Feb 16, 2021	ArticlesBIG-bench Machine Learning	—Unverified
EDAS: Efficient and Differentiable Architecture Search	Dec 3, 2019	GPUNeural Architecture Search	—Unverified
Adaptive Asymmetric Label-guided Hashing for Multimedia Search	Jul 26, 2022	Cross-Modal RetrievalQuantization	—Unverified
Enhancement Of Coded Speech Using a Mask-Based Post-Filter	Oct 12, 2020	DecoderQuantization	—Unverified
ECG Biometric Authentication Using Self-Supervised Learning for IoT Edge Sensors	Sep 9, 2024	Contrastive LearningCPU	—Unverified
BlueLM-V-3B: Algorithm and System Co-Design for Multimodal Large Language Models on Mobile Devices	Nov 16, 2024	Quantization	—Unverified
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified
Enhancing Computation Efficiency in Large Language Models through Weight and Activation Quantization	Nov 9, 2023	Computational EfficiencyQuantization	—Unverified
Fast Orthogonal Projection Based on Kronecker Product	Dec 1, 2015	Image RetrievalQuantization	—Unverified
Enhancing Diversity for Data-free Quantization	Jan 1, 2025	Data Free QuantizationDiversity	—Unverified
Enhancing Field-Oriented Control of Electric Drives with Tiny Neural Network Optimized for Micro-controllers	Feb 1, 2025	Quantization	—Unverified
Enhancing Generalization of Invisible Facial Privacy Cloak via Gradient Accumulation	Jan 3, 2024	Face RecognitionQuantization	—Unverified
FastSGD: A Fast Compressed SGD Framework for Distributed Machine Learning	Dec 8, 2021	BIG-bench Machine LearningQuantization	—Unverified
Enhancing Kinship Verification through Multiscale Retinex and Combined Deep-Shallow features	Dec 6, 2023	Kinship VerificationQuantization	—Unverified
Block-Wise Dynamic-Precision Neural Network Training Acceleration via Online Quantization Sensitivity Analytics	Oct 31, 2022	QuantizationSensitivity	—Unverified
Reclaiming Residual Knowledge: A Novel Paradigm to Low-Bit Quantization	Aug 1, 2024	Quantization	—Unverified
Enhancing Off-Grid One-Bit DOA Estimation with Learning-Based Sparse Bayesian Approach for Non-Uniform Sparse Array	Dec 14, 2024	Computational EfficiencyQuantization	—Unverified
Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network	May 17, 2024	Image CompressionQuantization	—Unverified
EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs	Mar 5, 2024	Data Free QuantizationQuantization	—Unverified
Enhancing Speech Emotion Recognition with Graph-Based Multimodal Fusion and Prosodic Features for the Speech Emotion Recognition in Naturalistic Conditions Challenge at Interspeech 2025	Jun 2, 2025	Audio TaggingEmotion Recognition	—Unverified
Enhancing Strong PUF Security with Non-monotonic Response Quantization	Jun 7, 2022	Quantization	—Unverified
A Post-coder Feedback Approach to Overcome Training Asymmetry in MIMO-TDD	Jul 22, 2020	Quantization	—Unverified
Blockwise Compression of Transformer-based Models without Retraining	Apr 4, 2023	Quantization	—Unverified
EntroLLM: Entropy Encoded Weight Compression for Efficient Large Language Model Inference on Edge Devices	May 5, 2025	4kLanguage Modeling	—Unverified
Entropy Coding Improvement for Low-complexity Compressive Auto-encoders	Mar 10, 2023	QuantizationVideo Compression	—Unverified
Entropy-Driven Mixed-Precision Quantization for Deep Network Design	Nov 28, 2022	CPUFace Detection	—Unverified
Entropy optimized semi-supervised decomposed vector-quantized variational autoencoder model based on transfer learning for multiclass text classification and generation	Nov 10, 2021	DecoderMulti Class Text Classification	—Unverified
Angular Quantization-based Binary Codes for Fast Similarity Search	Dec 1, 2012	QuantizationRetrieval	—Unverified
EoRA: Training-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation	Oct 28, 2024	ARCMath	—Unverified
EPIM: Efficient Processing-In-Memory Accelerators based on Epitome	Nov 12, 2023	Model CompressionNeural Architecture Search	—Unverified
Block Modulating Video Compression: An Ultra Low Complexity Image Compression Encoder for Resource Limited Platforms	May 7, 2022	DecoderImage Compression	—Unverified
E^2BoWs: An End-to-End Bag-of-Words Model via Deep Convolutional Neural Network	Sep 18, 2017	Image RetrievalQuantization	—Unverified

Show:10 25 50

← PrevPage 32 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified