Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2250 of 4925 papers

Title	Date	Tasks	Status
EntroLLM: Entropy Encoded Weight Compression for Efficient Large Language Model Inference on Edge Devices	May 5, 2025	4kLanguage Modeling	—Unverified
ENTED: Enhanced Neural Texture Extraction and Distribution for Reference-based Blind Face Restoration	Jan 13, 2024	Blind Face RestorationQuantization	—Unverified
Adaptive quantization with mixed-precision based on low-cost proxy	Feb 27, 2024	Neural Architecture SearchQuantization	—Unverified
Enhancing Strong PUF Security with Non-monotonic Response Quantization	Jun 7, 2022	Quantization	—Unverified
Enhancing Speech Emotion Recognition with Graph-Based Multimodal Fusion and Prosodic Features for the Speech Emotion Recognition in Naturalistic Conditions Challenge at Interspeech 2025	Jun 2, 2025	Audio TaggingEmotion Recognition	—Unverified
Enhancing Post-training Quantization Calibration through Contrastive Learning	Jan 1, 2024	Contrastive LearningQuantization	—Unverified
Click-through Rate Prediction with Auto-Quantized Contrastive Learning	Sep 27, 2021	Click-Through Rate PredictionContrastive Learning	—Unverified
A Post-coder Feedback Approach to Overcome Training Asymmetry in MIMO-TDD	Jul 22, 2020	Quantization	—Unverified
Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network	May 17, 2024	Image CompressionQuantization	—Unverified
Enhancing Off-Grid One-Bit DOA Estimation with Learning-Based Sparse Bayesian Approach for Non-Uniform Sparse Array	Dec 14, 2024	Computational EfficiencyQuantization	—Unverified
Classification Accuracy Improvement for Neuromorphic Computing Systems with One-level Precision Synapses	Jan 7, 2017	General Classificationimage-classification	—Unverified
Enhancing Multi-Stream Beamforming Through CQIs For 5G NR FDD Massive MIMO Communications: A Tuning-Free Scheme	Sep 1, 2024	Quantization	—Unverified
Class-based Quantization for Neural Networks	Nov 27, 2022	Quantization	—Unverified
Adaptive Quantization Resolution and Power Control for Federated Learning over Cell-free Networks	Dec 14, 2024	Federated LearningQuantization	—Unverified
Accelerating Deep Learning with Dynamic Data Pruning	Nov 24, 2021	AttributeDeep Learning	—Unverified
Enhancing Kinship Verification through Multiscale Retinex and Combined Deep-Shallow features	Dec 6, 2023	Kinship VerificationQuantization	—Unverified
Enhancing Generalization of Invisible Facial Privacy Cloak via Gradient Accumulation	Jan 3, 2024	Face RecognitionQuantization	—Unverified
Enhancing Field-Oriented Control of Electric Drives with Tiny Neural Network Optimized for Micro-controllers	Feb 1, 2025	Quantization	—Unverified
CLAP-ART: Automated Audio Captioning with Semantic-rich Audio Representation Tokenizer	Jun 1, 2025	Audio captioningLanguage Modeling	—Unverified
Apollo-Forecast: Overcoming Aliasing and Inference Speed Challenges in Language Models for Time Series Forecasting	Dec 16, 2024	QuantizationTime Series	—Unverified
Enhancing Diversity for Data-free Quantization	Jan 1, 2025	Data Free QuantizationDiversity	—Unverified
Enhancing Convergence, Privacy and Fairness for Wireless Personalized Federated Learning: Quantization-Assisted Min-Max Fair Scheduling	Jun 3, 2025	FairnessFederated Learning	—Unverified
Enhancing Computation Efficiency in Large Language Models through Weight and Activation Quantization	Nov 9, 2023	Computational EfficiencyQuantization	—Unverified
Enhancing Channel Estimation in Quantized Systems with a Generative Prior	Apr 26, 2024	Quantization	—Unverified
CLaM-TTS: Improving Neural Codec Language Model for Zero-Shot Text-to-Speech	Apr 3, 2024	Language ModelingLanguage Modelling	—Unverified
Adaptive Quantization of Neural Networks	Jan 1, 2018	Edge-computingModel Compression	—Unverified
Enhancing Bridge Deck Delamination Detection Based on Aerial Thermography Through Grayscale Morphologic Reconstruction: A Case Study	Apr 11, 2019	ClusteringQuantization	—Unverified
Enhancement Of Coded Speech Using a Mask-Based Post-Filter	Oct 12, 2020	DecoderQuantization	—Unverified
Enhance Feature Discrimination for Unsupervised Hashing	Apr 6, 2017	Quantization	—Unverified
A Planck Radiation and Quantization Scheme for Human Cognition and Language	Jan 10, 2022	Quantization	—Unverified
Enhanced Blind Calibration of Uniform Linear Arrays with One-Bit Quantization by Kullback-Leibler Divergence Covariance Fitting	Oct 28, 2020	Quantization	—Unverified
Enhanced Bayesian Compression via Deep Reinforcement Learning	Jun 1, 2019	Deep Reinforcement LearningQuantization	—Unverified
English K_Quantization of LLMs Does Not Disproportionately Diminish Multilingual Performance	Mar 5, 2025	Quantization	—Unverified
Choose Your Model Size: Any Compression by a Single Gradient Descent	Feb 3, 2025	Quantization	—Unverified
Adaptive Quantization of Model Updates for Communication-Efficient Federated Learning	Feb 8, 2021	Federated LearningQuantization	—Unverified
Accelerating Deep Learning Model Inference on Arm CPUs with Ultra-Low Bit Quantization and Runtime	Jul 18, 2022	Quantization	—Unverified
2-Bit Random Projections, NonLinear Estimators, and Approximate Near Neighbor Search	Feb 21, 2016	QuantizationRe-Ranking	—Unverified
Engineering the Neural Automatic Passenger Counter	Mar 2, 2022	Quantization	—Unverified
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification	Feb 23, 2025	ClassificationInference Optimization	—Unverified
CHIME: A Compressive Framework for Holistic Interest Modeling	Apr 9, 2025	Contrastive LearningQuantization	—Unverified
Energy-Efficient Respiratory Anomaly Detection in Premature Newborn Infants	Feb 21, 2022	Anomaly DetectionModel Selection	—Unverified
Energy Efficient Learning with Low Resolution Stochastic Domain Wall Synapse Based Deep Neural Networks	Nov 14, 2021	Quantization	—Unverified
Cherry on Top: Parameter Heterogeneity and Quantization in Large Language Models	Apr 3, 2024	Quantization	—Unverified
A Picture is Worth a Billion Bits: Real-Time Image Reconstruction from Dense Binary Pixels	Oct 15, 2015	Image ReconstructionQuantization	—Unverified
Energy-efficient Knowledge Distillation for Spiking Neural Networks	Jun 14, 2021	Knowledge DistillationModel Compression	—Unverified
Energy-Efficient Distributed Learning Algorithms for Coarsely Quantized Signals	Jan 13, 2021	parameter estimationQuantization	—Unverified
Cheetah: Mixed Low-Precision Hardware & Software Co-Design Framework for DNNs on the Edge	Aug 6, 2019	Quantization	—Unverified
Energy Efficiency Optimization for Millimeter Wave System with Resolution-Adaptive ADCs	May 18, 2020	Quantization	—Unverified
Energy Efficiency Maximization Precoding for Quantized Massive MIMO Systems	Aug 6, 2021	Quantization	—Unverified
Check-N-Run: A Checkpointing System for Training Deep Learning Recommendation Models	Oct 17, 2020	QuantizationRecommendation Systems	—Unverified

Show:10 25 50

← PrevPage 45 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified