Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2200 of 4925 papers

Title	Date	Tasks	Status
Adaptive Transmission for Distributed Detection in Energy Harvesting Wireless Sensor Networks	Mar 3, 2021	Quantization	—Unverified
Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization	Jun 16, 2022	Language ModelingLanguage Modelling	—Unverified
Evaluating the Practicality of Learned Image Compression	Jul 29, 2022	CPUGPU	—Unverified
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection	Nov 26, 2024	Quantization	—Unverified
CNN inference acceleration using dictionary of centroids	Oct 19, 2018	QuantizationTensor Decomposition	—Unverified
Evaluating Post-Training Compression in GANs using Locality-Sensitive Hashing	Mar 22, 2021	DiversityQuantization	—Unverified
CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture	Apr 22, 2024	GPUQuantization	—Unverified
Adaptive Training of Random Mapping for Data Quantization	Jun 28, 2016	Quantization	—Unverified
EuclidNets: Combining hardware and architecture design for Efficient Inference and Training	May 21, 2021	Quantization	—Unverified
EuclidNets: An Alternative Operation for Efficient Inference of Deep Learning Models	Dec 22, 2022	Deep LearningQuantization	—Unverified
CNN-based Analog CSI Feedback in FDD MIMO-OFDM Systems	Oct 23, 2019	DiversityQuantization	—Unverified
Estimation and Quantization of Expected Persistence Diagrams	May 11, 2021	QuantizationTime Series	—Unverified
CNN Acceleration by Low-rank Approximation with Quantized Factors	Jun 16, 2020	Quantization	—Unverified
Approximate search with quantized sparse representations	Aug 10, 2016	Quantization	—Unverified
Estimating the Completeness of Discrete Speech Units	Sep 9, 2024	DisentanglementQuantization	—Unverified
CNN2Gate: Toward Designing a General Framework for Implementation of Convolutional Neural Networks on FPGA	Apr 6, 2020	QuantizationReinforcement Learning	—Unverified
ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA	Dec 1, 2016	CPUGPU	—Unverified
ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization	Apr 16, 2025	DecoderQuantization	—Unverified
Cluster Regularized Quantization for Deep Networks Compression	Feb 27, 2019	Quantization	—Unverified
Approximate Probabilistic Neural Networks with Gated Threshold Logic	Aug 2, 2018	General ClassificationQuantization	—Unverified
Adaptive Sample-space & Adaptive Probability coding: a neural-network based approach for compression	May 1, 2019	Data CompressionEfficient Neural Network	—Unverified
eSampling: Energy Harvesting ADCs	Jul 16, 2020	Quantization	—Unverified
ERVQ: Enhanced Residual Vector Quantization with Intra-and-Inter-Codebook Optimization for Neural Audio Codecs	Oct 16, 2024	DiversityOnline Clustering	—Unverified
Towards Feature Distribution Alignment and Diversity Enhancement for Data-Free Quantization	Apr 30, 2022	Data Free QuantizationDiversity	—Unverified
Error Feedback Approach for Quantization Noise Reduction of Distributed Graph Filters	Dec 7, 2024	Quantization	—Unverified
Cluster Pruning: An Efficient Filter Pruning Method for Edge AI Vision Applications	Mar 5, 2020	CPUGPU	—Unverified
Cluster-Promoting Quantization with Bit-Drop for Minimizing Network Quantization Loss	Sep 5, 2021	Quantization	—Unverified
Error Compensated Quantized SGD and its Applications to Large-scale Distributed Optimization	Jun 21, 2018	Distributed OptimizationQuantization	—Unverified
Error-aware Quantization through Noise Tempering	Dec 11, 2022	Model CompressionQuantization	—Unverified
Clustering with Bregman Divergences: an Asymptotic Analysis	Dec 1, 2016	ClusteringQuantization	—Unverified
Approximately Invertible Neural Network for Learned Image Compression	Aug 30, 2024	DenoisingImage Compression	—Unverified
Adaptive Resource Allocation for Semantic Communication Networks	Dec 2, 2023	Deep Reinforcement LearningQuantization	—Unverified
Error Analysis of CORDIC Processor with FPGA Implementation	Aug 2, 2023	Quantization	—Unverified
ERQ: Error Reduction for Post-Training Quantization of Vision Transformers	Jul 9, 2024	Quantizationregression	—Unverified
E-RNN: Design Optimization for Efficient Recurrent Neural Networks in FPGAs	Dec 12, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Clustering-Based Evolutionary Federated Multiobjective Optimization and Learning	Apr 29, 2025	ClusteringDiversity	—Unverified
Approximate DCT and Quantization Techniques for Energy-Constrained Image Sensors	Jun 24, 2024	Quantization	—Unverified
Cluster-Based Cooperative Digital Over-the-Air Aggregation for Wireless Federated Edge Learning	Aug 3, 2020	DecoderDiversity	—Unverified
EQ-Net: A Unified Deep Learning Framework for Log-Likelihood Ratio Estimation and Quantization	Dec 23, 2020	GPUQuantization	—Unverified
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning	Mar 17, 2025	GPUModel Compression	—Unverified
Approaching Rate-Distortion Limits in Neural Compression with Lattice Transform Coding	Mar 12, 2024	Quantization	—Unverified
Adaptive Resolution Inference (ARI): Energy-Efficient Machine Learning for Internet of Things	Aug 26, 2024	Quantization	—Unverified
Accelerating Energy-Efficient Federated Learning in Cell-Free Networks with Adaptive Quantization	Dec 30, 2024	Federated LearningQuantization	—Unverified
2-in-1 Accelerator: Enabling Random Precision Switch for Winning Both Adversarial Robustness and Efficiency	Sep 11, 2021	Adversarial RobustnessQuantization	—Unverified
EPIM: Efficient Processing-In-Memory Accelerators based on Epitome	Nov 12, 2023	Model CompressionNeural Architecture Search	—Unverified
EoRA: Training-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation	Oct 28, 2024	ARCMath	—Unverified
Entropy optimized semi-supervised decomposed vector-quantized variational autoencoder model based on transfer learning for multiclass text classification and generation	Nov 10, 2021	DecoderMulti Class Text Classification	—Unverified
CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization	Jun 1, 2018	image-classificationImage Classification	—Unverified
Entropy-Driven Mixed-Precision Quantization for Deep Network Design	Nov 28, 2022	CPUFace Detection	—Unverified
Entropy Coding Improvement for Low-complexity Compressive Auto-encoders	Mar 10, 2023	QuantizationVideo Compression	—Unverified

Show:10 25 50

← PrevPage 44 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified