Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3750 of 4925 papers

Title	Date	Tasks	Status
A Survey on Model Compression for Large Language Models	Aug 15, 2023	BenchmarkingKnowledge Distillation	—Unverified
A Survey on Transformer Compression	Feb 5, 2024	Knowledge DistillationMamba	—Unverified
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations	Oct 17, 2024	DecoderQuantization	—Unverified
Asymmetric Correlation Quantization Hashing for Cross-modal Retrieval	Jan 14, 2020	Cross-Modal RetrievalQuantization	—Unverified
Asymmetric Deep Semantic Quantization for Image Retrieval	Mar 29, 2019	Image RetrievalQuantization	—Unverified
Asymmetric Learned Image Compression with Multi-Scale Residual Block, Importance Map, and Post-Quantization Filtering	Jun 21, 2022	DecoderImage Compression	—Unverified
Asymmetric Learning Vector Quantization for Efficient Nearest Neighbor Classification in Dynamic Time Warping Spaces	Mar 24, 2017	ClassificationDynamic Time Warping	—Unverified
Asymptotically Optimal Closed-Form Phase Configuration of 1-bit RISs via Sign Alignment	Jul 18, 2024	FormQuantization	—Unverified
Asymptotic Analysis of One-bit Quantized Box-Constrained Precoding in Large-Scale Multi-User Systems	Feb 5, 2025	Quantization	—Unverified
Asymptotic Performance Analysis of Large-Scale Active IRS-Aided Wireless Network	May 31, 2023	Quantization	—Unverified
Asymptotic stabilization under homomorphic encryption: A re-encryption free method	Apr 12, 2025	Quantization	—Unverified
Asymptotic tracking control of dynamic reference over homomorphically encrypted data with finite modulus	Sep 27, 2024	Quantization	—Unverified
Asymptotic Unbiased Sample Sampling to Speed Up Sharpness-Aware Minimization	Jun 12, 2024	Computational EfficiencyPose Estimation	—Unverified
Asynchronous Federated Learning with Bidirectional Quantized Communications and Buffered Aggregation	Aug 1, 2023	Federated LearningQuantization	—Unverified
A System-Level Solution for Low-Power Object Detection	Sep 24, 2019	CPUObject	—Unverified
A Targeted Acceleration and Compression Framework for Low bit Neural Networks	Jul 9, 2019	BinarizationComputational Efficiency	—Unverified
ATHEENA: A Toolflow for Hardware Early-Exit Network Automation	Apr 17, 2023	Quantization	—Unverified
Athena: Efficient Block-Wise Post-Training Quantization for Large Language Models Using Second-Order Matrix Derivative Information	May 24, 2024	Edge-computingMachine Translation	—Unverified
A Tiny CNN Architecture for Medical Face Mask Detection for Resource-Constrained Endpoints	Nov 30, 2020	Quantization	—Unverified
A TinyML Platform for On-Device Continual Learning with Quantized Latent Replays	Oct 20, 2021	Continual LearningQuantization	—Unverified
Atleus: Accelerating Transformers on the Edge Enabled by 3D Heterogeneous Manycore Architectures	Jan 16, 2025	Model CompressionQuantization	—Unverified
Atomic Anatomy of Low-Inertia Power Systems	May 21, 2023	AnatomyQuantization	—Unverified
Atrous Space Bender U-Net (ASBU-Net/LogiNet)	Dec 16, 2022	QuantizationSegmentation	—Unverified
Attacking Binarized Neural Networks	Nov 1, 2017	Quantization	—Unverified
Attention Augmented Convolutional Transformer for Tabular Time-series	Oct 5, 2021	Language ModelingLanguage Modelling	—Unverified
Attention-aware Post-training Quantization without Backpropagation	Jun 19, 2024	Quantization	—Unverified
Attention based on-device streaming speech recognition with large speech corpus	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attention-based Transducer for Online Speech Recognition	May 18, 2020	CPUDecoder	—Unverified
Attention or Convolution: Transformer Encoders in Audio Language Models for Inference Efficiency	Nov 5, 2023	Quantization	—Unverified
Attention Round for Post-Training Quantization	Jul 7, 2022	Combinatorial OptimizationQuantization	—Unverified
Attentive One-Dimensional Heatmap Regression for Facial Landmark Detection and Tracking	Apr 5, 2020	Face AlignmentFacial Landmark Detection	—Unverified
Attribute Artifacts Removal for Geometry-based Point Cloud Compression	Dec 1, 2021	AttributeGraph Attention	—Unverified
Augmented Deep Unfolding for Downlink Beamforming in Multi-cell Massive MIMO With Limited Feedback	Sep 3, 2022	Quantization	—Unverified
Combining Multi-Objective Bayesian Optimization with Reinforcement Learning for TinyML	May 23, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
Augmenting Hessians with Inter-Layer Dependencies for Mixed-Precision Post-Training Quantization	Jun 8, 2023	Quantization	—Unverified
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified
A Unified Framework of DNN Weight Pruning and Weight Clustering/Quantization Using ADMM	Nov 5, 2018	ClusteringModel Compression	—Unverified
A Unified Theory of SGD: Variance Reduction, Sampling, Quantization and Coordinate Descent	May 27, 2019	Quantization	—Unverified
A Unified View of Delta Parameter Editing in Post-Trained Large-Scale Models	Oct 17, 2024	Quantization	—Unverified
AUSN: Approximately Uniform Quantization by Adaptively Superimposing Non-uniform Distribution for Deep Neural Networks	Jul 8, 2020	image-classificationImage Classification	—Unverified
Autoencoder-Based Error Correction Coding for One-Bit Quantization	Sep 24, 2019	Quantization	—Unverified
Autoencoder based image compression: can the learning be quantization independent?	Feb 23, 2018	Image CompressionQuantization	—Unverified
Automated Backend-Aware Post-Training Quantization	Mar 27, 2021	CPUDiversity	—Unverified
Automated design of error-resilient and hardware-efficient deep neural networks	Sep 30, 2019	Autonomous VehiclesQuantization	—Unverified
Automated flow for compressing convolution neural networks for efficient edge-computation with FPGA	Dec 18, 2017	CPUobject-detection	—Unverified
Automated Heterogeneous Low-Bit Quantization of Multi-Model Deep Learning Inference Pipeline	Nov 10, 2023	Ensemble LearningMulti-Task Learning	—Unverified
Automated Linear-Time Detection and Quality Assessment of Superpixels in Uncalibrated True- or False-Color RGB Images	Jan 8, 2017	Color ConstancyComputational Efficiency	—Unverified
Automated Log-Scale Quantization for Low-Cost Deep Neural Networks	Jun 19, 2021	Image EnhancementQuantization	—Unverified
Automated Model Compression by Jointly Applied Pruning and Quantization	Nov 12, 2020	AutoMLModel Compression	—Unverified
Automated Tomato Maturity Estimation Using an Optimized Residual Model with Pruning and Quantization Techniques	Mar 13, 2025	ClassificationComputational Efficiency	—Unverified

Show:10 25 50

← PrevPage 75 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified