Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1800 of 4925 papers

Title	Date	Tasks	Status
Compressed-VFL: Communication-Efficient Learning with Vertically Partitioned Data	Jun 16, 2022	Federated LearningQuantization	—Unverified
Compressed Particle-Based Federated Bayesian Learning and Unlearning	Sep 14, 2022	Quantization	—Unverified
ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNs	Oct 31, 2024	Quantization	—Unverified
Compressed Models Decompress Race Biases: What Quantized Models Forget for Fair Face Recognition	Aug 23, 2023	Face RecognitionQuantization	—Unverified
Filter Pre-Pruning for Improved Fine-tuning of Quantized Deep Neural Networks	Nov 13, 2020	Quantization	—Unverified
Compressed Domain Prior-Guided Video Super-Resolution for Cloud Gaming Content	Jan 3, 2025	QuantizationSuper-Resolution	—Unverified
Fighting Quantization Bias With Bias	Jun 7, 2019	Quantization	—Unverified
Fighting over-fitting with quantization for learning deep neural networks on noisy labels	Mar 21, 2023	Action Unit DetectionFacial Action Unit Detection	—Unverified
FGMP: Fine-Grained Mixed-Precision Weight and Activation Quantization for Hardware-Accelerated LLM Inference	Apr 19, 2025	Large Language ModelQuantization	—Unverified
A Robust Visual Sampling Model Inspired by Receptive Field	Jan 4, 2022	Quantization	—Unverified
A Robust Deep Learning-Based Beamforming Design for RIS-assisted Multiuser MISO Communications with Practical Constraints	Nov 12, 2021	Quantization	—Unverified
AdpQ: A Zero-shot Calibration Free Adaptive Post Training Quantization Method for LLMs	May 22, 2024	Privacy PreservingQuantization	—Unverified
3D representation in 512-Byte:Variational tokenizer is the key for autoregressive 3D generation	Dec 3, 2024	3D GenerationImage Generation	—Unverified
1-bit Localization Scheme for Radar using Dithered Quantized Compressed Sensing	Jun 15, 2018	compressed sensingQuantization	—Unverified
DeepCABAC: Context-adaptive binary arithmetic coding for deep neural network compression	May 15, 2019	Neural Network CompressionQuantization	—Unverified
Comprehensive Survey of Model Compression and Speed up for Vision Transformers	Apr 16, 2024	Computational EfficiencyEdge-computing	—Unverified
Comprehensive Study on Performance Evaluation and Optimization of Model Compression: Bridging Traditional Deep Learning and Large Language Models	Jul 22, 2024	Deep Learningimage-classification	—Unverified
A Robust and Low Complexity Deep Learning Model for Remote Sensing Image Classification	Nov 5, 2022	image-classificationImage Classification	—Unverified
Few-bit Quantization of Neural Networks for Nonlinearity Mitigation in a Fiber Transmission Experiment	May 23, 2022	Quantization	—Unverified
FETCH: A Memory-Efficient Replay Approach for Continual Learning in Image Classification	Jul 17, 2024	BenchmarkingContinual Learning	—Unverified
ARM 4-BIT PQ: SIMD-based Acceleration for Approximate Nearest Neighbor Search on ARM	Mar 3, 2022	Quantization	—Unverified
ADMM Based Semi-Structured Pattern Pruning Framework For Transformer	Jul 11, 2024	CoLAQuantization	—Unverified
FedShift: Tackling Dual Heterogeneity Problem of Federated Learning via Weight Shift Aggregation	Feb 2, 2024	DiversityFederated Learning	—Unverified
FedPAQ: A Communication-Efficient Federated Learning Method with Periodic Averaging and Quantization	Sep 28, 2019	Federated LearningQuantization	—Unverified
A Rigorous Analysis of Least Squares Sine Fitting Using Quantized Data: the Random Phase Case	Apr 20, 2018	Quantization	—Unverified
FedMPQ: Secure and Communication-Efficient Federated Learning with Multi-codebook Product Quantization	Apr 21, 2024	Federated LearningQuantization	—Unverified
FedHQ: Hybrid Runtime Quantization for Federated Learning	May 17, 2025	Federated LearningQuantization	—Unverified
Federated TD Learning over Finite-Rate Erasure Channels: Linear Speedup under Markovian Sampling	May 14, 2023	Distributed OptimizationFederated Learning	—Unverified
A Directed-Evolution Method for Sparsification and Compression of Neural Networks with Application to Object Identification and Segmentation and considerations of optimal quantization using small number of bits	Jun 12, 2022	Quantization	—Unverified
AccLLM: Accelerating Long-Context LLM Inference Via Algorithm-Hardware Co-Design	Apr 7, 2025	Quantization	—Unverified
Federated Split Learning with Model Pruning and Gradient Quantization in Wireless Networks	Dec 9, 2024	Federated LearningQuantization	—Unverified
FedX: Adaptive Model Decomposition and Quantization for IoT Federated Learning	Apr 17, 2025	Federated LearningQuantization	—Unverified
Federated Split BERT for Heterogeneous Text Classification	May 26, 2022	ClassificationFederated Learning	—Unverified
Composite Correlation Quantization for Efficient Multimodal Retrieval	May 22, 2016	Cross-Modal RetrievalQuantization	—Unverified
HAFLQ: Heterogeneous Adaptive Federated LoRA Fine-tuned LLM with Quantization	Nov 10, 2024	Quantizationtext-classification	—Unverified
Composite Code Sparse Autoencoders for first stage retrieval	Apr 14, 2022	Image RetrievalInformation Retrieval	—Unverified
FewGAN: Generating from the Joint Distribution of a Few Images	Jul 18, 2022	Quantization	—Unverified
Are Words the Quanta of Human Language? Extending the Domain of Quantum Cognition	Oct 10, 2021	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
Federated Learning With Quantized Global Model Updates	Jun 18, 2020	Federated Learningmodel	—Unverified
FFN Fusion: Rethinking Sequential Computation in Large Language Models	Mar 24, 2025	Quantization	—Unverified
Federated Learning with Lossy Distributed Source Coding: Analysis and Optimization	Apr 23, 2022	Federated LearningQuantization	—Unverified
Component Training of Turbo Autoencoders	May 16, 2023	Quantization	—Unverified
Federated Learning: Strategies for Improving Communication Efficiency	Oct 18, 2016	Federated LearningQuantization	—Unverified
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting	Mar 17, 2025	3DGS3D Reconstruction	—Unverified
A Diffusion Model Based Quality Enhancement Method for HEVC Compressed Video	Nov 15, 2023	DecoderQuantization	—Unverified
Federated Learning in Adversarial Settings	Oct 15, 2020	Federated LearningQuantization	—Unverified
Completion Time Minimization of Fog-RAN-Assisted Federated Learning With Rate-Splitting Transmission	Jun 3, 2022	Federated LearningQuantization	—Unverified
Federated Aggregation of Mallows Rankings: A Comparative Analysis of Borda and Lehmer Coding	Sep 1, 2024	Privacy PreservingQuantization	—Unverified
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners	Jul 22, 2024	Lightweight DeploymentQuantization	—Unverified
A Review of Recent Advances of Binary Neural Networks for Edge Computing	Nov 24, 2020	Edge-computingNeural Architecture Search	—Unverified

Show:10 25 50

← PrevPage 36 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified