Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3151–3200 of 4925 papers

Title	Date	Tasks	Status
TwinDNN: A Tale of Two Deep Neural Networks	Jan 1, 2021	image-classificationImage Classification	—Unverified
Twin Network Augmentation: A Novel Training Strategy for Improved Spiking Neural Networks and Efficient Weight Quantization	Sep 24, 2024	Knowledge DistillationQuantization	—Unverified
Two-Bit RIS-Aided Communications at 3.5GHz: Some Insights from the Measurement Results Under Multiple Practical Scenes	May 19, 2023	Intelligent CommunicationQuantization	—Unverified
Two Dimensional Array Imaging with Beam Steered Data	Oct 24, 2013	QuantizationVocal Bursts Valence Prediction	—Unverified
Two Heads are Better Than One: Neural Networks Quantization with 2D Hilbert Curve-based Output Representation	May 22, 2024	CPUobject-detection	—Unverified
Two is Better than One: Efficient Ensemble Defense for Robust and Compact Models	Apr 7, 2025	Adversarial RobustnessDiversity	—Unverified
Two-layer Near-lossless HDR Coding with Backward Compatibility to JPEG	May 9, 2019	Image CompressionQuantization	—Unverified
Two-Stage Hashing for Fast Document Retrieval	Jun 1, 2014	Image RetrievalInformation Retrieval	—Unverified
Two-stage iterative Procrustes match algorithm and its application for VQ-based speaker verification	Jul 10, 2018	QuantizationSpeaker Verification	—Unverified
Two-Stage Learning for Uplink Channel Estimation in One-Bit Massive MIMO	Nov 27, 2019	Deep LearningDenoising	—Unverified
UAV-Assisted Real-Time Disaster Detection Using Optimized Transformer Model	Jan 21, 2025	image-classificationImage Classification	—Unverified
UDC: Unified DNAS for Compressible TinyML Models	Jan 15, 2022	Model CompressionNeural Architecture Search	—Unverified
ULMRec: User-centric Large Language Model for Sequential Recommendation	Dec 7, 2024	Language ModelingLanguage Modelling	—Unverified
Ultra-Lightweight Speech Separation via Group Communication	Nov 18, 2020	QuantizationSpeech Enhancement	—Unverified
Ultra-low Latency Adaptive Local Binary Spiking Neural Network with Accuracy Loss Estimator	Jul 31, 2022	Quantization	—Unverified
Ultra-low latency quantum-inspired machine learning predictors implemented on FPGA	Sep 24, 2024	QuantizationTensor Networks	—Unverified
Ultra-low Power Deep Learning-based Monocular Relative Localization Onboard Nano-quadrotors	Mar 3, 2023	Quantization	—Unverified
Ultra-Low Precision 4-bit Training of Deep Neural Networks	Dec 1, 2020	Quantization	—Unverified
Ultra-low Precision Multiplication-free Training for Deep Neural Networks	Feb 28, 2023	Quantization	—Unverified
Unbiased and Sign Compression in Distributed Learning: Comparing Noise Resilience via SDEs	Feb 24, 2025	Distributed OptimizationLanguage Modeling	—Unverified
Uncertainty-Aware Deep Video Compression with Ensembles	Mar 28, 2024	DiversityMotion Estimation	—Unverified
Uncertainty Estimation in Multi-Agent Distributed Learning	Nov 22, 2023	Edge-computingQuantization	—Unverified
Uncertainty Principle for Communication Compression in Distributed and Federated Learning and the Search for an Optimal Compressor	Feb 20, 2020	Federated LearningQuantization	—Unverified
Unconstrained Face Recognition using ASURF and Cloud-Forest Classifier optimized with VLAD	Apr 2, 2021	Face DetectionFace Recognition	—Unverified
Understanding Flatness in Generative Models: Its Role and Benefits	Mar 14, 2025	Noise EstimationQuantization	—Unverified
Understanding INT4 Quantization for Transformer Models: Latency Speedup, Composability, and Failure Cases	Jan 27, 2023	DecoderQuantization	—Unverified
Understanding the Difficulty of Low-Precision Post-Training Quantization for LLMs	Oct 18, 2024	Quantization	—Unverified
Understanding the Impact of Post-Training Quantization on Large Language Models	Sep 11, 2023	Quantization	—Unverified
Understanding the Impact of Precision Quantization on the Accuracy and Energy of Neural Networks	Dec 12, 2016	Quantization	—Unverified
Understanding Unconventional Preprocessors in Deep Convolutional Neural Networks for Face Identification	Mar 27, 2019	Data AugmentationFace Identification	—Unverified
UniCode: Learning a Unified Codebook for Multimodal Large Language Models	Mar 14, 2024	QuantizationVisual Question Answering (VQA)	—Unverified
UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation	May 27, 2024	Image CompressionKnowledge Distillation	—Unverified
Unified Analysis of Stochastic Gradient Methods for Composite Convex and Smooth Optimization	Jun 20, 2020	Quantization	—Unverified
Unified Anomaly Detection methods on Edge Device using Knowledge Distillation and Quantization	Jul 3, 2024	Anomaly DetectionCPU	—Unverified
Unified Data-Free Compression: Pruning and Quantization without Fine-Tuning	Aug 14, 2023	image-classificationImage Classification	—Unverified
Unified learning-based lossy and lossless JPEG recompression	Dec 5, 2023	Image CompressionQuantization	—Unverified
Unified Stochastic Framework for Neural Network Quantization and Pruning	Dec 24, 2024	Quantization	—Unverified
Uniform-Precision Neural Network Quantization via Neural Channel Expansion	Jan 1, 2021	Neural Architecture SearchQuantization	—Unverified
Unifying KV Cache Compression for Large Language Models with LeanKV	Dec 4, 2024	GPUQuantization	—Unverified
UnifySpeech: A Unified Framework for Zero-shot Text-to-Speech and Voice Conversion	Jan 10, 2023	Quantizationtext-to-speech	—Unverified
UniHM: Universal Human Motion Generation with Object Interactions in Indoor Scenes	May 19, 2025	Human-Object Interaction DetectionMotion Generation	—Unverified
UNIQ: Uniform Noise Injection for Non-Uniform Quantization of Neural Networks	Apr 29, 2018	Quantization	—Unverified
Universal Deep Neural Network Compression	Feb 7, 2018	Neural Network CompressionQuantization	—Unverified
Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size	Mar 6, 2025	MMLUQuantization	—Unverified
Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication	May 17, 2024	DecoderQuantization	—Unverified
Universally Quantized Neural Compression	Jun 17, 2020	Quantization	—Unverified
Unleashing Dynamic Range and Resolution in Unlimited Sensing Framework via Novel Hardware	Oct 26, 2024	Quantization	—Unverified
Unlimited Sampling Radar: a Real-Time End-to-End Demonstrator	Jun 30, 2023	Quantization	—Unverified
Unlocking Efficient Large Inference Models: One-Bit Unrolling Tips the Scales	Feb 4, 2025	Language ModelingLanguage Modelling	—Unverified
Enhancing Multimodal Unified Representations for Cross Modal Generalization	Mar 8, 2024	Contrastive LearningDisentanglement	—Unverified

Show:10 25 50

← PrevPage 64 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified