Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1651–1700 of 4925 papers

Title	Date	Tasks	Status
Continuous Control with Action Quantization from Demonstrations	Oct 19, 2021	continuous-controlContinuous Control	—Unverified
Continuous Autoregressive Modeling with Stochastic Monotonic Alignment for Speech Synthesis	Feb 3, 2025	QuantizationSpeech Synthesis	—Unverified
Continuous Approximations for Improving Quantization Aware Training of LLMs	Oct 6, 2024	MMLUModel Compression	—Unverified
Continual Quantization-Aware Pre-Training: When to transition from 16-bit to 1.58-bit pre-training for BitNet language models?	Feb 17, 2025	Quantization	—Unverified
A General Error-Theoretical Analysis Framework for Constructing Compression Strategies	Feb 19, 2025	Quantization	—Unverified
Continual Learning of Generative Models with Limited Data: From Wasserstein-1 Barycenter to Adaptive Coalescence	Jan 22, 2021	Continual LearningQuantization	—Unverified
A survey on efficient vision transformers: algorithms, techniques, and performance benchmarking	Sep 5, 2023	BenchmarkingKnowledge Distillation	—Unverified
A Survey on Deep Hashing Methods	Mar 4, 2020	Deep HashingDomain Adaptation	—Unverified
A Formalization of Image Vectorization by Region Merging	Sep 24, 2024	Image SegmentationQuantization	—Unverified
Contextual Compression Encoding for Large Language Models: A Novel Framework for Multi-Layered Parameter Space Pruning	Feb 12, 2025	Computational EfficiencyQuantization	—Unverified
A Survey of Techniques for Optimizing Transformer Inference	Jul 16, 2023	Knowledge DistillationNeural Architecture Search	—Unverified
A Survey of Small Language Models	Oct 25, 2024	BenchmarkingModel Compression	—Unverified
A Flexible, Extensible Software Framework for Neural Net Compression	Oct 20, 2018	Quantization	—Unverified
Accurate Deep Representation Quantization with Gradient Snapping Layer for Similarity Search	Oct 30, 2016	Quantization	—Unverified
L3iTC at the FinLLM Challenge Task: Quantization for Financial Text Classification & Summarization	Aug 6, 2024	GPUQuantization	—Unverified
1-bit Quantized On-chip Hybrid Diffraction Neural Network Enabled by Authentic All-optical Fully-connected Architecture	Apr 11, 2024	AllLesion Detection	—Unverified
Constructing High-Order Signed Distance Maps from Computed Tomography Data with Application to Bone Morphometry	Nov 2, 2021	Quantization	—Unverified
Constraint Guided Model Quantization of Neural Networks	Sep 30, 2024	modelQuantization	—Unverified
A Survey of Quantization Methods for Efficient Neural Network Inference	Mar 25, 2021	Efficient Neural NetworkQuantization	—Unverified
Constrained Approximate Similarity Search on Proximity Graph	Oct 26, 2022	QuantizationRecommendation Systems	—Unverified
CoNLoCNN: Exploiting Correlation and Non-Uniform Quantization for Energy-Efficient Low-precision Deep Convolutional Neural Networks	Jul 31, 2022	Quantization	—Unverified
A Survey of Model Compression and Acceleration for Deep Neural Networks	Oct 23, 2017	BenchmarkingKnowledge Distillation	—Unverified
A flexible, extensible software framework for model compression based on the LC algorithm	May 15, 2020	BIG-bench Machine LearningLow-rank compression	—Unverified
A Survey of Methods for Low-Power Deep Learning and Computer Vision	Mar 24, 2020	Knowledge DistillationQuantization	—Unverified
Conditionally Deep Hybrid Neural Networks Across Edge and Cloud	May 21, 2020	ClassificationCloud Computing	—Unverified
A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms	Sep 25, 2024	Quantization	—Unverified
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization	Aug 31, 2024	Image GenerationQuantization	—Unverified
Conditional Distribution Quantization in Machine Learning	Feb 11, 2025	QuantizationUncertainty Quantification	—Unverified
A Study on Unsupervised Dictionary Learning and Feature Encoding for Action Classification	Sep 2, 2013	Action ClassificationDictionary Learning	—Unverified
A study on speech enhancement using exponent-only floating point quantized neural network (EOFP-QNN)	Aug 17, 2018	Quantizationregression	—Unverified
A Federated Reinforcement Learning Method with Quantization for Cooperative Edge Caching in Fog Radio Access Networks	Jun 23, 2022	Deep Reinforcement LearningQuantization	—Unverified
Computing with Hypervectors for Efficient Speaker Identification	Aug 28, 2022	CPUQuantization	—Unverified
Compute-Optimal LLMs Provably Generalize Better With Scale	Apr 21, 2025	Generalization BoundsQuantization	—Unverified
How Does Batch Normalization Help Binary Training?	Sep 18, 2019	Quantization	—Unverified
Computation-Efficient Quantization Method for Deep Neural Networks	Sep 27, 2018	Quantization	—Unverified
A Structurally Regularized Convolutional Neural Network for Image Classification using Wavelet-based SubBand Decomposition	Mar 2, 2021	ClassificationGeneral Classification	—Unverified
A Feature-map Discriminant Perspective for Pruning Deep Neural Networks	May 28, 2020	Network PruningQuantization	—Unverified
Accurate Block Quantization in LLMs with Outliers	Mar 29, 2024	Quantization	—Unverified
3U-EdgeAI: Ultra-Low Memory Training, Ultra-Low BitwidthQuantization, and Ultra-Low Latency Acceleration	May 11, 2021	Model CompressionQuantization	—Unverified
Computational Complexity Evaluation of Neural Network Applications in Signal Processing	Jun 24, 2022	Quantization	—Unverified
Computability of Classification and Deep Learning: From Theoretical Limits to Practical Feasibility through Quantization	Aug 12, 2024	Deep LearningQuantization	—Unverified
A Structurally Regularized CNN Architecture via Adaptive Subband Decomposition	Jun 29, 2023	image-classificationImage Classification	—Unverified
Compress, Then Prompt: Improving Accuracy-Efficiency Trade-off of LLM Inference with Transferable Prompt	May 17, 2023	GPUModel Compression	—Unverified
Compress Polyphone Pronunciation Prediction Model with Shared Labels	Oct 1, 2020	PredictionQuantization	—Unverified
A Fast Network Exploration Strategy to Profile Low Energy Consumption for Keyword Spotting	Feb 4, 2022	Keyword SpottingQuantization	—Unverified
Compressive Spectrum Sensing with 1-bit ADCs	Nov 7, 2024	compressed sensingQuantization	—Unverified
Compressive Sensing Using Iterative Hard Thresholding with Low Precision Data Representation: Theory and Applications	Feb 14, 2018	AstronomyCompressive Sensing	—Unverified
Compressive Quantization for Fast Object Instance Search in Videos	Oct 1, 2017	Instance SearchObject	—Unverified
Compressive Estimation of a Stochastic Process with Unknown Autocorrelation Function	May 9, 2017	Quantization	—Unverified
Associative Memories to Accelerate Approximate Nearest Neighbor Search	Nov 10, 2016	QuantizationRetrieval	—Unverified

Show:10 25 50

← PrevPage 34 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified