Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3376–3400 of 4925 papers

Title	Date	Tasks	Status
DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers	Aug 6, 2024	Model CompressionQuantization	—Unverified
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
A probabilistic framework for dynamic quantization	May 15, 2025	Quantization	—Unverified
Gaussian Weight Sampling for Scalable, Efficient and Stable Pseudo-Quantization Training	May 16, 2025	GPUQuantization	—Unverified
MARRS: Masked Autoregressive Unit-based Reaction Synthesis	May 16, 2025	Motion GenerationQuantization	—Unverified
QVGen: Pushing the Limit of Quantized Video Generative Models	May 16, 2025	Quantization	—Unverified
Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test	Jun 8, 2025	Quantization	—Unverified
Optimizing Learned Image Compression on Scalar and Entropy-Constraint Quantization	Jun 10, 2025	Image CompressionQuantization	—Unverified
POLARON: Precision-aware On-device Learning and Adaptive Runtime-cONfigurable AI acceleration	Jun 10, 2025	Quantization	—Unverified
Implementing Keyword Spotting on the MCUX947 Microcontroller with Integrated NPU	Jun 10, 2025	CPUKeyword Spotting	—Unverified
Discrete Audio Tokens: More Than a Survey!	Jun 12, 2025	Language ModelingLanguage Modelling	—Unverified
Starting Positions Matter: A Study on Better Weight Initialization for Neural Network Quantization	Jun 12, 2025	Quantization	—Unverified
2-bit Conformer quantization for automatic speech recognition	May 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
2-Bit Random Projections, NonLinear Estimators, and Approximate Near Neighbor Search	Feb 21, 2016	QuantizationRe-Ranking	—Unverified
2-in-1 Accelerator: Enabling Random Precision Switch for Winning Both Adversarial Robustness and Efficiency	Sep 11, 2021	Adversarial RobustnessQuantization	—Unverified
3D Gaussian Splatting Data Compression with Mixture of Priors	May 6, 2025	3DGSData Compression	—Unverified
3DMolNet: A Generative Network for Molecular Structures	Oct 8, 2020	QuantizationTranslation	—Unverified
3D Pathfinding and Collision Avoidance Using Uneven Search-space Quantization and Visual Cone Search	Jun 5, 2017	Collision AvoidanceQuantization	—Unverified
3DQ: Compact Quantized Neural Networks for Volumetric Whole Brain Segmentation	Apr 5, 2019	Brain SegmentationModel Compression	—Unverified
3D representation in 512-Byte:Variational tokenizer is the key for autoregressive 3D generation	Dec 3, 2024	3D GenerationImage Generation	—Unverified
3D Surface Detail Enhancement From a Single Normal Map	Oct 1, 2017	3D ReconstructionQuantization	—Unverified
3LC: Lightweight and Effective Traffic Compression for Distributed Machine Learning	Feb 21, 2018	BIG-bench Machine LearningData Compression	—Unverified
3U-EdgeAI: Ultra-Low Memory Training, Ultra-Low BitwidthQuantization, and Ultra-Low Latency Acceleration	May 11, 2021	Model CompressionQuantization	—Unverified
4-bit Quantization of LSTM-based Speech Recognition Models	Aug 27, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
4DGC: Rate-Aware 4D Gaussian Compression for Efficient Streamable Free-Viewpoint Video	Mar 24, 2025	3DGSQuantization	—Unverified

Show:10 25 50

← PrevPage 136 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified