Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2951–3000 of 4925 papers

Title	Date	Tasks	Status
SimQ-NAS: Simultaneous Quantization Policy and Neural Architecture Search	Dec 19, 2023	Neural Architecture SearchQuantization	—Unverified
Simulated Annealing for JPEG Quantization	Sep 3, 2017	Quantization	—Unverified
Majority Kernels: An Approach to Leverage Big Model Dynamics for Efficient Small Model Training	Feb 7, 2024	Combinatorial OptimizationComputational Efficiency	—Unverified
Simultaneous Compression and Quantization: A Joint Approach for Efficient Unsupervised Hashing	Feb 19, 2018	Image RetrievalQuantization	—Unverified
Simultaneous Feature Learning and Hash Coding with Deep Neural Networks	Apr 14, 2015	Image RetrievalQuantization	—Unverified
Simultaneous Input and State Estimation under Output Quantization: A Gaussian Mixture approach	Apr 13, 2025	Fault DetectionQuantization	—Unverified
Single upper limb pose estimation method based on improved stacked hourglass network	Apr 16, 2020	Pose EstimationQuantization	—Unverified
Single-User mmWave Massive MIMO: SVD-based ADC Bit Allocation and Combiner Design	Apr 23, 2018	Quantization	—Unverified
SinReQ: Generalized Sinusoidal Regularization for Low-Bitwidth Deep Quantized Training	May 4, 2019	Quantization	—Unverified
SINR: Sparsity Driven Compressed Implicit Neural Representations	Mar 25, 2025	Quantization	—Unverified
SizeGS: Size-aware Compression of 3D Gaussians with Hierarchical Mixed Precision Quantization	Dec 8, 2024	3DGSAttribute	—Unverified
Sketch and Patch: Efficient 3D Gaussian Representation for Man-Made Scenes	Jan 22, 2025	3DGSQuantization	—Unverified
Sketch-based Manga Retrieval using Manga109 Dataset	Oct 15, 2015	QuantizationRetrieval	—Unverified
Sketched Adaptive Federated Deep Learning: A Sharp Convergence Analysis	Nov 11, 2024	Deep LearningFederated Learning	—Unverified
SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization	Dec 5, 2024	ClusteringGPU	—Unverified
Skin Color Measurement from Dermatoscopic Images: An Evaluation on a Synthetic Dataset	Apr 6, 2025	Quantization	—Unverified
SKQVC: One-Shot Voice Conversion by K-Means Quantization with Self-Supervised Speech Representations	Nov 25, 2024	QuantizationSelf-Supervised Learning	—Unverified
SKVQ: Sliding-window Key and Value Cache Quantization for Large Language Models	May 10, 2024	GPUQuantization	—Unverified
SLaNC: Static LayerNorm Calibration	Oct 14, 2024	Quantization	—Unverified
SLED: A Speculative LLM Decoding Framework for Efficient Edge Serving	Jun 11, 2025	Edge-computingQuantization	—Unverified
Sliding DFT-based Signal Recovery for Modulo ADC with 1-bit Folding Information	Oct 24, 2024	Quantization	—Unverified
SlimFit: Memory-Efficient Fine-Tuning of Transformer-based Models Using Training Dynamics	May 29, 2023	GPUQuantization	—Unverified
Slot-MLLM: Object-Centric Visual Tokenization for Multimodal LLM	May 23, 2025	Quantization	—Unverified
Smaller Models, Better Generalization	Aug 29, 2019	Quantization	—Unverified
Small Language Models: Architectures, Techniques, Evaluation, Problems and Future Adaptation	May 26, 2025	Model CompressionQuantization	—Unverified
SmartExchange: Trading Higher-cost Memory Storage/Access for Lower-cost Computation	May 7, 2020	Model CompressionQuantization	—Unverified
SmartQuant: CXL-based AI Model Store in Support of Runtime Configurable Weight Quantization	Jul 17, 2024	GPUQuantization	—Unverified
Smart Ternary Quantization	Sep 25, 2019	image-classificationImage Classification	—Unverified
Adaptive Binary-Ternary Quantization	Sep 26, 2019	Autonomous VehiclesImage Classification	—Unverified
SME: ReRAM-based Sparse-Multiplication-Engine to Squeeze-Out Bit Sparsity of Neural Network	Mar 2, 2021	Quantization	—Unverified
Theoretically Better and Numerically Faster Distributed Optimization with Smoothness-Aware Quantization Techniques	Jun 7, 2021	BIG-bench Machine LearningDistributed Optimization	—Unverified
SNN Architecture for Differential Time Encoding Using Decoupled Processing Time	Nov 24, 2023	Quantization	—Unverified
CrAFT: Compression-Aware Fine-Tuning for Efficient Visual Task Adaptation	May 8, 2023	GPUModel Compression	—Unverified
Soft Convex Quantization: Revisiting Vector Quantization with Convex Optimization	Oct 4, 2023	Image ReconstructionQuantization	—Unverified
Soft Label Coding for End-to-end Sound Source Localization With Ad-hoc Microphone Arrays	Apr 15, 2023	QuantizationSound Source Localization	—Unverified
SoftmAP: Software-Hardware Co-design for Integer-Only Softmax on Associative Processors	Nov 26, 2024	QuantizationSensitivity	—Unverified
Softmax Bias Correction for Quantized Generative Models	Sep 4, 2023	Language ModelingLanguage Modelling	—Unverified
Soft then Hard: Rethinking the Quantization in Neural Image Compression	Apr 12, 2021	Image CompressionQuantization	—Unverified
Soft-to-Hard Vector Quantization for End-to-End Learning Compressible Representations	Apr 3, 2017	Image CompressionNeural Network Compression	—Unverified
Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces	Oct 21, 2024	Continual LearningLifelong learning	—Unverified
Solving Multi-Arm Bandit Using a Few Bits of Communication	Nov 11, 2021	Active LearningQuantization	—Unverified
Some Further Evidence about Magnification and Shape in Neural Gas	Mar 28, 2015	Quantization	—Unverified
Sometimes Painful but Certainly Promising: Feasibility and Trade-offs of Language Model Inference at the Edge	Mar 12, 2025	CPUGPU	—Unverified
Some useful approximations for calculation of directivities of multibeam power patterns of large planar arrays	Jun 18, 2020	Quantization	—Unverified
Sorbet: A Neuromorphic Hardware-Compatible Transformer-Based Spiking Language Model	Sep 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Sound Event Detection with Binary Neural Networks on Tightly Power-Constrained IoT Devices	Jan 12, 2021	Event DetectionObject Recognition	—Unverified
Span Pointer Networks for Non-Autoregressive Task-Oriented Semantic Parsing	Apr 15, 2021	Cross-Lingual TransferDecoder	—Unverified
SPAQ-DL-SLAM: Towards Optimizing Deep Learning-based SLAM for Resource-Constrained Embedded Platforms	Sep 22, 2024	QuantizationSimultaneous Localization and Mapping	—Unverified
SPARQ-SGD: Event-Triggered and Compressed Communication in Decentralized Stochastic Optimization	Oct 31, 2019	QuantizationStochastic Optimization	—Unverified
Sparse*BERT: Sparse Models Generalize To New tasks and Domains	May 25, 2022	Quantization	—Unverified

Show:10 25 50

← PrevPage 60 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified