Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2701–2750 of 4925 papers

Title	Date	Tasks	Status
Running Conventional Automatic Speech Recognition on Memristor Hardware: A Simulated Approach	May 30, 2025	Automatic Speech RecognitionQuantization	—Unverified
S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs	May 30, 2024	GPUQuantization	—Unverified
S3-Net: A Fast and Lightweight Video Scene Understanding Network by Single-shot Segmentation	Nov 4, 2020	Autonomous DrivingEdge-computing	—Unverified
S4: a High-sparsity, High-performance AI Accelerator	Jul 16, 2022	QuantizationVocal Bursts Intensity Prediction	—Unverified
SAfER: Layer-Level Sensitivity Assessment for Efficient and Robust Neural Network Inference	Aug 9, 2023	Autonomous DrivingQuantization	—Unverified
SaleNet: A low-power end-to-end CNN accelerator for sustained attention level evaluation using EEG	Sep 3, 2022	ClusteringEEG	—Unverified
Saliency Assisted Quantization for Neural Networks	Nov 7, 2024	image-classificationImage Classification	—Unverified
HDR image watermarking using saliency detection and quantization index modulation	Feb 22, 2023	object-detectionObject Detection	—Unverified
SAMP: A Model Inference Toolkit of Post-Training Quantization for Text Processing via Self-Adaptive Mixed-Precision	Sep 19, 2022	Quantization	—Unverified
Sampled-data control design for systems with quantized actuators	Aug 11, 2022	Quantization	—Unverified
Sampling From Autoencoders' Latent Space via Quantization And Probability Mass Function Concepts	Aug 21, 2023	Image GenerationQuantization	—Unverified
Sampling Streaming Data with Parallel Vector Quantization -- PVQ	Oct 4, 2022	Hyperparameter OptimizationQuantization	—Unverified
SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model	Mar 9, 2025	Instance SegmentationQuantization	—Unverified
Scalable and consistent embedding of probability measures into Hilbert spaces via measure quantization	Feb 7, 2025	Quantization	—Unverified
Scalable and Efficient Neural Speech Coding: A Hybrid Design	Mar 27, 2021	Quantization	—Unverified
Scalable Image Retrieval by Sparse Product Quantization	Mar 15, 2016	Content-Based Image RetrievalImage Retrieval	—Unverified
Scalable Multivariate Fronthaul Quantization for Cell-Free Massive MIMO	Aug 26, 2024	Quantization	—Unverified
Scalable Nearest Neighbor Search based on kNN Graph	Jan 30, 2017	graph constructionQuantization	—Unverified
Scalable Neural Network Compression and Pruning Using Hard Clustering and L1 Regularization	Jun 14, 2018	ClusteringNeural Network Compression	—Unverified
Scalable Representation Learning for Multimodal Tabular Transactions	Oct 10, 2024	DecoderQuantization	—Unverified
Scalable Thermodynamic Second-order Optimization	Feb 12, 2025	Quantization	—Unverified
Scalar Arithmetic Multiple Data: Customizable Precision for Deep Neural Networks	Sep 27, 2018	Quantization	—Unverified
Scaled Quantization for the Vision Transformer	Mar 23, 2023	Quantization	—Unverified
Scaling FP8 training to trillion-token LLMs	Sep 19, 2024	Quantization	—Unverified
Scaling Language Model Size in Cross-Device Federated Learning	Mar 31, 2022	Federated LearningLanguage Modeling	—Unverified
Scaling Laws for Floating Point Quantization Training	Jan 5, 2025	Quantization	—Unverified
Scaling Laws for Mixed quantization in Large Language Models	Oct 9, 2024	Quantization	—Unverified
Scaling Laws for Post Training Quantized Large Language Models	Oct 15, 2024	Quantization	—Unverified
Scaling Up Deep Neural Network Optimization for Edge Inference	Sep 1, 2020	Quantization	—Unverified
Scaling Up Quantization-Aware Neural Architecture Search for Efficient Deep Learning on the Edge	Jan 22, 2024	Neural Architecture SearchQuantization	—Unverified
SceneSqueezer: Learning To Compress Scene for Camera Relocalization	Jan 1, 2022	Camera RelocalizationImage Registration	—Unverified
ScionFL: Efficient and Robust Secure Quantized Aggregation	Oct 13, 2022	Federated LearningQuantization	—Unverified
Scissorhands: Exploiting the Persistence of Importance Hypothesis for LLM KV Cache Compression at Test Time	May 26, 2023	Quantization	—Unverified
sDAC -- Semantic Digital Analog Converter for Semantic Communications	Apr 26, 2024	QuantizationSemantic Communication	—Unverified
SDP4Bit: Toward 4-bit Communication Quantization in Sharded Data Parallelism for LLM Training	Oct 20, 2024	Quantization	—Unverified
SDQ: Sparse Decomposed Quantization for LLM Inference	Jun 19, 2024	Model CompressionQuantization	—Unverified
SDQ: Stochastic Differentiable Quantization with Mixed Precision	Jun 9, 2022	Knowledge DistillationNeural Architecture Search	—Unverified
SDR: Efficient Neural Re-ranking using Succinct Document Representation	Oct 3, 2021	Information RetrievalQuantization	—Unverified
SEAL: SEmantic-Augmented Imitation Learning via Language Model	Oct 3, 2024	Decision MakingImitation Learning	—Unverified
SEAM: Searching Transferable Mixed-Precision Quantization Policy through Large Margin Regularization	Feb 14, 2023	Quantization	—Unverified
Search What You Want: Barrier Panelty NAS for Mixed Precision Quantization	Jul 20, 2020	Quantizationvalid	—Unverified
Secret Lies in Color: Enhancing AI-Generated Images Detection with Color Distribution Analysis	Jan 1, 2025	Image RestorationMisinformation	—Unverified
Secure Evaluation of Quantized Neural Networks	Oct 28, 2019	Image ClassificationQuantization	—Unverified
Secure Formation Control via Edge Computing Enabled by Fully Homomorphic Encryption and Mixed Uniform-Logarithmic Quantization	Apr 13, 2022	Edge-computingQuantization	—Unverified
Security-Aware Approximate Spiking Neural Networks	Jan 12, 2023	Quantization	—Unverified
Seeing Delta Parameters as JPEG Images: Data-Free Delta Compression with Discrete Cosine Transform	Mar 9, 2025	Image CompressionQuantization	—Unverified
Seeing through bag-of-visual-word glasses: towards understanding quantization effects in feature extraction methods	Aug 20, 2014	image-classificationImage Classification	—Unverified
SeerNet: Predicting Convolutional Neural Network Feature-Map Sparsity Through Low-Bit Quantization	Jun 1, 2019	Quantization	—Unverified
Segmentation of Overlapped Steatosis in Whole-Slide Liver Histopathology Microscopy Images	Jun 24, 2018	Quantization	—Unverified
Segmentation-Variant Codebooks for Preservation of Paralinguistic and Prosodic Information	May 21, 2025	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 55 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified