Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3801–3850 of 4925 papers

Title	Date	Tasks	Status
Bernoulli Embeddings for Graphs	Mar 25, 2018	Information RetrievalQuantization	—Unverified
BeST -- A Novel Source Selection Metric for Transfer Learning	Jan 19, 2025	QuantizationTransfer Learning	—Unverified
Better Schedules for Low Precision Training of Deep Neural Networks	Mar 4, 2024	Node ClassificationQuantization	—Unverified
Beyond Discreteness: Finite-Sample Analysis of Straight-Through Estimator for Quantization	May 23, 2025	compressed sensingQuantization	—Unverified
Beyond Neighbourhood-Preserving Transformations for Quantization-Based Unsupervised Hashing	Oct 1, 2021	Quantization	—Unverified
Beyond Quantization: Power aware neural networks	Sep 29, 2021	Quantization	—Unverified
Beyond Task Vectors: Selective Task Arithmetic Based on Importance Metrics	Nov 25, 2024	Knowledge DistillationMulti-Task Learning	—Unverified
Beyond the Tip of Efficiency: Uncovering the Submerged Threats of Jailbreak Attacks in Small Language Models	Feb 27, 2025	Knowledge DistillationModel Compression	—Unverified
Beyond Throughput and Compression Ratios: Towards High End-to-end Utility of Gradient Compression	Jul 1, 2024	Quantization	—Unverified
BF-IMNA: A Bit Fluid In-Memory Neural Architecture for Neural Network Acceleration	Nov 3, 2024	Quantization	—Unverified
BICM-compatible Rate Adaptive Geometric Constellation Shaping Using Optimized Many-to-one Labeling	Nov 10, 2023	Quantization	—Unverified
Bielik 11B v2 Technical Report	May 5, 2025	Language ModelingLanguage Modelling	—Unverified
Bifocal Neural ASR: Exploiting Keyword Spotting for Inference Optimization	Aug 3, 2021	Inference OptimizationKeyword Spotting	—Unverified
SpeedLimit: Neural Architecture Search for Quantized Transformer Models	Sep 25, 2022	Neural Architecture SearchQuantization	—Unverified
BiLiMO: Bit-Limited MIMO Radar via Task-Based Quantization	Oct 1, 2020	Quantization	—Unverified
Bilinear Random Projections for Locality-Sensitive Binary Codes	Jun 3, 2015	Quantization	—Unverified
Binarized Neural Network for Single Image Super Resolution	Aug 1, 2020	BinarizationImage Super-Resolution	—Unverified
Binarizing Sparse Convolutional Networks for Efficient Point Cloud Analysis	Mar 27, 2023	BinarizationQuantization	—Unverified
BinaryBERT: Pushing the Limit of BERT Quantization	Dec 31, 2020	BinarizationModel Compression	—Unverified
Binary Constrained Deep Hashing Network for Image Retrieval without Manual Annotation	Feb 21, 2018	Deep HashingImage Retrieval	—Unverified
Binary Neural Network for Speaker Verification	Apr 6, 2021	BinarizationQuantization	—Unverified
Binary Neural Networks as a general-propose compute paradigm for on-device computer vision	Feb 8, 2022	QuantizationSuper-Resolution	—Unverified
BinaryViT: Towards Efficient and Accurate Binary Vision Transformers	May 24, 2023	BinarizationQuantization	—Unverified
Bioinspired Cortex-based Fast Codebook Generation	Jan 28, 2022	Anomaly DetectionBIG-bench Machine Learning	—Unverified
Biologically Plausible Learning on Neuromorphic Hardware Architectures	Dec 29, 2022	BenchmarkingQuantization	—Unverified
BiQGEMM: Matrix Multiplication with Lookup Table For Binary-Coding-based Quantized DNNs	May 20, 2020	Quantization	—Unverified
BiSup: Bidirectional Quantization Error Suppression for Large Language Models	May 24, 2024	parameter-efficient fine-tuningQuantization	—Unverified
BiTAT: Neural Network Binarization with Task-dependent Aggregated Transformation	Jul 4, 2022	BinarizationQuantization	—Unverified
Bit Efficient Quantization for Deep Neural Networks	Oct 7, 2019	ClusteringQuantization	—Unverified
Bit-Mixer: Mixed-precision networks with runtime bit-width selection	Mar 31, 2021	AutoMLBinarization	—Unverified
BitNet b1.58 Reloaded: State-of-the-art Performance Also on Smaller Networks	Jun 24, 2024	Quantization	—Unverified
BitPruning: Learning Bitlengths for Aggressive and Accurate Quantization	Feb 8, 2020	Quantization	—Unverified
BitsFusion: 1.99 bits Weight Quantization of Diffusion Model	Jun 6, 2024	Image Generationmodel	—Unverified
Bit-Shrinking: Limiting Instantaneous Sharpness for Improving Post-Training Quantization	Jan 1, 2023	Quantization	—Unverified
BitTTS: Highly Compact Text-to-Speech Using 1.58-bit Quantization and Weight Indexing	Jun 4, 2025	Quantizationtext-to-speech	—Unverified
Bi-ViT: Pushing the Limit of Vision Transformer Quantization	May 21, 2023	BinarizationQuantization	—Unverified
Blended Coarse Gradient Descent for Full Quantization of Deep Neural Networks	Aug 15, 2018	BinarizationQuantization	—Unverified
Blending Low and High-Level Semantics of Time Series for Better Masked Time Series Generation	Aug 29, 2024	QuantizationSelf-Supervised Learning	—Unverified
Blind-Adaptive Quantizers	Sep 6, 2024	Quantization	—Unverified
Block Modulating Video Compression: An Ultra Low Complexity Image Compression Encoder for Resource Limited Platforms	May 7, 2022	DecoderImage Compression	—Unverified
Blockwise Compression of Transformer-based Models without Retraining	Apr 4, 2023	Quantization	—Unverified
Block-Wise Dynamic-Precision Neural Network Training Acceleration via Online Quantization Sensitivity Analytics	Oct 31, 2022	QuantizationSensitivity	—Unverified
BlueLM-V-3B: Algorithm and System Co-Design for Multimodal Large Language Models on Mobile Devices	Nov 16, 2024	Quantization	—Unverified
BMPQ: Bit-Gradient Sensitivity Driven Mixed-Precision Quantization of DNNs from Scratch	Dec 24, 2021	QuantizationSensitivity	—Unverified
BOMP-NAS: Bayesian Optimization Mixed Precision NAS	Jan 27, 2023	Bayesian OptimizationNeural Architecture Search	—Unverified
Boost CTR Prediction for New Advertisements via Modeling Visual Content	Sep 23, 2022	Click-Through Rate PredictionPrediction	—Unverified
Boosted Dense Retriever	Dec 14, 2021	QuantizationRetrieval	—Unverified
Boosted Dense Retriever	Jan 16, 2022	QuantizationRetrieval	—Unverified
Boosting Distributed Full-graph GNN Training with Asynchronous One-bit Communication	Mar 2, 2023	GPUQuantization	—Unverified
Boost Vision Transformer with GPU-Friendly Sparsity and Quantization	May 18, 2023	BenchmarkingGPU	—Unverified

Show:10 25 50

← PrevPage 77 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified