Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3026–3050 of 4925 papers

Title	Date	Tasks	Status
The Sockeye 2 Neural Machine Translation Toolkit at AMTA 2020	Aug 11, 2020	CPUMachine Translation	—Unverified
The Synthesis of XNOR Recurrent Neural Networks with Stochastic Logic	Dec 1, 2019	Quantization	—Unverified
The Uniqueness of LLaMA3-70B Series with Per-Channel Quantization	Aug 27, 2024	Quantization	—Unverified
The Wavefunction of Continuous-Time Recurrent Neural Networks	Feb 13, 2021	Quantization	—Unverified
ThinK: Thinner Key Cache by Query-Driven Pruning	Jul 30, 2024	GPUQuantization	—Unverified
Three Quantization Regimes for ReLU Networks	May 3, 2024	Quantization	—Unverified
Through a Compressed Lens: Investigating the Impact of Quantization on LLM Explainability and Interpretability	May 20, 2025	counterfactualMemorization	—Unverified
Tiled Bit Networks: Sub-Bit Neural Network Compression Through Reuse of Learnable Binary Vectors	Jul 16, 2024	GPUNeural Network Compression	—Unverified
Time-Correlated Sparsification for Communication-Efficient Federated Learning	Jan 21, 2021	Federated LearningQuantization	—Unverified
Time regularization as a solution to mitigate quantization induced performance degradation	Oct 30, 2020	Quantization	—Unverified
Timestep-Aware Correction for Quantized Diffusion Models	Jul 4, 2024	AttributeNoise Estimation	—Unverified
Tiny but Accurate: A Pruned, Quantized and Optimized Memristor Crossbar Framework for Ultra Efficient DNN Implementation	Aug 27, 2019	Model CompressionQuantization	—Unverified
TinyissimoYOLO: A Quantized, Low-Memory Footprint, TinyML Object Detection Network for Low Power Microcontrollers	May 22, 2023	Objectobject-detection	—Unverified
TinyKG: Memory-Efficient Training Framework for Knowledge Graph Neural Recommender Systems	Dec 8, 2022	GPUKnowledge Graphs	—Unverified
TinyM^2Net: A Flexible System Algorithm Co-designed Multimodal Learning Framework for Tiny Devices	Feb 9, 2022	Classificationobject-detection	—Unverified
TinyM^2Net-V3: Memory-Aware Compressed Multimodal Deep Neural Networks for Sustainable Edge Deployment	May 20, 2024	Knowledge DistillationModel Compression	—Unverified
tinySNN: Towards Memory- and Energy-Efficient Spiking Neural Networks	Jun 17, 2022	Quantization	—Unverified
Tiny-VBF: Resource-Efficient Vision Transformer based Lightweight Beamformer for Ultrasound Single-Angle Plane Wave Imaging	Nov 20, 2023	Deep LearningQuantization	—Unverified
TinyVQA: Compact Multimodal Deep Neural Network for Visual Question Answering on Resource-Constrained Devices	Apr 4, 2024	QuantizationQuestion Answering	—Unverified
Tk-merge: Computationally Efficient Robust Clustering Under General Assumptions	Jan 17, 2022	ClusteringQuantization	—Unverified
TMPQ-DM: Joint Timestep Reduction and Quantization Precision Selection for Efficient Diffusion Models	Apr 15, 2024	DenoisingModel Optimization	—Unverified
To Compress, or Not to Compress: Characterizing Deep Learning Model Compression for Embedded Inference	Oct 21, 2018	Deep Learningimage-classification	—Unverified
ToneUnit: A Speech Discretization Approach for Tonal Language Speech Synthesis	Jun 13, 2024	QuantizationSpeech Synthesis	—Unverified
Topological Analysis for Detecting Anomalies (TADA) in Time Series	Jun 10, 2024	QuantizationTime Series	—Unverified
Topologically Controlled Lossy Compression	Feb 8, 2018	QuantizationTopological Data Analysis	—Unverified

Show:10 25 50

← PrevPage 122 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified