Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4701–4750 of 4925 papers

Title	Date	Tasks	Status
Generative Diffusion Models for Lattice Field Theory	Nov 6, 2023	Quantization	—Unverified
Generative QoE Modeling: A Lightweight Approach for Telecom Networks	Apr 30, 2025	Computational EfficiencyQuantization	—Unverified
Generative Semantic Communication for Text-to-Speech Synthesis	Oct 4, 2024	QuantizationSemantic Communication	—Unverified
Generative Zero-shot Network Quantization	Jan 21, 2021	Data Free QuantizationImage Generation	—Unverified
Geometry and clustering with metrics derived from separable Bregman divergences	Oct 25, 2018	ClusteringQuantization	—Unverified
Gesture2Text: A Generalizable Decoder for Word-Gesture Keyboards in XR Through Trajectory Coarse Discretization and Pre-training	Oct 8, 2024	DecoderQuantization	—Unverified
Getting Free Bits Back from Rotational Symmetries in LLMs	Oct 2, 2024	Quantization	—Unverified
GHN-QAT: Training Graph Hypernetworks to Predict Quantization-Robust Parameters of Unseen Limited Precision Neural Networks	Sep 24, 2023	Quantization	—Unverified
GHN-Q: Parameter Prediction for Unseen Quantized Convolutional Architectures via Graph Hypernetworks	Aug 26, 2022	Adversarial RobustnessParameter Prediction	—Unverified
GIF2Video: Color Dequantization and Temporal Interpolation of GIF images	Jan 9, 2019	Quantization	—Unverified
"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization	Nov 4, 2024	GPULarge Language Model	—Unverified
Givens Coordinate Descent Methods for Rotation Matrix Learning in Trainable Embedding Indexes	Mar 9, 2022	Quantization	—Unverified
Global-QSGD: Practical Floatless Quantization for Distributed Learning with Theoretical Guarantees	May 29, 2023	Quantization	—Unverified
Global synchronization of multi-agent systems with nonlinear interactions	Mar 13, 2025	Quantization	—Unverified
Goal-oriented compression for L_p-norm-type goal functions: Application to power consumption scheduling	May 13, 2024	Data CompressionQuantization	—Unverified
Goal-Oriented Quantization: Analysis, Design, and Application to Resource Allocation	Sep 30, 2022	Quantization	—Unverified
GOAT-TTS: Expressive and Realistic Speech Generation via A Dual-Branch LLM	Apr 15, 2025	QuantizationReading Comprehension	—Unverified
GOBO: Quantizing Attention-Based NLP Models for Low Latency and Energy Efficient Inference	May 8, 2020	Natural Language UnderstandingQuantization	—Unverified
Going Below and Beyond, Off-the-Grid Velocity Estimation from 1-bit Radar Measurements	Nov 10, 2020	Quantization	—Unverified
Going Further With Winograd Convolutions: Tap-Wise Quantization for Efficient Inference on 4x4 Tile	Sep 26, 2022	Quantization	—Unverified
Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages	Mar 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
gpcgc: a green point cloud geometry coding method	Feb 13, 2023	Quantization	—Unverified
GPLQ: A General, Practical, and Lightning QAT Method for Vision Transformers	Jun 13, 2025	Fine-Grained Image ClassificationQuantization	—Unverified
GPTQT: Quantize Large Language Models Twice to Push the Efficiency	Jul 3, 2024	Quantization	—Unverified
GPTVQ: The Blessing of Dimensionality for LLM Quantization	Feb 23, 2024	CPUQuantization	—Unverified
GQ-Net: Training Quantization-Friendly Deep Networks	Sep 25, 2019	Model CompressionQuantization	—Unverified
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference	Dec 23, 2024	GPULanguage Modeling	—Unverified
GradFreeBits: Gradient Free Bit Allocation for Dynamic Low Precision Neural Networks	Feb 18, 2021	Quantization	—Unverified
WaveQ: Gradient-Based Deep Quantization of Neural Networks through Sinusoidal Adaptive Regularization	Feb 29, 2020	Quantization	—Unverified
Gradient Based Method for the Fusion of Lattice Quantizers	Feb 9, 2025	Quantization	—Unverified
Gradient-Based Post-Training Quantization: Challenging the Status Quo	Aug 15, 2023	Quantization	—Unverified
Gradient Descent Quantizes ReLU Network Features	Mar 22, 2018	Quantization	—Unverified
Gradient Diversity: a Key Ingredient for Scalable Distributed Learning	Jun 18, 2017	DiversityQuantization	—Unverified
Gradient _1 Regularization for Quantization Robustness	Feb 18, 2020	Quantization	—Unverified
Gradient-Free Neural Network Training on the Edge	Oct 13, 2024	Quantization	—Unverified
Gradient Obfuscation Gives a False Sense of Security in Federated Learning	Jun 8, 2022	Federated Learningimage-classification	—Unverified
GradiVeQ: Vector Quantization for Bandwidth-Efficient Gradient Aggregation in Distributed CNN Training	Nov 8, 2018	Dimensionality ReductionQuantization	—Unverified
Gradual Binary Search and Dimension Expansion : A general method for activation quantization in LLMs	Apr 18, 2025	Quantization	—Unverified
Granger Causality from Quantized Measurements	Jun 3, 2021	Gaussian ProcessesQuantization	—Unverified
GranQ: Granular Zero-Shot Quantization with Channel-Wise Activation Scaling in QAT	Mar 24, 2025	Neural Network CompressionQuantization	—Unverified
Graph-Based Depth Denoising & Dequantization for Point Cloud Enhancement	Nov 9, 2021	DenoisingGraph Learning	—Unverified
Graph-Collaborated Auto-Encoder Hashing for Multi-view Binary Clustering	Jan 6, 2023	ClusteringQuantization	—Unverified
Greedy Selection for Heterogeneous Sensors	Jul 3, 2023	Quantization	—Unverified
Greener yet Powerful: Taming Large Code Generation Models with Quantization	Mar 9, 2023	Code GenerationCode Summarization	—Unverified
Green My LLM: Studying the key factors affecting the energy consumption of code assistants	Nov 7, 2024	Quantization	—Unverified
Green, Quantized Federated Learning over Wireless Networks: An Energy-Efficient Design	Jul 19, 2022	Federated LearningQuantization	—Unverified
Grid Based Nonlinear Filtering Revisited: Recursive Estimation & Asymptotic Optimality	Apr 10, 2016	Quantization	—Unverified
Gridless Angular Domain Channel Estimation for mmWave Massive MIMO System With One-Bit Quantization Via Approximate Message Passing	Sep 23, 2019	compressed sensingQuantization	—Unverified
Gridless Multisnapshot Variational Line Spectral Estimation from Coarsely Quantized Samples	Jun 20, 2019	Quantization	—Unverified
Group channel pruning and spatial attention distilling for object detection	Jun 2, 2023	Knowledge DistillationModel Compression	—Unverified

Show:10 25 50

← PrevPage 95 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified