Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3601–3650 of 4925 papers

Title	Date	Tasks	Status
Neural Network-based OFDM Receiver for Resource Constrained IoT Devices	May 12, 2022	Quantization	—Unverified
Neural Network-based Quantization for Network Automation	Mar 4, 2021	Anomaly DetectionDeep Learning	—Unverified
Neural Network Compression using Binarization and Few Full-Precision Weights	Jun 15, 2023	BinarizationCPU	—Unverified
Neural Network Emulation of the Classical Limit in Quantum Systems via Learned Observable Mappings	Apr 15, 2025	PhilosophyQuantization	—Unverified
Neural Network-Inspired Analog-to-Digital Conversion to Achieve Super-Resolution with Low-Precision RRAM Devices	Nov 28, 2019	QuantizationRobust Design	—Unverified
Neural Network Quantization for Efficient Inference: A Survey	Dec 8, 2021	QuantizationSurvey	—Unverified
Neural Network Quantization with AI Model Efficiency Toolkit (AIMET)	Jan 20, 2022	Model OptimizationQuantization	—Unverified
Neural Networks: According to the Principles of Grassmann Algebra	Mar 20, 2025	Quantization	—Unverified
Neural Networks Compression for Language Modeling	Aug 20, 2017	Language ModelingLanguage Modelling	—Unverified
Neural Networks Weights Quantization: Target None-retraining Ternary (TNT)	Dec 18, 2019	Quantization	—Unverified
Neural Network Training on In-memory-computing Hardware with Radix-4 Gradients	Mar 9, 2022	Quantization	—Unverified
Neural-PIM: Efficient Processing-In-Memory with Neural Approximation of Peripherals	Jan 30, 2022	Quantization	—Unverified
Neural Video Compression with Feature Modulation	Feb 27, 2024	BlockingQuantization	—Unverified
Neuroevolution-Enhanced Multi-Objective Optimization for Mixed-Precision Quantization	Jun 14, 2021	Quantization	—Unverified
Neuromimetic Linear Systems -- Resilience and Learning	May 10, 2022	Combinatorial OptimizationQ-Learning	—Unverified
New Loss Functions for Fast Maximum Inner Product Search	Jan 1, 2020	BenchmarkingQuantization	—Unverified
New pyramidal hybrid textural and deep features based automatic skin cancer classification model: Ensemble DarkNet and textural feature extractor	Mar 28, 2022	Cancer ClassificationQuantization	—Unverified
NGEMM: Optimizing GEMM for Deep Learning via Compiler-based Techniques	Oct 1, 2019	Deep LearningQuantization	—Unverified
n-hot: Efficient bit-level sparsity for powers-of-two neural network quantization	Mar 22, 2021	object-detectionObject Detection	—Unverified
Noiseless Privacy	Oct 29, 2019	Privacy PreservingQuantization	—Unverified
Noise Sensitivity-Based Energy Efficient and Robust Adversary Detection in Neural Networks	Jan 5, 2021	QuantizationSensitivity	—Unverified
NoiseVC: Towards High Quality Zero-Shot Voice Conversion	Apr 13, 2021	DisentanglementQuantization	—Unverified
Noisy One-bit Compressed Sensing with Side-Information	Jun 9, 2020	compressed sensingQuantization	—Unverified
Nonlinear Perturbation-based Non-Convex Optimization over Time-Varying Networks	Aug 5, 2024	Quantization	—Unverified
Non-linear predictive vector quantization of speech	Mar 7, 2022	Quantization	—Unverified
Nonlinear Sparse Bayesian Learning Methods with Application to Massive MIMO Channel Estimation with Hardware Impairments	Jun 4, 2025	Quantization	—Unverified
Nonlinear Stochastic Gradient Descent and Heavy-tailed Noise: A Unified Framework and High-probability Guarantees	Oct 17, 2024	Quantization	—Unverified
Nonparametric Decentralized Detection and Sparse Sensor Selection via Multi-Sensor Online Kernel Scalar Quantization	May 21, 2022	ClassificationQuantization	—Unverified
Non-Structured DNN Weight Pruning -- Is It Beneficial in Any Platform?	Jul 3, 2019	Model CompressionQuantization	—Unverified
Non-vacuous Generalization Bounds for Deep Neural Networks without any modification to the trained models	Mar 10, 2025	Generalization BoundsQuantization	—Unverified
Non-Volatile Memory Array Based Quantization- and Noise-Resilient LSTM Neural Networks	Feb 25, 2020	Edge-computingGPU	—Unverified
Norm Tweaking: High-performance Low-bit Quantization of Large Language Models	Sep 6, 2023	Model CompressionQuantization	—Unverified
No Token Left Behind: Reliable KV Cache Compression via Importance-Aware Mixed Precision Quantization	Feb 28, 2024	Quantization	—Unverified
Novel Near-Optimal Scalar Quantizers with Exponential Decay Rate and Global Convergence	Feb 18, 2019	Quantization	—Unverified
NQKV: A KV Cache Quantization Scheme Based on Normal Distribution Characteristics	May 22, 2025	Quantization	—Unverified
NSNQuant: A Double Normalization Approach for Calibration-Free Low-Bit Vector Quantization of KV Cache	May 23, 2025	Language ModelingLanguage Modelling	—Unverified
NTP : A Neural Network Topology Profiler	May 22, 2019	BenchmarkingQuantization	—Unverified
NUPES : Non-Uniform Post-Training Quantization via Power Exponent Search	Aug 10, 2023	Quantization	—Unverified
NUQSGD: Provably Communication-efficient Data-parallel SGD via Nonuniform Quantization	Apr 28, 2021	Quantization	—Unverified
NVRC: Neural Video Representation Compression	Sep 11, 2024	Model CompressionQuantization	—Unverified
O(1) Communication for Distributed SGD through Two-Level Gradient Averaging	Jun 12, 2020	QuantizationVocal Bursts Valence Prediction	—Unverified
OAC: Output-adaptive Calibration for Accurate Post-training Quantization	May 23, 2024	Quantization	—Unverified
Oaken: Fast and Efficient LLM Serving with Online-Offline Hybrid KV Cache Quantization	Mar 24, 2025	GPULarge Language Model	—Unverified
oBERTa: Improving Sparse Transfer Learning via improved initialization, distillation, and pruning regimes	Mar 30, 2023	Knowledge DistillationModel Compression	—Unverified
Object Detection-Based Variable Quantization Processing	Sep 1, 2020	MS-SSIMObject	—Unverified
Object Proposal Generation using Two-Stage Cascade SVMs	Jul 20, 2014	Computational EfficiencyObject	—Unverified
ODG-Q: Robust Quantization via Online Domain Generalization	Oct 17, 2022	Domain GeneralizationQuantization	—Unverified
Tighter Regret Analysis and Optimization of Online Federated Learning	May 13, 2022	Federated LearningQuantization	—Unverified
On-Chip Hardware-Aware Quantization for Mixed Precision Neural Networks	Sep 5, 2023	Quantization	—Unverified
Oh! We Freeze: Improving Quantized Knowledge Distillation via Signal Propagation Analysis for Large Language Models	Mar 26, 2024	Knowledge DistillationQuantization	—Unverified

Show:10 25 50

← PrevPage 73 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified