Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2401–2450 of 4925 papers

Title	Date	Tasks	Status
A White Paper on Neural Network Quantization	Jun 15, 2021	Quantization	—Unverified
Design Space Exploration of Low-Bit Quantized Neural Networks for Visual Place Recognition	Dec 14, 2023	QuantizationVisual Place Recognition	—Unverified
Large Deviation Upper Bounds and Improved MSE Rates of Nonlinear SGD: Heavy-tailed Noise and Power of Symmetry	Oct 21, 2024	Quantization	—Unverified
Just CHOP: Embarrassingly Simple LLM Compression	May 24, 2023	Knowledge DistillationLanguage Modeling	—Unverified
Large Language Models For Text Classification: Case Study And Comprehensive Review	Jan 14, 2025	ArticlesBinary Classification	—Unverified
AlphaTuning: Quantization-Aware Parameter-Efficient Adaptation of Large-Scale Pre-Trained Language Models	Oct 8, 2022	Language ModelingLanguage Modelling	—Unverified
Lightweight Clinical Decision Support System using QLoRA-Fine-Tuned LLMs and Retrieval-Augmented Generation	May 6, 2025	Disease PredictionQuantization	—Unverified
LAST: Language Model Aware Speech Tokenization	Sep 5, 2024	Language ModelingLanguage Modelling	—Unverified
Latency-Distortion Tradeoffs in Communicating Classification Results over Noisy Channels	Apr 22, 2024	NavigateQuantization	—Unverified
Intelligent Fault Diagnosis of Type and Severity in Low-Frequency, Low Bit-Depth Signals	Nov 9, 2024	Fault DiagnosisQuantization	—Unverified
Latent Representation Matters: Human-like Sketches in One-shot Drawing Tasks	Jun 10, 2024	Quantization	—Unverified
Lattice Functions for the Analysis of Analog-to-Digital Conversion	Mar 28, 2019	Quantization	—Unverified
Lattice Quantization	Sep 29, 2021	Quantization	—Unverified
Lattice Representation Learning	Sep 25, 2019	DecoderQuantization	—Unverified
Integrating PHY Security Into NDN-IoT Networks By Exploiting MEC: Authentication Efficiency, Robustness, and Accuracy Enhancement	Oct 29, 2019	Decision MakingEdge-computing	—Unverified
Deep neural networks are robust to weight binarization and other non-linear distortions	Jun 7, 2016	BinarizationData Augmentation	—Unverified
AWEQ: Post-Training Quantization with Activation-Weight Equalization for Large Language Models	Nov 2, 2023	Quantization	—Unverified
Layer-wise Quantization for Quantized Optimistic Dual Averaging	May 20, 2025	Quantization	—Unverified
LCDet: Low-Complexity Fully-Convolutional Neural Networks for Object Detection in Embedded Systems	May 16, 2017	Face Detectionimage-classification	—Unverified
LCQ: Low-Rank Codebook based Quantization for Large Language Models	May 31, 2024	Model CompressionQuantization	—Unverified
Deep neural networks algorithms for stochastic control problems on finite horizon: convergence analysis	Dec 11, 2018	Deep Reinforcement LearningQuantization	—Unverified
LDPC Decoding with Degree-Specific Neural Message Weights and RCQ Decoding	Oct 24, 2023	DecoderQuantization	—Unverified
Light Lies: Optical Adversarial Attack	Jun 18, 2021	Adversarial AttackClassification	—Unverified
LeanTTA: A Backpropagation-Free and Stateless Approach to Quantized Test-Time Adaptation on Edge Devices	Mar 20, 2025	QuantizationTest-time Adaptation	—Unverified
LightNobel: Improving Sequence Length Limitation in Protein Structure Prediction Model via Adaptive Activation Quantization	May 9, 2025	Protein FoldingProtein Structure Prediction	—Unverified
Learnable Companding Quantization for Accurate Low-bit Neural Networks	Mar 12, 2021	image-classificationImage Classification	—Unverified
Connecting Compression Spaces with Transformer for Approximate Nearest Neighbor Search	Jul 30, 2021	Feature CompressionInformation Retrieval	—Unverified
Integer Scale: A Free Lunch for Faster Fine-grained Quantization of LLMs	May 23, 2024	Quantization	—Unverified
Deep neural networks algorithms for stochastic control problems on finite horizon: numerical applications	Dec 13, 2018	ManagementQuantization	—Unverified
Learned layered coding for Successive Refinement in the Wyner-Ziv Problem	Nov 6, 2023	Quantization	—Unverified
Deep Neural Network Models Compression	Mar 4, 2021	Knowledge DistillationQuantization	—Unverified
Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models	May 21, 2023	GPUQuantization	—Unverified
A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Series	Dec 1, 2024	ImputationQuantization	—Unverified
A Low Memory Footprint Quantized Neural Network for Depth Completion of Very Sparse Time-of-Flight Depth Maps	May 25, 2022	DecoderDepth Completion	—Unverified
Lightweight Change Detection in Heterogeneous Remote Sensing Images with Online All-Integer Pruning Training	May 3, 2024	AllChange Detection	—Unverified
BELT:Bootstrapping Electroencephalography-to-Language Decoding and Zero-Shot Sentiment Classification by Natural Language Supervision	Sep 21, 2023	Brain DecodingContrastive Learning	—Unverified
Learning A Deep _ Encoder for Hashing	Apr 6, 2016	Quantization	—Unverified
Learning A Disentangling Representation For PU Learning	Oct 5, 2023	ClusteringDensity Estimation	—Unverified
Lightweight Compression of Intermediate Neural Network Features for Collaborative Intelligence	May 15, 2021	object-detectionObject Detection	—Unverified
Integer-only Quantized Transformers for Embedded FPGA-based Time-series Forecasting in AIoT	Jul 6, 2024	QuantizationTime Series	—Unverified
Learning a Single Tucker Decomposition Network for Lossy Image Compression with Multiple Bits-Per-Pixel Rates	Jul 10, 2018	DecoderImage Compression	—Unverified
Learning a Virtual Codec Based on Deep Convolutional Neural Network to Compress Image	Dec 16, 2017	BlockingImage Compression	—Unverified
An Adaptive Statistical Non-uniform Quantizer for Detail Wavelet Components in Lossy JPEG2000 Image Compression	May 9, 2013	Image CompressionQuantization	—Unverified
Learning-Based Dequantization For Image Restoration Against Extremely Poor Illumination	Mar 5, 2018	Image EnhancementImage Restoration	—Unverified
Constrained Deep Reinforcement Learning for Fronthaul Compression Optimization	Sep 26, 2023	Deep Reinforcement LearningQuantization	—Unverified
Learning-Based Latency-Constrained Fronthaul Compression Optimization in C-RAN	Nov 7, 2023	Deep Reinforcement LearningQuantization	—Unverified
A Lottery Ticket Hypothesis Framework for Low-Complexity Device-Robust Neural Acoustic Scene Classification	Jul 3, 2021	Acoustic Scene ClassificationData Augmentation	—Unverified
LG-VQ: Language-Guided Codebook Learning	May 23, 2024	Image CaptioningImage Generation	—Unverified
Integer-arithmetic-only Certified Robustness for Quantized Neural Networks	Aug 21, 2021	Quantization	—Unverified
A Vision System for Multi-View Face Recognition	Jun 1, 2017	Face RecognitionQuantization	—Unverified

Show:10 25 50

← PrevPage 49 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified