Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 4925 papers

Title	Date	Tasks	Status	Score
Lipschitz Continuity Retained Binary Neural Network	Jul 13, 2022	BinarizationQuantization	CodeCode Available	5
LISA: Learning Interpretable Skill Abstractions from Language	Feb 28, 2022	Decision MakingImitation Learning	CodeCode Available	5
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available	5
Characteristics of networks generated by kernel growing neural gas	Aug 16, 2023	ClusteringQuantization	CodeCode Available	5
Linearly Converging Error Compensated SGD	Oct 23, 2020	Quantization	CodeCode Available	5
Adaptive Prediction-Powered AutoEval with Reliability and Efficiency Guarantees	May 24, 2025	Quantization	CodeCode Available	5
Channel-wise Mixed-precision Assignment for DNN Inference on Constrained Edge Nodes	Jun 17, 2022	Neural Architecture SearchQuantization	CodeCode Available	5
Lightweight Client-Side Chinese/Japanese Morphological Analyzer Based on Online Learning	Aug 1, 2014	Domain AdaptationMorphological Analysis	CodeCode Available	5
Lightweight Deep Learning Based Channel Estimation for Extremely Large-Scale Massive MIMO Systems	Feb 14, 2024	Quantization	CodeCode Available	5
Light Multi-segment Activation for Model Compression	Jul 16, 2019	Knowledge Distillationmodel	CodeCode Available	5
Low-complexity acoustic scene classification for multi-device audio: analysis of DCASE 2021 Challenge systems	May 28, 2021	Acoustic Scene ClassificationQuantization	CodeCode Available	5
Leveraging Continuously Differentiable Activation Functions for Learning in Quantized Noisy Environments	Feb 4, 2024	Quantization	CodeCode Available	5
An Underexplored Dilemma between Confidence and Calibration in Quantized Neural Networks	Nov 10, 2021	Decision MakingQuantization	CodeCode Available	5
LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text	May 30, 2025	Quantization	CodeCode Available	5
Learning to Seek: Autonomous Source Seeking with Deep Reinforcement Learning Onboard a Nano Drone Microcontroller	Sep 25, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	5
Central Similarity Quantization for Efficient Image and Video Retrieval	Aug 1, 2019	QuantizationRetrieval	CodeCode Available	5
Accelerating and Compressing Deep Neural Networks for Massive MIMO CSI Feedback	Jan 20, 2023	Model CompressionNetwork Pruning	CodeCode Available	5
Learning Space Partitions for Nearest Neighbor Search	Jan 24, 2019	General Classificationgraph partitioning	CodeCode Available	5
Learning Physical-Layer Communication with Quantized Feedback	Apr 19, 2019	Quantization	CodeCode Available	5
Learning Semantic Textual Similarity via Topic-informed Discrete Latent Variables	Nov 7, 2022	Language ModelingLanguage Modelling	CodeCode Available	5
Automatic Neural Network Compression by Sparsity-Quantization Joint Learning: A Constrained Optimization-based Approach	Oct 14, 2019	Neural Network CompressionQuantization	CodeCode Available	5
Learning Convolutional Transforms for Lossy Point Cloud Geometry Compression	Mar 20, 2019	Binary ClassificationMixed Reality	CodeCode Available	5
Causal-DFQ: Causality Guided Data-free Network Quantization	Sep 24, 2023	Data Free QuantizationNeural Network Compression	CodeCode Available	5
Cauchy-Schwarz Regularizers	Mar 3, 2025	Quantization	CodeCode Available	5
Large Scale Clustering with Variational EM for Gaussian Mixture Models	Oct 1, 2018	BenchmarkingClustering	CodeCode Available	5
Learning Frequency-Specific Quantization Scaling in VVC for Standard-Compliant Task-driven Image Coding	Jan 20, 2023	Quantization	CodeCode Available	5
LFZip: Lossy compression of multivariate floating-point time series data via improved prediction	Nov 1, 2019	Data CompressionQuantization	CodeCode Available	5
CAT: Compression-Aware Training for bandwidth reduction	Sep 25, 2019	Quantization	CodeCode Available	5
CASP: Compression of Large Multimodal Models Based on Attention Sparsity	Mar 7, 2025	Model CompressionQuantization	CodeCode Available	5
An Overview of Arithmetic Adaptations for Inference of Convolutional Neural Networks on Re-configurable Hardware	May 19, 2025	Quantization	CodeCode Available	5
Cartesian K-Means	Jun 1, 2013	ClusteringObject Recognition	CodeCode Available	5
Adaptive Loss-aware Quantization for Multi-bit Networks	Dec 18, 2019	Quantization	CodeCode Available	5
Learning Bag-of-Features Pooling for Deep Convolutional Neural Networks	Jul 25, 2017	General ClassificationQuantization	CodeCode Available	5
Learning Accurate Performance Predictors for Ultrafast Automated Model Compression	Apr 13, 2023	image-classificationImage Classification	CodeCode Available	5
Accelerated Nearest Neighbor Search with Quick ADC	Apr 24, 2017	QuantizationRetrieval	CodeCode Available	5
Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization	Aug 3, 2017	Quantization	CodeCode Available	5
Learning compact binary descriptors with unsupervised deep neural networks	Jun 1, 2016	Image RetrievalObject	CodeCode Available	5
Langevin dynamics based algorithm e-THO POULA for stochastic optimization problems with discontinuous stochastic gradient	Oct 24, 2022	Portfolio OptimizationQuantization	CodeCode Available	5
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available	5
Learned transform compression with optimized entropy encoding	Apr 7, 2021	Quantization	CodeCode Available	5
Learning Compression from Limited Unlabeled Data	Sep 1, 2018	CPUGPU	CodeCode Available	5
KP2Dtiny: Quantized Neural Keypoint Detection and Description on the Edge	Jul 7, 2023	Homography EstimationKeypoint Detection	CodeCode Available	5
Just Round: Quantized Observation Spaces Enable Memory Efficient Learning of Dynamic Locomotion	Oct 14, 2022	Deep Reinforcement LearningQuantization	CodeCode Available	5
JPEG Inspired Deep Learning	Oct 9, 2024	Deep LearningFine-Grained Image Classification	CodeCode Available	5
Joint Maximum Purity Forest with Application to Image Super-Resolution	Aug 30, 2017	ClusteringGeneral Classification	CodeCode Available	5
BRIDLE: Generalized Self-supervised Learning with Quantization	Feb 4, 2025	image-classificationImage Classification	CodeCode Available	5
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks	Jul 1, 2024	Quantization	CodeCode Available	5
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference	Feb 6, 2025	Mathematical ReasoningQuantization	CodeCode Available	5
Forward and Backward Information Retention for Accurate Binary Neural Networks	Sep 24, 2019	BinarizationNeural Network Compression	CodeCode Available	5
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models	Feb 18, 2025	Quantization	CodeCode Available	5

Show:10 25 50

← PrevPage 23 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified