Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1600 of 4925 papers

Title	Date	Tasks	Status	Score
Exploiting vulnerabilities of deep neural networks for privacy protection	Jul 19, 2020	Adversarial AttackQuantization	CodeCode Available	5
Exploring Embedding Methods in Binary Hyperdimensional Computing: A Case Study for Motor-Imagery based Brain-Computer Interfaces	Dec 13, 2018	Brain Computer InterfaceEEG	CodeCode Available	5
Exploiting the Partly Scratch-off Lottery Ticket for Quantization-Aware Training	Nov 12, 2022	Quantization	CodeCode Available	5
ExpandNet: A Deep Convolutional Neural Network for High Dynamic Range Expansion from Low Dynamic Range Content	Mar 6, 2018	inverse tone mappingInverse-Tone-Mapping	CodeCode Available	5
ACIQ: Analytical Clipping for Integer Quantization of neural networks	May 1, 2019	Quantization	CodeCode Available	5
Expansion Quantization Network: An Efficient Micro-emotion Annotation and Detection Framework	Nov 9, 2024	Emotion Detection and ClassificationQuantization	CodeCode Available	5
Exact Backpropagation in Binary Weighted Networks with Group Weight Transformations	Jul 3, 2021	BinarizationClassification with Binary Weight Network	CodeCode Available	5
CUCL: Codebook for Unsupervised Continual Learning	Nov 25, 2023	Continual LearningDiversity	CodeCode Available	5
A Physics-Informed Vector Quantized Autoencoder for Data Compression of Turbulent Flow	Jan 10, 2022	Data CompressionQuantization	CodeCode Available	5
Recursive CSI Quantization of Time-Correlated MIMO Channels by Deep Learning Classification	Sep 28, 2020	General ClassificationQuantization	CodeCode Available	5
Rediscovering Hashed Random Projections for Efficient Quantization of Contextualized Sentence Embeddings	Mar 13, 2023	QuantizationSentence	CodeCode Available	5
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available	5
Refining a k-nearest neighbor graph for a computationally efficient spectral clustering	Feb 22, 2023	ClusteringComputational Efficiency	CodeCode Available	5
Refining a -nearest neighbor graph for a computationally efficient spectral clustering	Feb 6, 2021	ClusteringComputational Efficiency	CodeCode Available	5
Explaining Reject Options of Learning Vector Quantization Classifiers	Feb 15, 2022	counterfactualQuantization	CodeCode Available	5
Evaluating Large Language Models on the Frame and Symbol Grounding Problems: A Zero-shot Benchmark	Jun 9, 2025	Quantization	CodeCode Available	5
Evaluating Quantized Large Language Models for Code Generation on Low-Resource Language Benchmarks	Oct 18, 2024	Code GenerationGPU	CodeCode Available	5
ES-ENAS: Efficient Evolutionary Optimization for Large Hybrid Search Spaces	Jan 19, 2021	Combinatorial OptimizationContinuous Control	CodeCode Available	5
A Transfer Learning and Explainable Solution to Detect mpox from Smartphones images	May 29, 2023	image-classificationImage Classification	CodeCode Available	5
Estimation and Restoration of Unknown Nonlinear Distortion using Diffusion	Jan 10, 2025	Audio Effects ModelingQuantization	CodeCode Available	5
Evaluating Single Event Upsets in Deep Neural Networks for Semantic Segmentation: an embedded system perspective	Dec 4, 2024	Autonomous DrivingQuantization	CodeCode Available	5
Error Correcting Output Codes Improve Probability Estimation and Adversarial Robustness of Deep Neural Networks	Dec 1, 2019	Adversarial DefenseAdversarial Robustness	CodeCode Available	5
Error Diffusion Halftoning Against Adversarial Examples	Jan 23, 2021	Adversarial RobustnessQuantization	CodeCode Available	5
Equal Bits: Enforcing Equally Distributed Binary Network Weights	Dec 2, 2021	BinarizationQuantization	CodeCode Available	5
Cross-Modal Discrete Representation Learning	Jun 10, 2021	Cross-Modal RetrievalQuantization	—Unverified	0
Atleus: Accelerating Transformers on the Edge Enabled by 3D Heterogeneous Manycore Architectures	Jan 16, 2025	Model CompressionQuantization	—Unverified	0
Cross-Layer Optimization for Fault-Tolerant Deep Learning	Dec 21, 2023	Bayesian OptimizationDeep Learning	—Unverified	0
Cross-Layer Discrete Concept Discovery for Interpreting Language Models	Jun 24, 2025	DiversityQuantization	—Unverified	0
A TinyML Platform for On-Device Continual Learning with Quantized Latent Replays	Oct 20, 2021	Continual LearningQuantization	—Unverified	0
AHCPTQ: Accurate and Hardware-Compatible Post-Training Quantization for Segment Anything Model	Mar 5, 2025	Instance SegmentationQuantization	—Unverified	0
Cross-Dataset Propensity Estimation for Debiasing Recommender Systems	Dec 22, 2022	Causal InferenceQuantization	—Unverified	0
Crop Disease Classification using Support Vector Machines with Green Chromatic Coordinate (GCC) and Attention based feature extraction for IoT based Smart Agricultural Applications	Nov 1, 2023	NutritionQuantization	—Unverified	0
A Tiny CNN Architecture for Medical Face Mask Detection for Resource-Constrained Endpoints	Nov 30, 2020	Quantization	—Unverified	0
Croesus: Multi-Stage Processing and Transactions for Video-Analytics in Edge-Cloud Systems	Dec 31, 2021	Model Compressionobject-detection	—Unverified	0
CREW: Computation Reuse and Efficient Weight Storage for Hardware-accelerated MLPs and RNNs	Jul 20, 2021	Quantization	—Unverified	0
A Gridless Compressive Sensing Based Channel Estimation for Millimeter Wave MIMO OFDM Systems with One-Bit Quantization	Aug 19, 2019	Compressive SensingQuantization	—Unverified	0
Achieving Robustness in Blind Modulo Analog-to-Digital Conversion	Dec 24, 2024	Quantization	—Unverified	0
CRB Analysis for Mixed-ADC Based DOA Estimation	Mar 14, 2024	QuantizationSparse Learning	—Unverified	0
Athena: Efficient Block-Wise Post-Training Quantization for Large Language Models Using Second-Order Matrix Derivative Information	May 24, 2024	Edge-computingMachine Translation	—Unverified	0
CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with Application to Disk Shape Analysis from Lumbar Spine MRI Images	Oct 17, 2020	Quantization	—Unverified	0
ATHEENA: A Toolflow for Hardware Early-Exit Network Automation	Apr 17, 2023	Quantization	—Unverified	0
CPT-V: A Contrastive Approach to Post-Training Quantization of Vision Transformers	Nov 17, 2022	QuantizationSelf-Supervised Learning	—Unverified	0
CPTQuant -- A Novel Mixed Precision Post-Training Quantization Techniques for Large Language Models	Dec 3, 2024	Language ModelingLanguage Modelling	—Unverified	0
A Targeted Acceleration and Compression Framework for Low bit Neural Networks	Jul 9, 2019	BinarizationComputational Efficiency	—Unverified	0
A Greedy Bit-flip Training Algorithm for Binarized Knowledge Graph Embeddings	Nov 1, 2020	Graph EmbeddingKnowledge Graph Completion	—Unverified	0
Achieving binary weight and activation for LLMs using Post-Training Quantization	Apr 7, 2025	Quantization	—Unverified	0
COVIDLite: A depth-wise separable deep neural network with white balance and CLAHE for detection of COVID-19	Jun 19, 2020	Binary ClassificationDiagnostic	—Unverified	0
Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression	Oct 8, 2024	Quantizationregression	—Unverified	0
A System-Level Solution for Low-Power Object Detection	Sep 24, 2019	CPUObject	—Unverified	0
Covariance Recovery for One-Bit Sampled Data With Time-Varying Sampling Thresholds-Part I: Stationary Signals	Mar 16, 2022	QuantizationRelation	—Unverified	0

Show:10 25 50

← PrevPage 32 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified