Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3351–3400 of 4925 papers

Title	Date	Tasks	Status
1.58-bit FLUX	Dec 24, 2024	Computational EfficiencyImage Generation	—Unverified
ZOQO: Zero-Order Quantized Optimization	Jan 12, 2025	Quantization	—Unverified
Deep Learning on Mobile Devices - A Review	Mar 21, 2019	Cloud ComputingDeep Learning	—Unverified
Reconstruction of Privacy-Sensitive Data from Protected Templates	May 8, 2019	Privacy PreservingQuantization	—Unverified
2-bit Model Compression of Deep Convolutional Neural Network on ASIC Engine for Image Retrieval	May 8, 2019	Image RetrievalModel Compression	—Unverified
Unsupervised automatic classification of Scanning Electron Microscopy (SEM) images of CD4+ cells with varying extent of HIV virion infection	Apr 30, 2019	General ClassificationQuantization	—Unverified
DeepCABAC: Context-adaptive binary arithmetic coding for deep neural network compression	May 15, 2019	Neural Network CompressionQuantization	—Unverified
Efficient 8-Bit Quantization of Transformer Neural Machine Language Translation Model	Jun 3, 2019	CPUQuantization	—Unverified
Structured Binary Neural Networks for Image Recognition	Sep 22, 2019	object-detectionObject Detection	—Unverified
HAWKEYE: Adversarial Example Detector for Deep Neural Networks	Sep 22, 2019	Quantization	—Unverified
1-Bit Compressive Sensing for Efficient Federated Learning Over the Air	Mar 30, 2021	Compressive SensingDimensionality Reduction	—Unverified
1-bit Localization Scheme for Radar using Dithered Quantized Compressed Sensing	Jun 15, 2018	compressed sensingQuantization	—Unverified
1-bit Quantized On-chip Hybrid Diffraction Neural Network Enabled by Authentic All-optical Fully-connected Architecture	Apr 11, 2024	AllLesion Detection	—Unverified
1st-Order Dynamics on Nonlinear Agents for Resource Allocation over Uniformly-Connected Networks	Sep 10, 2021	Quantization	—Unverified
Breaking the Hourglass Phenomenon of Residual Quantization: Enhancing the Upper Bound of Generative Retrieval	Jul 31, 2024	QuantizationRecommendation Systems	—Unverified
CDFGNN: a Systematic Design of Cache-based Distributed Full-Batch Graph Neural Network Training with Communication Reduction	Aug 1, 2024	Graph Neural NetworkQuantization	—Unverified
UniMoT: Unified Molecule-Text Language Model with Discrete Token Representation	Aug 1, 2024	Language ModelingLanguage Modelling	—Unverified
Reclaiming Residual Knowledge: A Novel Paradigm to Low-Bit Quantization	Aug 1, 2024	Quantization	—Unverified
HMDN: Hierarchical Multi-Distribution Network for Click-Through Rate Prediction	Aug 2, 2024	Click-Through Rate PredictionMixture-of-Experts	—Unverified
STBLLM: Breaking the 1-Bit Barrier with Structured Binary LLMs	Aug 3, 2024	BinarizationComputational Efficiency	—Unverified
An approach to optimize inference of the DIART speaker diarization pipeline	Aug 5, 2024	Inference OptimizationKnowledge Distillation	—Unverified
Self-Supervised Learning for Multi-Channel Neural Transducer	Aug 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Synaptic Modulation using Interspike Intervals Increases Energy Efficiency of Spiking Neural Networks	Aug 6, 2024	Quantization	—Unverified
L3iTC at the FinLLM Challenge Task: Quantization for Financial Text Classification & Summarization	Aug 6, 2024	GPUQuantization	—Unverified
Inference Optimizations for Large Language Models: Effects, Challenges, and Practical Considerations	Aug 6, 2024	Knowledge DistillationNavigate	—Unverified
DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers	Aug 6, 2024	Model CompressionQuantization	—Unverified
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
A probabilistic framework for dynamic quantization	May 15, 2025	Quantization	—Unverified
Gaussian Weight Sampling for Scalable, Efficient and Stable Pseudo-Quantization Training	May 16, 2025	GPUQuantization	—Unverified
MARRS: Masked Autoregressive Unit-based Reaction Synthesis	May 16, 2025	Motion GenerationQuantization	—Unverified
QVGen: Pushing the Limit of Quantized Video Generative Models	May 16, 2025	Quantization	—Unverified
Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test	Jun 8, 2025	Quantization	—Unverified
Optimizing Learned Image Compression on Scalar and Entropy-Constraint Quantization	Jun 10, 2025	Image CompressionQuantization	—Unverified
POLARON: Precision-aware On-device Learning and Adaptive Runtime-cONfigurable AI acceleration	Jun 10, 2025	Quantization	—Unverified
Implementing Keyword Spotting on the MCUX947 Microcontroller with Integrated NPU	Jun 10, 2025	CPUKeyword Spotting	—Unverified
Discrete Audio Tokens: More Than a Survey!	Jun 12, 2025	Language ModelingLanguage Modelling	—Unverified
Starting Positions Matter: A Study on Better Weight Initialization for Neural Network Quantization	Jun 12, 2025	Quantization	—Unverified
2-bit Conformer quantization for automatic speech recognition	May 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
2-Bit Random Projections, NonLinear Estimators, and Approximate Near Neighbor Search	Feb 21, 2016	QuantizationRe-Ranking	—Unverified
2-in-1 Accelerator: Enabling Random Precision Switch for Winning Both Adversarial Robustness and Efficiency	Sep 11, 2021	Adversarial RobustnessQuantization	—Unverified
3D Gaussian Splatting Data Compression with Mixture of Priors	May 6, 2025	3DGSData Compression	—Unverified
3DMolNet: A Generative Network for Molecular Structures	Oct 8, 2020	QuantizationTranslation	—Unverified
3D Pathfinding and Collision Avoidance Using Uneven Search-space Quantization and Visual Cone Search	Jun 5, 2017	Collision AvoidanceQuantization	—Unverified
3DQ: Compact Quantized Neural Networks for Volumetric Whole Brain Segmentation	Apr 5, 2019	Brain SegmentationModel Compression	—Unverified
3D representation in 512-Byte:Variational tokenizer is the key for autoregressive 3D generation	Dec 3, 2024	3D GenerationImage Generation	—Unverified
3D Surface Detail Enhancement From a Single Normal Map	Oct 1, 2017	3D ReconstructionQuantization	—Unverified
3LC: Lightweight and Effective Traffic Compression for Distributed Machine Learning	Feb 21, 2018	BIG-bench Machine LearningData Compression	—Unverified
3U-EdgeAI: Ultra-Low Memory Training, Ultra-Low BitwidthQuantization, and Ultra-Low Latency Acceleration	May 11, 2021	Model CompressionQuantization	—Unverified
4-bit Quantization of LSTM-based Speech Recognition Models	Aug 27, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
4DGC: Rate-Aware 4D Gaussian Compression for Efficient Streamable Free-Viewpoint Video	Mar 24, 2025	3DGSQuantization	—Unverified

Show:10 25 50

← PrevPage 68 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified