Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3100 of 4925 papers

Title	Date	Tasks	Status
Energy Efficient Federated Learning over Heterogeneous Mobile Devices via Joint Design of Weight Quantization and Wireless Transmission	Dec 21, 2020	Edge-computingFederated Learning	—Unverified
Toward a Diffusion-Based Generalist for Dense Vision Tasks	Jun 29, 2024	Conditional Image GenerationImage Generation	—Unverified
Toward Compact Parameter Representations for Architecture-Agnostic Neural Network Compression	Nov 19, 2021	Neural Network CompressionQuantization	—Unverified
Toward Efficient Deep Spiking Neuron Networks:A Survey On Compression	Jun 3, 2024	Knowledge DistillationQuantization	—Unverified
Toward Efficient Low-Precision Training: Data Format Optimization and Hysteresis Quantization	Sep 29, 2021	Quantization	—Unverified
Toward Extremely Low Bit and Lossless Accuracy in DNNs with Progressive ADMM	May 2, 2019	Model CompressionQuantization	—Unverified
Toward Fast and Accurate Neural Chinese Word Segmentation with Multi-Criteria Learning	Mar 11, 2019	Chinese Word SegmentationCompiler Optimization	—Unverified
Toward INT4 Fixed-Point Training via Exploring Quantization Error for Gradients	Jul 17, 2024	image-classificationImage Classification	—Unverified
Toward Joint Image Generation and Compression using Generative Adversarial Networks	Jan 23, 2019	Generative Adversarial NetworkImage Compression	—Unverified
Toward nonlinear dynamic control over encrypted data for infinite time horizon	Oct 12, 2021	Quantization	—Unverified
Towards Accurate and Efficient Sub-8-Bit Integer Training	Nov 17, 2024	CPUGPU	—Unverified
Towards Accurate and High-Speed Spiking Neuromorphic Systems with Data Quantization-Aware Deep Networks	May 8, 2018	Quantization	—Unverified
Towards Accurate Post-Training Quantization for Vision Transformer	Mar 25, 2023	Model CompressionQuantization	—Unverified
Towards Accurate Quantization and Pruning via Data-free Knowledge Transfer	Oct 14, 2020	Data Free QuantizationQuantization	—Unverified
Towards AI-Native Fronthaul: Neural Compression for NextG Cloud RAN	Jun 7, 2025	Quantization	—Unverified
Towards a tailored mixed-precision sub-8-bit quantization scheme for Gated Recurrent Units using Genetic Algorithms	Feb 19, 2024	Model CompressionQuantization	—Unverified
Towards Cheaper Inference in Deep Networks with Lower Bit-Width Accumulators	Jan 25, 2024	Quantization	—Unverified
Towards Clip-Free Quantized Super-Resolution Networks: How to Tame Representative Images	Aug 22, 2023	QuantizationSuper-Resolution	—Unverified
Towards Compact and Fast Neural Machine Translation Using a Combined Method	Sep 1, 2017	Language ModelingLanguage Modelling	—Unverified
Towards Effective 2-bit Quantization: Pareto-optimal Bit Allocation for Deep CNNs Compression	Sep 25, 2019	Quantization	—Unverified
Towards efficient deep autoencoders for multivariate time series anomaly detection	Mar 4, 2024	Anomaly DetectionModel Compression	—Unverified
Towards Efficient Full 8-bit Integer DNN Online Training on Resource-limited Devices without Batch Normalization	May 27, 2021	Model CompressionQuantization	—Unverified
Towards Efficient In-memory Computing Hardware for Quantized Neural Networks: State-of-the-art, Open Challenges and Perspectives	Jul 8, 2023	Quantization	—Unverified
Towards Efficient Post-training Quantization of Pre-trained Language Models	Sep 30, 2021	Quantization	—Unverified
Towards Efficient Pre-training: Exploring FP4 Precision in Large Language Models	Feb 17, 2025	Quantization	—Unverified
Towards Energy-Efficient and Secure Edge AI: A Cross-Layer Framework	Sep 20, 2021	Quantization	—Unverified
Towards Energy Efficient Federated Learning over 5G+ Mobile Devices	Jan 13, 2021	Federated LearningGPU	—Unverified
HYPER-SNN: Towards Energy-efficient Quantized Deep Spiking Neural Networks for Hyperspectral Image Classification	Jul 26, 2021	Computational EfficiencyHyperspectral Image Classification	—Unverified
Towards Fast and Accurate Neural Chinese Word Segmentation with Multi-Criteria Learning	Dec 1, 2020	Chinese Word SegmentationCompiler Optimization	—Unverified
Towards Fully 8-bit Integer Inference for the Transformer Model	Sep 17, 2020	Language ModellingQuantization	—Unverified
Towards Hardware-Specific Automatic Compression of Neural Networks	Dec 15, 2022	Quantizationreinforcement-learning	—Unverified
Towards Improved Text-Aligned Codebook Learning: Multi-Hierarchical Codebook-Text Alignment with Long Text	Mar 3, 2025	Image GenerationQuantization	—Unverified
Towards Intelligent Millimeter and Terahertz Communication for 6G: Computer Vision-aided Beamforming	Sep 6, 2022	ManagementQuantization	—Unverified
Towards Learning Discrete Representations via Self-Supervision for Wearables-Based Human Activity Recognition	Jun 1, 2023	Activity RecognitionHuman Activity Recognition	—Unverified
Towards Lightweight Speaker Verification via Adaptive Neural Network Quantization	Jun 8, 2024	QuantizationSpeaker Verification	—Unverified
Towards Low-bit Communication for Tensor Parallel LLM Inference	Nov 12, 2024	Language ModelingLanguage Modelling	—Unverified
Exploring the Potential of Low-bit Training of Convolutional Neural Networks	Jun 4, 2020	Quantization	—Unverified
Towards Low-loss 1-bit Quantization of User-item Representations for Top-K Recommendation	Dec 3, 2021	QuantizationRecommendation Systems	—Unverified
Towards Mixed-Precision Quantization of Neural Networks via Constrained Optimization	Oct 13, 2021	Multiple-choiceQuantization	—Unverified
Model-Free Learning for the Linear Quadratic Regulator over Rate-Limited Channels	Jan 2, 2024	Quantization	—Unverified
Towards Neural Variational Monte Carlo That Scales Linearly with System Size	Dec 21, 2022	QuantizationVariational Monte Carlo	—Unverified
Towards Next-Level Post-Training Quantization of Hyper-Scale Transformers	Feb 14, 2024	Quantization	—Unverified
Towards On-Device Face Recognition in Body-worn Cameras	Apr 7, 2021	Face IdentificationFace Recognition	—Unverified
Towards Optimal Compression: Joint Pruning and Quantization	Feb 15, 2023	Model CompressionNeural Architecture Search	—Unverified
Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-training and Multi-modal Tokens	Sep 15, 2023	Image ComprehensionLanguage Modeling	—Unverified
Towards Practical Single-shot Phase Retrieval with Physics-Driven Deep Neural Network	Aug 18, 2022	QuantizationRetrieval	—Unverified
Towards Real-Time Neural Video Codec for Cross-Platform Application Using Calibration Information	Sep 20, 2023	GPUQuantization	—Unverified
Towards Real-Time Neural Volumetric Rendering on Mobile Devices: A Measurement Study	Jun 23, 2024	NeRFQuantization	—Unverified
Towards Reasoning Ability of Small Language Models	Feb 17, 2025	Quantization	—Unverified
Towards Robust Low Light Image Enhancement	May 17, 2022	Image EnhancementLow-Light Image Enhancement	—Unverified

Show:10 25 50

← PrevPage 62 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified