Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3600 of 4925 papers

Title	Date	Tasks	Status
Multilinear Hyperplane Hashing	Jun 1, 2016	Active LearningQuantization	—Unverified
Multi-modality Deep Restoration of Extremely Compressed Face Videos	Jul 5, 2021	Quantization	—Unverified
MOHAQ: Multi-Objective Hardware-Aware Quantization of Recurrent Neural Networks	Aug 2, 2021	Quantizationspeech-recognition	—Unverified
Multiple yield curve modelling with CBI processes	Nov 7, 2019	Quantization	—Unverified
Multi-Prize Lottery Ticket Hypothesis: Finding Generalizable and Efficient Binary Subnetworks in a Randomly Weighted Neural Network	Jan 1, 2021	Quantization	—Unverified
Multi-rate adaptive transform coding for video compression	Oct 25, 2022	Data CompressionQuantization	—Unverified
Multirate Neural Image Compression with Adaptive Lattice Vector Quantization	Jan 1, 2025	Domain AdaptationImage Compression	—Unverified
Multiresolution Signal Processing of Financial Market Objects	Oct 28, 2022	Quantization	—Unverified
Multi-Sample Training for Neural Image Compression	Sep 28, 2022	Image CompressionQuantization	—Unverified
Multiscale Augmented Normalizing Flows for Image Compression	May 9, 2023	Image CompressionQuantization	—Unverified
Multiscale Quantization for Fast Similarity Search	Dec 1, 2017	Quantization	—Unverified
Multi-Scale Vector Quantization with Reconstruction Trees	Jul 8, 2019	Quantization	—Unverified
Multi-target regression via output space quantization	Mar 22, 2020	Computational EfficiencyMulti-target regression	—Unverified
Multi-Task Network Pruning and Embedded Optimization for Real-time Deployment in ADAS	Jan 19, 2021	Network Pruningobject-detection	—Unverified
Multi-user Downlink Beamforming using Uplink Downlink Duality with 1-bit Converters for Flat Fading Channels	Jun 29, 2022	Quantization	—Unverified
Multi-user Downlink Beamforming using Uplink Downlink Duality with CEQs for Frequency Selective Channels	Aug 1, 2022	Quantization	—Unverified
Multiuser-MIMO Systems Using Comparator Network-Aided Receivers With 1-Bit Quantization	Nov 18, 2022	Quantization	—Unverified
Self-supervised Remote Sensing Images Change Detection at Pixel-level	May 18, 2021	Change DetectionContrastive Learning	—Unverified
Muon-Accelerated Attention Distillation for Real-Time Edge Synthesis via Optimized Latent Diffusion	Apr 11, 2025	Image GenerationQuantization	—Unverified
Music Source Separation in the Waveform Domain	Nov 27, 2019	Audio GenerationAudio Synthesis	—Unverified
Mutual Quantization for Cross-Modal Search With Noisy Labels	Jan 1, 2022	Quantization	—Unverified
MuZero with Self-competition for Rate Control in VP9 Video Compression	Feb 14, 2022	Decision MakingQuantization	—Unverified
MVQ:Towards Efficient DNN Compression and Acceleration with Masked Vector Quantization	Dec 13, 2024	image-classificationImage Classification	—Unverified
MWQ: Multiscale Wavelet Quantized Neural Networks	Mar 9, 2021	Model CompressionQuantization	—Unverified
Nanometer Scanning with Micrometer Sensing: Beating Quantization Constraints in Lissajous Trajectory Tracking	Apr 7, 2024	Quantization	—Unverified
Nanoscaling Floating-Point (NxFP): NanoMantissa, Adaptive Microexponents, and Code Recycling for Direct-Cast Compression of Large Language Models	Dec 15, 2024	MMLUQuantization	—Unverified
N-Ary Quantization for CNN Model Compression and Inference Acceleration	May 1, 2019	ClusteringModel Compression	—Unverified
Nash equilibrium of multi-agent graphical game with a privacy information encrypted learning algorithm	Oct 29, 2021	Quantization	—Unverified
Natural Compression for Distributed Deep Learning	May 27, 2019	Deep LearningQuantization	—Unverified
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified
NAWQ-SR: A Hybrid-Precision NPU Engine for Efficient On-Device Super-Resolution	Dec 15, 2022	CPUQuantization	—Unverified
NDVQ: Robust Neural Audio Codec with Normal Distribution-Based Vector Quantization	Sep 19, 2024	Audio CompressionAudio Generation	—Unverified
Nearest neighbor search with compact codes: A decoder perspective	Dec 17, 2021	DecoderQuantization	—Unverified
NeRFCodec: Neural Feature Compression Meets Neural Radiance Fields for Memory-Efficient Scene Representation	Apr 2, 2024	DecoderFeature Compression	—Unverified
Nested Dithered Quantization for Communication Reduction in Distributed Training	May 1, 2019	Quantization	—Unverified
NestQuant: Nested Lattice Quantization for Matrix Products and LLMs	Feb 13, 2025	Quantization	—Unverified
NETWORK COMPRESSION FOR MACHINE-LEARNT FLUID SIMULATIONS	Mar 4, 2021	Physics-informed machine learningQuantization	—Unverified
Network Memory Footprint Compression Through Jointly Learnable Codebooks and Mappings	Sep 29, 2023	Quantization	—Unverified
Network Pruning for Low-Rank Binary Index	Sep 25, 2019	Model CompressionNetwork Pruning	—Unverified
Network reconstruction via the minimum description length principle	May 2, 2024	Bayesian InferenceQuantization	—Unverified
Neural Architecture Codesign for Fast Bragg Peak Analysis	Dec 10, 2023	AutoMLModel Compression	—Unverified
Neural Cache: Bit-Serial In-Cache Acceleration of Deep Neural Networks	May 9, 2018	CPUGPU	—Unverified
Neural Compression-Based Feature Learning for Video Restoration	Mar 17, 2022	DenoisingQuantization	—Unverified
Neural gradients are near-lognormal: improved quantized and sparse training	Jun 15, 2020	Neural Network CompressionQuantization	—Unverified
NeuralGS: Bridging Neural Fields and 3D Gaussian Splatting for Compact 3D Representations	Mar 29, 2025	3DGSNeRF	—Unverified
Neural Image Compression with Quantization Rectifier	Mar 25, 2024	Feature CorrelationImage Compression	—Unverified
Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG Encoder-Decoder	Jan 27, 2022	DecoderImage Compression	—Unverified
Neural Machine Translation with 4-Bit Precision and Beyond	Sep 13, 2019	Machine TranslationNMT	—Unverified
Neural Network Approach for Non-Markovian Dissipative Dynamics of Many-Body Open Quantum Systems	Apr 17, 2024	BenchmarkingQuantization	—Unverified
Neural Network based Inter bi-prediction Blending	Jan 26, 2022	CPUMotion Compensation	—Unverified

Show:10 25 50

← PrevPage 72 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified