Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2651–2700 of 4925 papers

Title	Date	Tasks	Status
Revisiting DNN Training for Intermittently-Powered Energy-Harvesting Micro-Computers	Aug 25, 2024	Quantization	—Unverified
Revisiting Locality-Sensitive Binary Codes from Random Fourier Features	Sep 29, 2021	Information RetrievalQuantization	—Unverified
Revisiting Quantization Error in Face Alignment	Sep 13, 2021	Face AlignmentQuantization	—Unverified
Revisiting Uncertainty Estimation and Calibration of Large Language Models	May 29, 2025	Mixture-of-ExpertsMMLU	—Unverified
Revolutionizing Mobile Interaction: Enabling a 3 Billion Parameter GPT LLM on Mobile	Sep 29, 2023	Quantization	—Unverified
REx: Data-Free Residual Quantization Error Expansion	Mar 28, 2022	Quantization	—Unverified
RFI Mitigation for One-bit UWB Radar Systems	Feb 17, 2021	Computational EfficiencyQuantization	—Unverified
Riemannian Manifold Embeddings for Straight-Through Estimator	Sep 29, 2021	Quantization	—Unverified
RIS-Assisted Energy Harvesting Gains for Bistatic Backscatter Networks: Performance Analysis and RIS Phase Optimization	Sep 18, 2023	QuantizationTAG	—Unverified
RIS-Assisted Self-Interference Mitigation for In-Band Full-Duplex Transceivers	Nov 22, 2022	Quantization	—Unverified
Risk Assessment for Connected Vehicles under Stealthy Attacks on Vehicle-to-Vehicle Networks	Sep 3, 2021	Quantization	—Unverified
Risk Bounds for Learning Multiple Components with Permutation-Invariant Losses	Apr 16, 2019	ClusteringQuantization	—Unverified
RL-RC-DoT: A Block-level RL agent for Task-Aware Video Compression	Jan 21, 2025	Autonomous DrivingObject Recognition	—Unverified
RLRC: Reinforcement Learning-based Recovery for Compressed Vision-Language-Action Models	Jun 21, 2025	Model CompressionQuantization	—Unverified
RMSMP: A Novel Deep Neural Network Quantization Framework with Row-wise Mixed Schemes and Multiple Precisions	Oct 30, 2021	image-classificationImage Classification	—Unverified
RobSurv: Vector Quantization-Based Multi-Modal Learning for Robust Cancer Survival Prediction	May 5, 2025	PrognosisQuantization	—Unverified
Robust Anomaly-Based Ship Proposals Detection from Pan-sharpened High-Resolution Satellite Image	Apr 25, 2018	Quantization	—Unverified
Robust building footprint extraction from big multi-sensor data using deep competition network	Nov 4, 2020	DecoderQuantization	—Unverified
Robust Dequantized Compressive Sensing	Jul 3, 2012	compressed sensingCompressive Sensing	—Unverified
Robust Downlink Transmit Optimization under Quantized Channel Feedback via the Strong Duality for QCQP	Dec 14, 2020	Quantizationvalid	—Unverified
RobustEdge: Low Power Adversarial Detection for Cloud-Edge Systems	Sep 5, 2023	Adversarial RobustnessQuantization	—Unverified
Robust identification of thermal models for in-production High-Performance-Computing clusters with machine learning-based data selection	Oct 3, 2018	ManagementQuantization	—Unverified
Restricted Minimum Error Entropy Criterion for Robust Classification	Sep 6, 2019	ClassificationDimensionality Reduction	—Unverified
Robust Machine Unlearning for Quantized Neural Networks via Adaptive Gradient Reweighting with Similar Labels	Mar 18, 2025	Machine UnlearningQuantization	—Unverified
RobustMQ: Benchmarking Robustness of Quantized Models	Aug 4, 2023	Adversarial RobustnessBenchmarking	—Unverified
Robustness and Approximation of Discrete-time Mean-field Games under Discounted Cost Criterion	Oct 16, 2023	Quantization	—Unverified
Robustness-aware 2-bit quantization with real-time performance for neural network	Oct 19, 2020	Generative Adversarial NetworkQuantization	—Unverified
Robustness-Guided Image Synthesis for Data-Free Quantization	Oct 5, 2023	Data Free QuantizationDiversity	—Unverified
Robustness of Neural Networks to Parameter Quantization	Mar 26, 2019	Binary ClassificationEdge-computing	—Unverified
Robustness to distribution shifts of compressed networks for edge devices	Jan 22, 2024	Knowledge DistillationQuantization	—Unverified
Robust Precoding for Multi-User Visible Light Communications with Quantized Channel Information	Dec 3, 2024	Quantization	—Unverified
Robust Product Markovian Quantization	Jun 29, 2020	Quantization	—Unverified
Robust Semantic Communications Against Semantic Noise	Feb 7, 2022	QuantizationSemantic Communication	—Unverified
Robust Symbol Level Precoding for Overlay Cognitive Radio Networks	Jan 20, 2023	PhilosophyQuantization	—Unverified
Robust Task-Specific Beamforming with Low-Resolution ADCs for Power-Efficient Hybrid MIMO Receivers	Nov 30, 2022	Quantization	—Unverified
Robust tracking of respiratory rate in high-dynamic range scenes using mobile thermal imaging	May 8, 2017	Physiological ComputingQuantization	—Unverified
Robust Training of Neural Networks at Arbitrary Precision and Sparsity	Sep 14, 2024	DenoisingQuantization	—Unverified
Robust Vector Quantized-Variational Autoencoder	Feb 4, 2022	DecoderQuantization	—Unverified
ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models	Jun 16, 2025	Quantization	—Unverified
RoSTE: An Efficient Quantization-Aware Supervised Fine-Tuning Approach for Large Language Models	Feb 13, 2025	Quantization	—Unverified
Rotate, Clip, and Partition: Towards W2A4KV4 Quantization by Integrating Rotation and Learnable Non-uniform Quantizer	Feb 17, 2025	GPUQuantization	—Unverified
Rotated Runtime Smooth: Training-Free Activation Smoother for accurate INT4 inference	Sep 30, 2024	Quantization	—Unverified
RotateKV: Accurate and Robust 2-Bit KV Cache Quantization for LLMs via Outlier-Aware Adaptive Rotations	Jan 25, 2025	Computational EfficiencyGSM8K	—Unverified
Rotation Consistent Margin Loss for Efficient Low-Bit Face Recognition	Jun 1, 2020	Face Recognitionimage-classification	—Unverified
RPR: Random Partition Relaxation for Training; Binary and Ternary Weight Neural Networks	Jan 4, 2020	Quantization	—Unverified
RPVNet: A Deep and Efficient Range-Point-Voxel Fusion Network for LiDAR Point Cloud Segmentation	Mar 24, 2021	Point Cloud SegmentationQuantization	—Unverified
RQP-SGD: Differential Private Machine Learning through Noisy SGD and Randomized Quantization	Feb 9, 2024	Privacy PreservingQuantization	—Unverified
RTF-Q: Efficient Unsupervised Domain Adaptation with Retraining-free Quantization	Aug 11, 2024	Domain AdaptationQuantization	—Unverified
RTN: Reparameterized Ternary Network	Dec 4, 2019	Quantization	—Unverified
RTSR: A Real-Time Super-Resolution Model for AV1 Compressed Content	Nov 20, 2024	4kKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 54 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified