Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4250 of 4925 papers

Title	Date	Tasks	Status
Resource Allocation and Dithering of Bayesian Parameter Estimation Using Mixed-Resolution Data	Sep 17, 2020	parameter estimationQuantization	—Unverified
Resource Allocation for Compression-aided Federated Learning with High Distortion Rate	Jun 2, 2022	Federated LearningModel Compression	—Unverified
Resource-aware Mixed-precision Quantization for Enhancing Deployability of Transformers for Time-series Forecasting on Embedded FPGAs	Oct 4, 2024	Neural Architecture SearchQuantization	—Unverified
Resource-efficient Deep Neural Networks for Automotive Radar Interference Mitigation	Jan 25, 2022	Autonomous VehiclesDenoising	—Unverified
Resource-Efficient Language Models: Quantization for Fast and Accessible Inference	May 13, 2025	Quantization	—Unverified
Resource-Efficient Neural Networks for Embedded Systems	Jan 7, 2020	Autonomous NavigationBIG-bench Machine Learning	—Unverified
Resource Efficient Neural Networks Using Hessian Based Pruning	Jun 12, 2023	GPUimage-classification	—Unverified
Resource-Efficient Transformer Architecture: Optimizing Memory and Execution Time for Real-Time Applications	Dec 25, 2024	Quantization	—Unverified
ResQ: Residual Quantization for Video Perception	Aug 18, 2023	Optical Flow EstimationPose Estimation	—Unverified
Restorative Speech Enhancement: A Progressive Approach Using SE and Codec Modules	Oct 2, 2024	QuantizationSpeech Enhancement	—Unverified
Résumé abstractif à partir d'une transcription audio	Apr 16, 2025	Quantization	—Unverified
Rethinking Deconvolution for 2D Human Pose Estimation Light yet Accurate Model for Real-time Edge Computing	Nov 8, 2021	2D Human Pose EstimationDecoder	—Unverified
Rethinking Diffusion for Text-Driven Human Motion Generation	Nov 25, 2024	Motion GenerationQuantization	—Unverified
Rethinking Diffusion for Text-Driven Human Motion Generation: Redundant Representations, Evaluation, and Masked Autoregression	Jan 1, 2025	Motion GenerationQuantization	—Unverified
Rethinking Discrete Tokens: Treating Them as Conditions for Continuous Autoregressive Image Synthesis	Jul 2, 2025	Density EstimationImage Generation	—Unverified
Rethinking Few-Shot Medical Segmentation: A Vector Quantization View	Jan 1, 2023	QuantizationSegmentation	—Unverified
Rethinking Generalization in American Sign Language Prediction for Edge Devices with Extremely Low Memory Footprint	Nov 27, 2020	Quantization	—Unverified
Rethinking Mutual Information for Language Conditioned Skill Discovery on Imitation Learning	Feb 27, 2024	Imitation LearningQuantization	—Unverified
Rethinking Neural Network Quantization	Sep 25, 2019	Quantization	—Unverified
Rethinking Post-Training Quantization: Introducing a Statistical Pre-Calibration Approach	Jan 15, 2025	Quantization	—Unverified
Retraining-Based Iterative Weight Quantization for Deep Neural Networks	May 29, 2018	Model CompressionQuantization	—Unverified
Reverse Link Analysis for Full-Duplex Cellular Networks with Low Resolution ADC/DAC	Mar 28, 2022	Quantization	—Unverified
Reversible Quantization Index Modulation for Static Deep Neural Network Watermarking	May 29, 2023	Quantization	—Unverified
Revisiting Data Augmentation in Model Compression: An Empirical and Comprehensive Study	May 22, 2023	Data AugmentationKnowledge Distillation	—Unverified
Revisiting DNN Training for Intermittently-Powered Energy-Harvesting Micro-Computers	Aug 25, 2024	Quantization	—Unverified
Revisiting Locality-Sensitive Binary Codes from Random Fourier Features	Sep 29, 2021	Information RetrievalQuantization	—Unverified
Revisiting Quantization Error in Face Alignment	Sep 13, 2021	Face AlignmentQuantization	—Unverified
Revisiting Uncertainty Estimation and Calibration of Large Language Models	May 29, 2025	Mixture-of-ExpertsMMLU	—Unverified
Revolutionizing Mobile Interaction: Enabling a 3 Billion Parameter GPT LLM on Mobile	Sep 29, 2023	Quantization	—Unverified
REx: Data-Free Residual Quantization Error Expansion	Mar 28, 2022	Quantization	—Unverified
RFI Mitigation for One-bit UWB Radar Systems	Feb 17, 2021	Computational EfficiencyQuantization	—Unverified
Riemannian Manifold Embeddings for Straight-Through Estimator	Sep 29, 2021	Quantization	—Unverified
RIS-Assisted Energy Harvesting Gains for Bistatic Backscatter Networks: Performance Analysis and RIS Phase Optimization	Sep 18, 2023	QuantizationTAG	—Unverified
RIS-Assisted Self-Interference Mitigation for In-Band Full-Duplex Transceivers	Nov 22, 2022	Quantization	—Unverified
Risk Assessment for Connected Vehicles under Stealthy Attacks on Vehicle-to-Vehicle Networks	Sep 3, 2021	Quantization	—Unverified
Risk Bounds for Learning Multiple Components with Permutation-Invariant Losses	Apr 16, 2019	ClusteringQuantization	—Unverified
RL-RC-DoT: A Block-level RL agent for Task-Aware Video Compression	Jan 21, 2025	Autonomous DrivingObject Recognition	—Unverified
RLRC: Reinforcement Learning-based Recovery for Compressed Vision-Language-Action Models	Jun 21, 2025	Model CompressionQuantization	—Unverified
RMSMP: A Novel Deep Neural Network Quantization Framework with Row-wise Mixed Schemes and Multiple Precisions	Oct 30, 2021	image-classificationImage Classification	—Unverified
RobSurv: Vector Quantization-Based Multi-Modal Learning for Robust Cancer Survival Prediction	May 5, 2025	PrognosisQuantization	—Unverified
Robust Anomaly-Based Ship Proposals Detection from Pan-sharpened High-Resolution Satellite Image	Apr 25, 2018	Quantization	—Unverified
Mixed-TD: Efficient Neural Network Accelerator with Layer-Specific Tensor Decomposition	Jun 8, 2023	Efficient Neural NetworkQuantization	CodeCode Available
Compressing 3D Gaussian Splatting by Noise-Substituted Vector Quantization	Apr 3, 2025	3DGS3D Reconstruction	CodeCode Available
Mixed-Precision Quantization for Deep Vision Models with Integer Quadratic Programming	Jul 11, 2023	QuantizationSensitivity	CodeCode Available
BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration	Nov 18, 2024	Quantization	CodeCode Available
Model-Aware Deep Architectures for One-Bit Compressive Variational Autoencoding	Nov 27, 2019	Compressive SensingQuantization	CodeCode Available
An Underexplored Dilemma between Confidence and Calibration in Quantized Neural Networks	Nov 10, 2021	Decision MakingQuantization	CodeCode Available
Distributed dual vigilance fuzzy adaptive resonance theory learns online, retrieves arbitrarily-shaped clusters, and mitigates order dependence	Nov 28, 2018	ClusteringQuantization	CodeCode Available
QNCD: Quantization Noise Correction for Diffusion Models	Mar 28, 2024	DenoisingImage Generation	CodeCode Available
TransPL: VQ-Code Transition Matrices for Pseudo-Labeling of Time Series Unsupervised Domain Adaptation	May 15, 2025	Domain AdaptationPseudo Label	CodeCode Available

Show:10 25 50

← PrevPage 85 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified