Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–375 of 4925 papers

Title	Date	Tasks	Status	Hype
Robust Machine Unlearning for Quantized Neural Networks via Adaptive Gradient Reweighting with Similar Labels	Mar 18, 2025	Machine UnlearningQuantization	—Unverified	0
Quantization-Free Autoregressive Action Transformer	Mar 18, 2025	Imitation LearningQuantization	CodeCode Available	0
MAG: Multi-Modal Aligned Autoregressive Co-Speech Gesture Generation without Vector Quantization	Mar 18, 2025	Gesture GenerationQuantization	—Unverified	0
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting	Mar 17, 2025	3DGS3D Reconstruction	—Unverified	0
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning	Mar 17, 2025	GPUModel Compression	—Unverified	0
ML-SpecQD: Multi-Level Speculative Decoding with Quantized Drafts	Mar 17, 2025	Quantization	—Unverified	0
Versatile Physics-based Character Control with Hybrid Latent Representation	Mar 17, 2025	Motion Generationmotion in-betweening	—Unverified	0
ACT360: An Efficient 360-Degree Action Detection and Summarization Framework for Mission-Critical Training and Debriefing	Mar 17, 2025	Action DetectionDisaster Response	—Unverified	0
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix	Mar 14, 2025	Neural Network CompressionQuantization	—Unverified	0
Understanding Flatness in Generative Models: Its Role and Benefits	Mar 14, 2025	Noise EstimationQuantization	—Unverified	0
Pathology Image Compression with Pre-trained Autoencoders	Mar 14, 2025	Computational EfficiencyImage Compression	—Unverified	0
Automated Tomato Maturity Estimation Using an Optimized Residual Model with Pruning and Quantization Techniques	Mar 13, 2025	ClassificationComputational Efficiency	—Unverified	0
Dual Codebook VQ: Enhanced Image Reconstruction with Reduced Codebook Size	Mar 13, 2025	Face ReconstructionImage Reconstruction	—Unverified	0
OuroMamba: A Data-Free Quantization Framework for Vision Mamba Models	Mar 13, 2025	channel selectionContrastive Learning	—Unverified	0
Global synchronization of multi-agent systems with nonlinear interactions	Mar 13, 2025	Quantization	—Unverified	0
ViM-VQ: Efficient Post-Training Vector Quantization for Visual Mamba	Mar 12, 2025	MambaQuantization	—Unverified	0
Quantization for OpenAI's Whisper Models: A Comparative Analysis	Mar 12, 2025	Quantizationspeech-recognition	CodeCode Available	0
Sometimes Painful but Certainly Promising: Feasibility and Trade-offs of Language Model Inference at the Edge	Mar 12, 2025	CPUGPU	—Unverified	0
Quantitative Analysis of Deeply Quantized Tiny Neural Networks Robust to Adversarial Attacks	Mar 12, 2025	Adversarial RobustnessQuantization	—Unverified	0
Accurate INT8 Training Through Dynamic Block-Level Fallback	Mar 11, 2025	Quantization	—Unverified	0
PCGS: Progressive Compression of 3D Gaussian Splatting	Mar 11, 2025	3DGSNovel View Synthesis	CodeCode Available	1
Quantization Design for Deep Learning-Based CSI Feedback	Mar 11, 2025	Deep LearningQuantization	—Unverified	0
PRISM: Privacy-Preserving Improved Stochastic Masking for Federated Generative Models	Mar 11, 2025	Federated LearningPrivacy Preserving	CodeCode Available	0
VocalEyes: Enhancing Environmental Perception for the Visually Impaired through Vision-Language Models and Distance-Aware Object Detection	Mar 10, 2025	NVIDIA Jetson Orin Nanoobject-detection	—Unverified	0
Breaking the Limits of Quantization-Aware Defenses: QADT-R for Robustness Against Patch-Based Adversarial Attacks in QNNs	Mar 10, 2025	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 15 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified