Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 4925 papers

Title	Date	Tasks	Status	Hype
Robust Machine Unlearning for Quantized Neural Networks via Adaptive Gradient Reweighting with Similar Labels	Mar 18, 2025	Machine UnlearningQuantization	—Unverified	0
Quantization-Free Autoregressive Action Transformer	Mar 18, 2025	Imitation LearningQuantization	CodeCode Available	0
MAG: Multi-Modal Aligned Autoregressive Co-Speech Gesture Generation without Vector Quantization	Mar 18, 2025	Gesture GenerationQuantization	—Unverified	0
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting	Mar 17, 2025	3DGS3D Reconstruction	—Unverified	0
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning	Mar 17, 2025	GPUModel Compression	—Unverified	0
ML-SpecQD: Multi-Level Speculative Decoding with Quantized Drafts	Mar 17, 2025	Quantization	—Unverified	0
Versatile Physics-based Character Control with Hybrid Latent Representation	Mar 17, 2025	Motion Generationmotion in-betweening	—Unverified	0
ACT360: An Efficient 360-Degree Action Detection and Summarization Framework for Mission-Critical Training and Debriefing	Mar 17, 2025	Action DetectionDisaster Response	—Unverified	0
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix	Mar 14, 2025	Neural Network CompressionQuantization	—Unverified	0
Understanding Flatness in Generative Models: Its Role and Benefits	Mar 14, 2025	Noise EstimationQuantization	—Unverified	0
Pathology Image Compression with Pre-trained Autoencoders	Mar 14, 2025	Computational EfficiencyImage Compression	—Unverified	0
OuroMamba: A Data-Free Quantization Framework for Vision Mamba Models	Mar 13, 2025	channel selectionContrastive Learning	—Unverified	0
Automated Tomato Maturity Estimation Using an Optimized Residual Model with Pruning and Quantization Techniques	Mar 13, 2025	ClassificationComputational Efficiency	—Unverified	0
Dual Codebook VQ: Enhanced Image Reconstruction with Reduced Codebook Size	Mar 13, 2025	Face ReconstructionImage Reconstruction	—Unverified	0
Global synchronization of multi-agent systems with nonlinear interactions	Mar 13, 2025	Quantization	—Unverified	0
Quantization for OpenAI's Whisper Models: A Comparative Analysis	Mar 12, 2025	Quantizationspeech-recognition	CodeCode Available	0
ViM-VQ: Efficient Post-Training Vector Quantization for Visual Mamba	Mar 12, 2025	MambaQuantization	—Unverified	0
Sometimes Painful but Certainly Promising: Feasibility and Trade-offs of Language Model Inference at the Edge	Mar 12, 2025	CPUGPU	—Unverified	0
Quantitative Analysis of Deeply Quantized Tiny Neural Networks Robust to Adversarial Attacks	Mar 12, 2025	Adversarial RobustnessQuantization	—Unverified	0
Accurate INT8 Training Through Dynamic Block-Level Fallback	Mar 11, 2025	Quantization	—Unverified	0
PCGS: Progressive Compression of 3D Gaussian Splatting	Mar 11, 2025	3DGSNovel View Synthesis	CodeCode Available	1
Quantization Design for Deep Learning-Based CSI Feedback	Mar 11, 2025	Deep LearningQuantization	—Unverified	0
PRISM: Privacy-Preserving Improved Stochastic Masking for Federated Generative Models	Mar 11, 2025	Federated LearningPrivacy Preserving	CodeCode Available	0
VocalEyes: Enhancing Environmental Perception for the Visually Impaired through Vision-Language Models and Distance-Aware Object Detection	Mar 10, 2025	NVIDIA Jetson Orin Nanoobject-detection	—Unverified	0
Non-vacuous Generalization Bounds for Deep Neural Networks without any modification to the trained models	Mar 10, 2025	Generalization BoundsQuantization	—Unverified	0
Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping	Mar 10, 2025	DenoisingImage Generation	—Unverified	0
Breaking the Limits of Quantization-Aware Defenses: QADT-R for Robustness Against Patch-Based Adversarial Attacks in QNNs	Mar 10, 2025	Quantization	—Unverified	0
Task Vector Quantization for Memory-Efficient Model Merging	Mar 10, 2025	image-classificationImage Classification	CodeCode Available	0
Synchronized Video-to-Audio Generation via Mel Quantization-Continuum Decomposition	Mar 10, 2025	Audio GenerationQuantization	—Unverified	0
Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition	Mar 10, 2025	Disaster ResponseLarge Language Model	—Unverified	0
QuantCache: Adaptive Importance-Guided Quantization with Hierarchical Latent and Layer Caching for Video Generation	Mar 9, 2025	QuantizationVideo Generation	CodeCode Available	1
TR-DQ: Time-Rotation Diffusion Quantization	Mar 9, 2025	Image GenerationQuantization	—Unverified	0
PathVQ: Reforming Computational Pathology Foundation Model for Whole Slide Image Analysis via Vector Quantization	Mar 9, 2025	PrognosisQuantization	—Unverified	0
Towards Superior Quantization Accuracy: A Layer-sensitive Approach	Mar 9, 2025	Logical ReasoningModel Compression	—Unverified	0
SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model	Mar 9, 2025	Instance SegmentationQuantization	—Unverified	0
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study	Mar 9, 2025	QuantizationToken Reduction	—Unverified	0
Seeing Delta Parameters as JPEG Images: Data-Free Delta Compression with Discrete Cosine Transform	Mar 9, 2025	Image CompressionQuantization	—Unverified	0
D2GV: Deformable 2D Gaussian Splatting for Video Representation in 400FPS	Mar 7, 2025	DenoisingQuantization	CodeCode Available	2
QArtSR: Quantization via Reverse-Module and Timestep-Retraining in One-Step Diffusion based Image Super-Resolution	Mar 7, 2025	DenoisingImage Super-Resolution	CodeCode Available	1
CASP: Compression of Large Multimodal Models Based on Attention Sparsity	Mar 7, 2025	Model CompressionQuantization	CodeCode Available	0
Frequency Autoregressive Image Generation with Continuous Tokens	Mar 7, 2025	Image GenerationLanguage Modeling	—Unverified	0
Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving	Mar 7, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified	0
VQEL: Enabling Self-Developed Symbolic Language in Agents through Vector Quantization in Emergent Language Games	Mar 6, 2025	Quantization	—Unverified	0
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available	0
End-to-End Human Pose Reconstruction from Wearable Sensors for 6G Extended Reality Systems	Mar 6, 2025	Quantization	CodeCode Available	0
Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size	Mar 6, 2025	MMLUQuantization	—Unverified	0
Lightweight Embedded FPGA Deployment of Learned Image Compression with Knowledge Distillation and Hybrid Quantization	Mar 5, 2025	Image CompressionKnowledge Distillation	—Unverified	0
On the Relation Between Speech Quality and Quantized Latent Representations of Neural Codecs	Mar 5, 2025	QuantizationRelation	—Unverified	0
English K_Quantization of LLMs Does Not Disproportionately Diminish Multilingual Performance	Mar 5, 2025	Quantization	—Unverified	0
Fast Jet Tagging with MLP-Mixers on FPGAs	Mar 5, 2025	Jet TaggingQuantization	—Unverified	0

Show:10 25 50

← PrevPage 8 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified