Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 4925 papers

Title	Date	Tasks	Status
PRISM: Privacy-Preserving Improved Stochastic Masking for Federated Generative Models	Mar 11, 2025	Federated LearningPrivacy Preserving	CodeCode Available
Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition	Mar 10, 2025	Disaster ResponseLarge Language Model	—Unverified
Synchronized Video-to-Audio Generation via Mel Quantization-Continuum Decomposition	Mar 10, 2025	Audio GenerationQuantization	—Unverified
Breaking the Limits of Quantization-Aware Defenses: QADT-R for Robustness Against Patch-Based Adversarial Attacks in QNNs	Mar 10, 2025	Quantization	—Unverified
VocalEyes: Enhancing Environmental Perception for the Visually Impaired through Vision-Language Models and Distance-Aware Object Detection	Mar 10, 2025	NVIDIA Jetson Orin Nanoobject-detection	—Unverified
Non-vacuous Generalization Bounds for Deep Neural Networks without any modification to the trained models	Mar 10, 2025	Generalization BoundsQuantization	—Unverified
Task Vector Quantization for Memory-Efficient Model Merging	Mar 10, 2025	image-classificationImage Classification	CodeCode Available
Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping	Mar 10, 2025	DenoisingImage Generation	—Unverified
Seeing Delta Parameters as JPEG Images: Data-Free Delta Compression with Discrete Cosine Transform	Mar 9, 2025	Image CompressionQuantization	—Unverified
TR-DQ: Time-Rotation Diffusion Quantization	Mar 9, 2025	Image GenerationQuantization	—Unverified
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study	Mar 9, 2025	QuantizationToken Reduction	—Unverified
SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model	Mar 9, 2025	Instance SegmentationQuantization	—Unverified
PathVQ: Reforming Computational Pathology Foundation Model for Whole Slide Image Analysis via Vector Quantization	Mar 9, 2025	PrognosisQuantization	—Unverified
Towards Superior Quantization Accuracy: A Layer-sensitive Approach	Mar 9, 2025	Logical ReasoningModel Compression	—Unverified
Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving	Mar 7, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified
Frequency Autoregressive Image Generation with Continuous Tokens	Mar 7, 2025	Image GenerationLanguage Modeling	—Unverified
CASP: Compression of Large Multimodal Models Based on Attention Sparsity	Mar 7, 2025	Model CompressionQuantization	CodeCode Available
End-to-End Human Pose Reconstruction from Wearable Sensors for 6G Extended Reality Systems	Mar 6, 2025	Quantization	CodeCode Available
Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size	Mar 6, 2025	MMLUQuantization	—Unverified
VQEL: Enabling Self-Developed Symbolic Language in Agents through Vector Quantization in Emergent Language Games	Mar 6, 2025	Quantization	—Unverified
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available
AHCPTQ: Accurate and Hardware-Compatible Post-Training Quantization for Segment Anything Model	Mar 5, 2025	Instance SegmentationQuantization	—Unverified
English K_Quantization of LLMs Does Not Disproportionately Diminish Multilingual Performance	Mar 5, 2025	Quantization	—Unverified
Lightweight Embedded FPGA Deployment of Learned Image Compression with Knowledge Distillation and Hybrid Quantization	Mar 5, 2025	Image CompressionKnowledge Distillation	—Unverified
On the Relation Between Speech Quality and Quantized Latent Representations of Neural Codecs	Mar 5, 2025	QuantizationRelation	—Unverified
Fast Jet Tagging with MLP-Mixers on FPGAs	Mar 5, 2025	Jet TaggingQuantization	—Unverified
Q&C: When Quantization Meets Cache in Efficient Image Generation	Mar 4, 2025	Image GenerationQuantization	CodeCode Available
Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations	Mar 4, 2025	QuantizationRecommendation Systems	—Unverified
BdSLW401: Transformer-Based Word-Level Bangla Sign Language Recognition Using Relative Quantization Encoding (RQE)	Mar 4, 2025	QuantizationSign Language Recognition	—Unverified
Regularization-based Framework for Quantization-, Fault- and Variability-Aware Training	Mar 3, 2025	Quantization	—Unverified
KurTail : Kurtosis-based LLM Quantization	Mar 3, 2025	GPULanguage Modeling	—Unverified
Cauchy-Schwarz Regularizers	Mar 3, 2025	Quantization	CodeCode Available
Towards Improved Text-Aligned Codebook Learning: Multi-Hierarchical Codebook-Text Alignment with Long Text	Mar 3, 2025	Image GenerationQuantization	—Unverified
DILEMMA: Joint LLM Quantization and Distributed LLM Inference Over Edge Computing Systems	Mar 3, 2025	Edge-computingKnowledge Distillation	—Unverified
DeRS: Towards Extremely Efficient Upcycled Mixture-of-Experts Models	Mar 3, 2025	Mixture-of-ExpertsQuantization	—Unverified
Patient-Level Anatomy Meets Scanning-Level Physics: Personalized Federated Low-Dose CT Denoising Empowered by Large Language Model	Mar 2, 2025	AnatomyDenoising	CodeCode Available
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
Strong Solutions and Quantization-Based Numerical Schemes for a Class of Non-Markovian Volatility Models	Feb 28, 2025	Quantization	—Unverified
Transformer-Based Nonlinear Transform Coding for Multi-Rate CSI Compression in MIMO-OFDM Systems	Feb 27, 2025	Image CompressionQuantization	—Unverified
HALO: Hardware-aware quantization with low critical-path-delay weights for LLM acceleration	Feb 27, 2025	Quantization	—Unverified
Beyond the Tip of Efficiency: Uncovering the Submerged Threats of Jailbreak Attacks in Small Language Models	Feb 27, 2025	Knowledge DistillationModel Compression	—Unverified
Speculative Decoding and Beyond: An In-Depth Review of Techniques	Feb 27, 2025	Quantization	—Unverified
On the Privacy-Preserving Properties of Spiking Neural Networks with Unique Surrogate Gradients and Quantization Levels	Feb 25, 2025	Privacy PreservingQuantization	—Unverified
Compressing Language Models for Specialized Domains	Feb 25, 2025	Quantization	—Unverified
Memory-Free and Parallel Computation for Quantized Spiking Neural Networks	Feb 25, 2025	Computational EfficiencyQuantization	—Unverified
Task-Driven Semantic Quantization and Imitation Learning for Goal-Oriented Communications	Feb 25, 2025	Imitation LearningQuantization	—Unverified
Unbiased and Sign Compression in Distributed Learning: Comparing Noise Resilience via SDEs	Feb 24, 2025	Distributed OptimizationLanguage Modeling	—Unverified
Compression Scaling Laws:Unifying Sparsity and Quantization	Feb 23, 2025	Quantization	—Unverified
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification	Feb 23, 2025	ClassificationInference Optimization	—Unverified
Dr. Splat: Directly Referring 3D Gaussian Splatting via Direct Language Embedding Registration	Feb 23, 2025	3DGS3D Semantic Segmentation	—Unverified

Show:10 25 50

← PrevPage 25 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified