Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 4925 papers

Title	Date	Tasks	Status	Hype
Efficient Deployment of Spiking Neural Networks on SpiNNaker2 for DVS Gesture Recognition Using Neuromorphic Intermediate Representation	Sep 4, 2025	Edge-computingGesture Recognition	CodeCode Available	0
An End-to-End DNN Inference Framework for the SpiNNaker2 Neuromorphic MPSoC	Jul 18, 2025	QuantizationScheduling	—Unverified	0
Angle Estimation of a Single Source with Massive Uniform Circular Arrays	Jul 17, 2025	Quantization	—Unverified	0
Task-Specific Audio Coding for Machines: Machine-Learned Latent Features Are Codes for That Machine	Jul 17, 2025	Audio ClassificationAutomatic Speech Recognition	—Unverified	0
Quantized Rank Reduction: A Communications-Efficient Federated Learning Scheme for Network-Critical Applications	Jul 15, 2025	Federated LearningQuantization	—Unverified	0
MGVQ: Could VQ-VAE Beat VAE? A Generalizable Tokenizer with Multi-group Quantization	Jul 14, 2025	2kImage Generation	CodeCode Available	2
Lightweight Federated Learning over Wireless Edge Networks	Jul 13, 2025	Bayesian OptimizationFederated Learning	—Unverified	0
Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Image Generation	Jul 11, 2025	Image GenerationImage Reconstruction	—Unverified	0
Compress Any Segment Anything Model (SAM)	Jul 11, 2025	modelQuantization	CodeCode Available	1
MGVQ: Could VQ-VAE Beat VAE? A Generalizable Tokenizer with Multi-group Quantization	Jul 10, 2025	2kQuantization	CodeCode Available	2
OpenDPDv2: A Unified Learning and Optimization Framework for Neural Network Digital Predistortion	Jul 9, 2025	Model OptimizationQuantization	—Unverified	0
GSVR: 2D Gaussian-based Video Representation for 800+ FPS with Hybrid Deformation Field	Jul 8, 2025	QuantizationVideo Compression	—Unverified	0
Semantic Certainty Assessment in Vector Retrieval Systems: A Novel Framework for Embedding Quality Evaluation	Jul 8, 2025	Data AugmentationQuantization	—Unverified	0
QS4D: Quantization-aware training for efficient hardware deployment of structured state-space sequential models	Jul 8, 2025	Computational EfficiencyEdge-computing	—Unverified	0
EdgeCodec: Onboard Lightweight High Fidelity Neural Compressor with Residual Vector Quantization	Jul 8, 2025	Quantization	CodeCode Available	0
any4: Learned 4-bit Numeric Representation for LLMs	Jul 7, 2025	GPUGSM8K	CodeCode Available	2
Rethinking Discrete Tokens: Treating Them as Conditions for Continuous Autoregressive Image Synthesis	Jul 2, 2025	Density EstimationImage Generation	—Unverified	0
CycleVAR: Repurposing Autoregressive Model for Unsupervised One-Step Image Translation	Jun 29, 2025	Image GenerationImage-to-Image Translation	CodeCode Available	1
Analysis of Null Related Beampattern Measures and Signal Quantization Effects for Linear Differential Microphone Arrays	Jun 26, 2025	Quantization	—Unverified	0
PsyLite Technical Report	Jun 26, 2025	Large Language ModelLightweight Deployment	CodeCode Available	0
Joint Quantization and Pruning Neural Networks Approach: A Case Study on FSO Receivers	Jun 25, 2025	Quantization	—Unverified	0
OLALa: Online Learned Adaptive Lattice Codes for Heterogeneous Federated Learning	Jun 25, 2025	Federated LearningQuantization	CodeCode Available	0
Q-resafe: Assessing Safety Risks and Quantization-aware Safety Patching for Quantized Large Language Models	Jun 25, 2025	Quantization	CodeCode Available	1
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression	Jun 25, 2025	Model CompressionQuantization	—Unverified	0
Cross-Layer Discrete Concept Discovery for Interpreting Language Models	Jun 24, 2025	DiversityQuantization	—Unverified	0
Variational Bayesian Channel Estimation and Data Detection for Cell-Free Massive MIMO with Low-Resolution Quantized Fronthaul Links	Jun 23, 2025	CPUQuantization	—Unverified	0
CommVQ: Commutative Vector Quantization for KV Cache Compression	Jun 23, 2025	GPUGSM8K	CodeCode Available	1
AnalogNAS-Bench: A NAS Benchmark for Analog In-Memory Computing	Jun 23, 2025	Neural Architecture SearchQuantization	CodeCode Available	2
StainPIDR: A Pathological Image Decouplingand Reconstruction Method for Stain Normalization Based on Color Vector Quantization and Structure Restaining	Jun 22, 2025	DiagnosticQuantization	—Unverified	0
NestQuant: Post-Training Integer-Nesting Quantization for On-Device DNN	Jun 22, 2025	Quantization	CodeCode Available	0
TROJAN-GUARD: Hardware Trojans Detection Using GNN in RTL Designs	Jun 22, 2025	Graph Neural NetworkQuantization	—Unverified	0
LVPNet: A Latent-variable-based Prediction-driven End-to-end Framework for Lossless Compression of Medical Images	Jun 22, 2025	Image CompressionImage Segmentation	CodeCode Available	0
From Tiny Machine Learning to Tiny Deep Learning: A Survey	Jun 21, 2025	AutoMLModel Optimization	CodeCode Available	2
RLRC: Reinforcement Learning-based Recovery for Compressed Vision-Language-Action Models	Jun 21, 2025	Model CompressionQuantization	—Unverified	0
Cross-Modal Epileptic Signal Harmonization: Frequency Domain Mapping Quantization for Pre-training a Unified Neurophysiological Transformer	Jun 20, 2025	EEGQuantization	CodeCode Available	0
The Hidden Cost of an Image: Quantifying the Energy Consumption of AI Image Generation	Jun 20, 2025	Image GenerationQuantization	—Unverified	0
A Simple Contrastive Framework Of Item Tokenization For Generative Recommendation	Jun 20, 2025	Contrastive LearningDescriptive	—Unverified	0
On Designing Modulation for Over-the-Air Computation -- Part I: Noise-Aware Design	Jun 19, 2025	Low-latency processingQuantization	—Unverified	0
PAROAttention: Pattern-Aware ReOrdering for Efficient Sparse and Quantized Attention in Visual Generation Models	Jun 19, 2025	Image GenerationQuantization	—Unverified	0
Modulated Diffusion: Accelerating Generative Modeling with Modulated Quantization	Jun 18, 2025	Quantization	CodeCode Available	0
Effect of Signal Quantization on Performance Measures of a 1st Order One Dimensional Differential Microphone Array	Jun 18, 2025	Quantization	—Unverified	0
J3DAI: A tiny DNN-Based Edge AI Accelerator for 3D-Stacked CMOS Image Sensor	Jun 18, 2025	image-classificationImage Classification	—Unverified	0
Cost-Aware Routing for Efficient Text-To-Image Generation	Jun 17, 2025	DenoisingImage Generation	—Unverified	0
Compressed Video Super-Resolution based on Hierarchical Encoding	Jun 17, 2025	QuantizationSuper-Resolution	—Unverified	0
MoTE: Mixture of Ternary Experts for Memory-efficient Large Multimodal Models	Jun 17, 2025	Mixture-of-ExpertsQuantization	—Unverified	0
ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models	Jun 16, 2025	Quantization	—Unverified	0
DETRPose: Real-time end-to-end transformer model for multi-person pose estimation	Jun 16, 2025	2D Pose EstimationDecoder	CodeCode Available	2
EAQuant: Enhancing Post-Training Quantization for MoE Models via Expert-Aware Optimization	Jun 16, 2025	Mixture-of-ExpertsModel Compression	CodeCode Available	0
Serving Large Language Models on Huawei CloudMatrix384	Jun 15, 2025	Mixture-of-ExpertsQuantization	—Unverified	0
Quantizing Small-Scale State-Space Models for Edge AI	Jun 14, 2025	QuantizationState Space Models	—Unverified	0

Show:10 25 50

← PrevPage 1 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified