Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 4925 papers

Title	Date	Tasks	Status
GSVR: 2D Gaussian-based Video Representation for 800+ FPS with Hybrid Deformation Field	Jul 8, 2025	QuantizationVideo Compression	—Unverified
EdgeCodec: Onboard Lightweight High Fidelity Neural Compressor with Residual Vector Quantization	Jul 8, 2025	Quantization	CodeCode Available
Rethinking Discrete Tokens: Treating Them as Conditions for Continuous Autoregressive Image Synthesis	Jul 2, 2025	Density EstimationImage Generation	—Unverified
PsyLite Technical Report	Jun 26, 2025	Large Language ModelLightweight Deployment	CodeCode Available
Analysis of Null Related Beampattern Measures and Signal Quantization Effects for Linear Differential Microphone Arrays	Jun 26, 2025	Quantization	—Unverified
OLALa: Online Learned Adaptive Lattice Codes for Heterogeneous Federated Learning	Jun 25, 2025	Federated LearningQuantization	CodeCode Available
Joint Quantization and Pruning Neural Networks Approach: A Case Study on FSO Receivers	Jun 25, 2025	Quantization	—Unverified
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression	Jun 25, 2025	Model CompressionQuantization	—Unverified
Cross-Layer Discrete Concept Discovery for Interpreting Language Models	Jun 24, 2025	DiversityQuantization	—Unverified
Variational Bayesian Channel Estimation and Data Detection for Cell-Free Massive MIMO with Low-Resolution Quantized Fronthaul Links	Jun 23, 2025	CPUQuantization	—Unverified
LVPNet: A Latent-variable-based Prediction-driven End-to-end Framework for Lossless Compression of Medical Images	Jun 22, 2025	Image CompressionImage Segmentation	CodeCode Available
StainPIDR: A Pathological Image Decouplingand Reconstruction Method for Stain Normalization Based on Color Vector Quantization and Structure Restaining	Jun 22, 2025	DiagnosticQuantization	—Unverified
NestQuant: Post-Training Integer-Nesting Quantization for On-Device DNN	Jun 22, 2025	Quantization	CodeCode Available
TROJAN-GUARD: Hardware Trojans Detection Using GNN in RTL Designs	Jun 22, 2025	Graph Neural NetworkQuantization	—Unverified
RLRC: Reinforcement Learning-based Recovery for Compressed Vision-Language-Action Models	Jun 21, 2025	Model CompressionQuantization	—Unverified
A Simple Contrastive Framework Of Item Tokenization For Generative Recommendation	Jun 20, 2025	Contrastive LearningDescriptive	—Unverified
Cross-Modal Epileptic Signal Harmonization: Frequency Domain Mapping Quantization for Pre-training a Unified Neurophysiological Transformer	Jun 20, 2025	EEGQuantization	CodeCode Available
The Hidden Cost of an Image: Quantifying the Energy Consumption of AI Image Generation	Jun 20, 2025	Image GenerationQuantization	—Unverified
PAROAttention: Pattern-Aware ReOrdering for Efficient Sparse and Quantized Attention in Visual Generation Models	Jun 19, 2025	Image GenerationQuantization	—Unverified
On Designing Modulation for Over-the-Air Computation -- Part I: Noise-Aware Design	Jun 19, 2025	Low-latency processingQuantization	—Unverified
J3DAI: A tiny DNN-Based Edge AI Accelerator for 3D-Stacked CMOS Image Sensor	Jun 18, 2025	image-classificationImage Classification	—Unverified
Effect of Signal Quantization on Performance Measures of a 1st Order One Dimensional Differential Microphone Array	Jun 18, 2025	Quantization	—Unverified
Modulated Diffusion: Accelerating Generative Modeling with Modulated Quantization	Jun 18, 2025	Quantization	CodeCode Available
MoTE: Mixture of Ternary Experts for Memory-efficient Large Multimodal Models	Jun 17, 2025	Mixture-of-ExpertsQuantization	—Unverified
Compressed Video Super-Resolution based on Hierarchical Encoding	Jun 17, 2025	QuantizationSuper-Resolution	—Unverified
Cost-Aware Routing for Efficient Text-To-Image Generation	Jun 17, 2025	DenoisingImage Generation	—Unverified
ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models	Jun 16, 2025	Quantization	—Unverified
EAQuant: Enhancing Post-Training Quantization for MoE Models via Expert-Aware Optimization	Jun 16, 2025	Mixture-of-ExpertsModel Compression	CodeCode Available
Serving Large Language Models on Huawei CloudMatrix384	Jun 15, 2025	Mixture-of-ExpertsQuantization	—Unverified
Quantizing Small-Scale State-Space Models for Edge AI	Jun 14, 2025	QuantizationState Space Models	—Unverified
Relative Entropy Regularized Reinforcement Learning for Efficient Encrypted Policy Synthesis	Jun 14, 2025	Model-based Reinforcement LearningPrivacy Preserving	—Unverified
Deep Learning Model Acceleration and Optimization Strategies for Real-Time Recommendation Systems	Jun 13, 2025	QuantizationRecommendation Systems	—Unverified
GPLQ: A General, Practical, and Lightning QAT Method for Vision Transformers	Jun 13, 2025	Fine-Grained Image ClassificationQuantization	—Unverified
MNN-LLM: A Generic Inference Engine for Fast Large Language Model Deployment on Mobile Devices	Jun 12, 2025	CPUGPU	—Unverified
Starting Positions Matter: A Study on Better Weight Initialization for Neural Network Quantization	Jun 12, 2025	Quantization	—Unverified
Discrete Audio Tokens: More Than a Survey!	Jun 12, 2025	Language ModelingLanguage Modelling	—Unverified
Post-Training Quantization for Video Matting	Jun 12, 2025	Image MattingModel Compression	—Unverified
SLED: A Speculative LLM Decoding Framework for Efficient Edge Serving	Jun 11, 2025	Edge-computingQuantization	—Unverified
HadaNorm: Diffusion Transformer Quantization through Mean-Centered Transformations	Jun 11, 2025	Image GenerationQuantization	—Unverified
Q-SAM2: Accurate Quantization for Segment Anything Model 2	Jun 11, 2025	QuantizationVideo Segmentation	—Unverified
AWP: Activation-Aware Weight Pruning and Quantization with Projected Gradient Descent	Jun 11, 2025	Model CompressionQuantization	—Unverified
Hardware Limitations and Optimization Approach in 1-Bit RIS Design at 28 GHz	Jun 10, 2025	Quantization	—Unverified
Implementing Keyword Spotting on the MCUX947 Microcontroller with Integrated NPU	Jun 10, 2025	CPUKeyword Spotting	—Unverified
POLARON: Precision-aware On-device Learning and Adaptive Runtime-cONfigurable AI acceleration	Jun 10, 2025	Quantization	—Unverified
Optimizing Learned Image Compression on Scalar and Entropy-Constraint Quantization	Jun 10, 2025	Image CompressionQuantization	—Unverified
Decentralized Optimization on Compact Submanifolds by Quantized Riemannian Gradient Tracking	Jun 9, 2025	Distributed OptimizationQuantization	—Unverified
LiteVLM: A Low-Latency Vision-Language Model Inference Pipeline for Resource-Constrained Environments	Jun 9, 2025	Autonomous DrivingLanguage Modeling	—Unverified
Evaluating Large Language Models on the Frame and Symbol Grounding Problems: A Zero-shot Benchmark	Jun 9, 2025	Quantization	CodeCode Available
QForce-RL: Quantized FPGA-Optimized Reinforcement Learning Compute Engine	Jun 8, 2025	Decision MakingQuantization	—Unverified
Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test	Jun 8, 2025	Quantization	—Unverified

Show:10 25 50

← PrevPage 19 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified