Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1225 of 4925 papers

Title	Date	Tasks	Status
Quantization Design for Deep Learning-Based CSI Feedback	Mar 11, 2025	Deep LearningQuantization	—Unverified
VocalEyes: Enhancing Environmental Perception for the Visually Impaired through Vision-Language Models and Distance-Aware Object Detection	Mar 10, 2025	NVIDIA Jetson Orin Nanoobject-detection	—Unverified
Lightweight Multimodal Artificial Intelligence Framework for Maritime Multi-Scene Recognition	Mar 10, 2025	Disaster ResponseLarge Language Model	—Unverified
Task Vector Quantization for Memory-Efficient Model Merging	Mar 10, 2025	image-classificationImage Classification	CodeCode Available
Non-vacuous Generalization Bounds for Deep Neural Networks without any modification to the trained models	Mar 10, 2025	Generalization BoundsQuantization	—Unverified
Synchronized Video-to-Audio Generation via Mel Quantization-Continuum Decomposition	Mar 10, 2025	Audio GenerationQuantization	—Unverified
Breaking the Limits of Quantization-Aware Defenses: QADT-R for Robustness Against Patch-Based Adversarial Attacks in QNNs	Mar 10, 2025	Quantization	—Unverified
Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping	Mar 10, 2025	DenoisingImage Generation	—Unverified
Seeing Delta Parameters as JPEG Images: Data-Free Delta Compression with Discrete Cosine Transform	Mar 9, 2025	Image CompressionQuantization	—Unverified
SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model	Mar 9, 2025	Instance SegmentationQuantization	—Unverified
TR-DQ: Time-Rotation Diffusion Quantization	Mar 9, 2025	Image GenerationQuantization	—Unverified
Towards Superior Quantization Accuracy: A Layer-sensitive Approach	Mar 9, 2025	Logical ReasoningModel Compression	—Unverified
PathVQ: Reforming Computational Pathology Foundation Model for Whole Slide Image Analysis via Vector Quantization	Mar 9, 2025	PrognosisQuantization	—Unverified
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study	Mar 9, 2025	QuantizationToken Reduction	—Unverified
CASP: Compression of Large Multimodal Models Based on Attention Sparsity	Mar 7, 2025	Model CompressionQuantization	CodeCode Available
Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving	Mar 7, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified
Frequency Autoregressive Image Generation with Continuous Tokens	Mar 7, 2025	Image GenerationLanguage Modeling	—Unverified
VQEL: Enabling Self-Developed Symbolic Language in Agents through Vector Quantization in Emergent Language Games	Mar 6, 2025	Quantization	—Unverified
End-to-End Human Pose Reconstruction from Wearable Sensors for 6G Extended Reality Systems	Mar 6, 2025	Quantization	CodeCode Available
Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size	Mar 6, 2025	MMLUQuantization	—Unverified
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available
AHCPTQ: Accurate and Hardware-Compatible Post-Training Quantization for Segment Anything Model	Mar 5, 2025	Instance SegmentationQuantization	—Unverified
On the Relation Between Speech Quality and Quantized Latent Representations of Neural Codecs	Mar 5, 2025	QuantizationRelation	—Unverified
Fast Jet Tagging with MLP-Mixers on FPGAs	Mar 5, 2025	Jet TaggingQuantization	—Unverified
English K_Quantization of LLMs Does Not Disproportionately Diminish Multilingual Performance	Mar 5, 2025	Quantization	—Unverified

Show:10 25 50

← PrevPage 49 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified