Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2025 of 4925 papers

Title	Date	Tasks	Status
Flattened one-bit stochastic gradient descent: compressed distributed optimization with controlled variance	May 17, 2024	Distributed OptimizationQuantization	—Unverified
Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network	May 17, 2024	Image CompressionQuantization	—Unverified
Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication	May 17, 2024	DecoderQuantization	—Unverified
The Effect of Quantization in Federated Learning: A Rényi Differential Privacy Perspective	May 16, 2024	Federated LearningPrivacy Preserving	—Unverified
Properties that allow or prohibit transferability of adversarial attacks among quantized networks	May 15, 2024	Quantization	CodeCode Available
FDD Massive MIMO: How to Optimally Combine UL Pilot and Limited DL CSI Feedback?	May 14, 2024	Quantization	—Unverified
Neural Speech Coding for Real-time Communications using Constant Bitrate Scalar Quantization	May 14, 2024	QuantizationScheduling	—Unverified
Goal-oriented compression for L_p-norm-type goal functions: Application to power consumption scheduling	May 13, 2024	Data CompressionQuantization	—Unverified
VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling	May 13, 2024	Quantization	—Unverified
Post Training Quantization of Large Language Models with Microscaling Formats	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Edge Intelligence Optimization for Large Language Model Inference with Batching and Quantization	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Compression-Realized Deep Structural Network for Video Quality Enhancement	May 10, 2024	DenoisingMotion Estimation	—Unverified
Characterizing the Accuracy -- Efficiency Trade-off of Low-rank Decomposition in Language Models	May 10, 2024	AI AgentModel Compression	—Unverified
Selective Focus: Investigating Semantics Sensitivity in Post-training Quantization for Lane Detection	May 10, 2024	Autonomous DrivingGPU	—Unverified
SKVQ: Sliding-window Key and Value Cache Quantization for Large Language Models	May 10, 2024	GPUQuantization	—Unverified
From Algorithm to Hardware: A Survey on Efficient and Safe Deployment of Deep Neural Networks	May 9, 2024	Knowledge DistillationModel Compression	—Unverified
Custom Gradient Estimators are Straight-Through Estimators in Disguise	May 8, 2024	Quantization	—Unverified
KV Cache is 1 Bit Per Channel: Efficient Large Language Model Inference with Coupled Quantization	May 7, 2024	GPULanguage Modeling	—Unverified
Quantifying the Capabilities of LLMs across Scale and Precision	May 6, 2024	HallucinationMisinformation	—Unverified
Compression-based Privacy Preservation for Distributed Nash Equilibrium Seeking in Aggregative Games	May 6, 2024	Quantization	—Unverified
Enabling High-Sparsity Foundational Llama Models with Efficient Pretraining and Deployment	May 6, 2024	Arithmetic ReasoningCode Generation	—Unverified
Trio-ViT: Post-Training Quantization and Acceleration for Softmax-Free Efficient Vision Transformer	May 6, 2024	Efficient ViTsModel Compression	CodeCode Available
DeltaKWS: A 65nm 36nJ/Decision Bio-inspired Temporal-Sparsity-Aware Digital Keyword Spotting IC with 0.6V Near-Threshold SRAM	May 6, 2024	channel selectionKeyword Spotting	—Unverified
Efficient Text-driven Motion Generation via Latent Consistency Training	May 5, 2024	Motion GenerationQuantization	CodeCode Available
Joint Discrete Precoding and RIS Optimization for RIS-Assisted MU-MIMO Communication Systems	May 5, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 81 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified