Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1676–1700 of 4925 papers

Title	Date	Tasks	Status	Hype
Can Large Language Models Understand Context?	Feb 1, 2024	In-Context LearningQuantization	—Unverified	0
Analog-digital Scheduling for Federated Learning: A Communication-Efficient Approach	Feb 1, 2024	Federated LearningQuantization	—Unverified	0
KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization	Jan 31, 2024	GPUQuantization	CodeCode Available	3
Trainable Fixed-Point Quantization for Deep Learning Acceleration on FPGAs	Jan 31, 2024	Deep LearningQuantization	—Unverified	0
Effect of Weight Quantization on Learning Models by Typical Case Analysis	Jan 30, 2024	Quantization	—Unverified	0
One-Step Forward and Backtrack: Overcoming Zig-Zagging in Loss-Aware Quantization Training	Jan 30, 2024	Quantization	CodeCode Available	0
HEQuant: Marrying Homomorphic Encryption and Quantization for Communication-Efficient Private Inference	Jan 29, 2024	Quantization	—Unverified	0
Effective Communication with Dynamic Feature Compression	Jan 29, 2024	Deep Reinforcement LearningFeature Compression	CodeCode Available	0
Scaling Sparse Fine-Tuning to Large Language Models	Jan 29, 2024	parameter-efficient fine-tuningQuantization	CodeCode Available	1
LiDAR-PTQ: Post-Training Quantization for Point Cloud 3D Object Detection	Jan 29, 2024	3D Object DetectionAutonomous Vehicles	CodeCode Available	2
Transformer-based Clipped Contrastive Quantization Learning for Unsupervised Image Retrieval	Jan 27, 2024	Contrastive LearningImage Retrieval	—Unverified	0
A Comprehensive Survey of Compression Algorithms for Language Models	Jan 27, 2024	Knowledge DistillationQuantization	—Unverified	0
Residual Quantization with Implicit Neural Codebooks	Jan 26, 2024	Data CompressionQuantization	CodeCode Available	2
MPTQ-ViT: Mixed-Precision Post-Training Quantization for Vision Transformer	Jan 26, 2024	Quantization	—Unverified	0
LitE-SNN: Designing Lightweight and Efficient Spiking Neural Network through Spatial-Temporal Compressive Network Search and Joint Optimization	Jan 26, 2024	Quantization	—Unverified	0
Within-basket Recommendation via Neural Pattern Associator	Jan 25, 2024	Quantization	—Unverified	0
FP6-LLM: Efficiently Serving Large Language Models Through FP6-Centric Algorithm-System Co-Design	Jan 25, 2024	GPUQuantization	CodeCode Available	3
CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks	Jan 25, 2024	Model CompressionQuantization	—Unverified	0
Towards Cheaper Inference in Deep Networks with Lower Bit-Width Accumulators	Jan 25, 2024	Quantization	—Unverified	0
Value-Driven Mixed-Precision Quantization for Patch-Based Inference on Microcontrollers	Jan 24, 2024	Quantization	—Unverified	0
Iterated Relevance Matrix Analysis (IRMA) for the identification of class-discriminative subspaces	Jan 23, 2024	Dimensionality ReductionQuantization	—Unverified	0
Scaling Up Quantization-Aware Neural Architecture Search for Efficient Deep Learning on the Edge	Jan 22, 2024	Neural Architecture SearchQuantization	—Unverified	0
Robustness to distribution shifts of compressed networks for edge devices	Jan 22, 2024	Knowledge DistillationQuantization	—Unverified	0
Another Way to the Top: Exploit Contextual Clustering in Learned Image Coding	Jan 21, 2024	ClusteringImage Compression	—Unverified	0
Edge-Enabled Real-time Railway Track Segmentation	Jan 21, 2024	GPUQuantization	—Unverified	0

Show:10 25 50

← PrevPage 68 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified