Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2175 of 4925 papers

Title	Date	Tasks	Status
Variable-Rate Learned Image Compression with Multi-Objective Optimization and Quantization-Reconstruction Offsets	Feb 29, 2024	Image CompressionQuantization	—Unverified
T3DNet: Compressing Point Cloud Models for Lightweight 3D Recognition	Feb 29, 2024	Autonomous DrivingQuantization	—Unverified
FlattenQuant: Breaking Through the Inference Compute-bound for Large Language Models with Per-tensor Quantization	Feb 28, 2024	GPUQuantization	—Unverified
No Token Left Behind: Reliable KV Cache Compression via Importance-Aware Mixed Precision Quantization	Feb 28, 2024	Quantization	—Unverified
Ef-QuantFace: Streamlined Face Recognition with Small Data and Low-Bit Precision	Feb 28, 2024	Face RecognitionQuantization	—Unverified
Adaptive quantization with mixed-precision based on low-cost proxy	Feb 27, 2024	Neural Architecture SearchQuantization	—Unverified
Rethinking Mutual Information for Language Conditioned Skill Discovery on Imitation Learning	Feb 27, 2024	Imitation LearningQuantization	—Unverified
Inpainting Computational Fluid Dynamics with Deep Learning	Feb 27, 2024	Deep LearningQuantization	—Unverified
Neural Video Compression with Feature Modulation	Feb 27, 2024	BlockingQuantization	—Unverified
SPC-NeRF: Spatial Predictive Compression for Voxel Based Radiance Field	Feb 26, 2024	Image CompressionNeRF	—Unverified
Distortion-Controlled Dithering with Reduced Recompression Rate	Feb 26, 2024	Data CompressionImage Compression	—Unverified
A Comprehensive Evaluation of Quantization Strategies for Large Language Models	Feb 26, 2024	Language ModelingLanguage Modelling	CodeCode Available
Data-freeWeight Compress and Denoise for Large Language Models	Feb 26, 2024	GPUQuantization	—Unverified
Towards Accurate Post-training Quantization for Reparameterized Models	Feb 25, 2024	Quantization	CodeCode Available
EncodingNet: A Novel Encoding-based MAC Design for Efficient Neural Network Acceleration	Feb 25, 2024	Efficient Neural Networkimage-classification	CodeCode Available
GPTVQ: The Blessing of Dimensionality for LLM Quantization	Feb 23, 2024	CPUQuantization	—Unverified
Text me the data: Generating Ground Pressure Sequence from Textual Descriptions for HAR	Feb 22, 2024	Activity RecognitionHuman Activity Recognition	—Unverified
On the Arrow of Inference	Feb 22, 2024	counterfactualCounterfactual Reasoning	—Unverified
FinGPT-HPC: Efficient Pretraining and Finetuning Large Language Models for Financial Applications with High-Performance Computing	Feb 21, 2024	GPUModel Compression	—Unverified
In-Distribution Consistency Regularization Improves the Generalization of Quantization-Aware Training	Feb 21, 2024	Knowledge DistillationQuantization	—Unverified
APTQ: Attention-aware Post-Training Mixed-Precision Quantization for Large Language Models	Feb 21, 2024	Quantization	—Unverified
Tiny Reinforcement Learning for Quadruped Locomotion using Decision Transformers	Feb 20, 2024	Imitation LearningQuantization	CodeCode Available
Towards a tailored mixed-precision sub-8-bit quantization scheme for Gated Recurrent Units using Genetic Algorithms	Feb 19, 2024	Model CompressionQuantization	—Unverified
WKVQuant: Quantizing Weight and Key/Value Cache for Large Language Models Gains More	Feb 19, 2024	QuantizationText Generation	—Unverified
Is It a Free Lunch for Removing Outliers during Pretraining?	Feb 19, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 87 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified