Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2076–2100 of 4925 papers

Title	Date	Tasks	Status
Weakly Supervised Deep Hyperspherical Quantization for Image Retrieval	Apr 7, 2024	Image RetrievalQuantization	CodeCode Available
Nanometer Scanning with Micrometer Sensing: Beating Quantization Constraints in Lissajous Trajectory Tracking	Apr 7, 2024	Quantization	—Unverified
What Happens When Small Is Made Smaller? Exploring the Impact of Compression on Small Data Pretrained Language Models	Apr 6, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Fine-Tuning, Quantization, and LLMs: Navigating Unintended Outcomes	Apr 5, 2024	Quantization	—Unverified
TinyVQA: Compact Multimodal Deep Neural Network for Visual Question Answering on Resource-Constrained Devices	Apr 4, 2024	QuantizationQuestion Answering	—Unverified
Mitigating the Impact of Outlier Channels for Language Model Quantization with Activation Regularization	Apr 4, 2024	GPULanguage Modeling	CodeCode Available
DI-Retinex: Digital-Imaging Retinex Theory for Low-Light Image Enhancement	Apr 4, 2024	Image EnhancementLow-Light Image Enhancement	—Unverified
CLaM-TTS: Improving Neural Codec Language Model for Zero-Shot Text-to-Speech	Apr 3, 2024	Language ModelingLanguage Modelling	—Unverified
Cherry on Top: Parameter Heterogeneity and Quantization in Large Language Models	Apr 3, 2024	Quantization	—Unverified
DNN Memory Footprint Reduction via Post-Training Intra-Layer Multi-Precision Quantization	Apr 3, 2024	Edge-computingQuantization	—Unverified
NeRFCodec: Neural Feature Compression Meets Neural Radiance Fields for Memory-Efficient Scene Representation	Apr 2, 2024	DecoderFeature Compression	—Unverified
Minimize Quantization Output Error with Bias Compensation	Apr 2, 2024	Quantization	CodeCode Available
On the Effect of Quantization on Dynamic Mode Decomposition	Apr 2, 2024	Quantization	—Unverified
RefQSR: Reference-based Quantization for Image Super-Resolution Networks	Apr 2, 2024	Image Super-ResolutionQuantization	—Unverified
A Novel Audio Representation for Music Genre Identification in MIR	Apr 1, 2024	Information RetrievalMusic Information Retrieval	—Unverified
Instance-Aware Group Quantization for Vision Transformers	Apr 1, 2024	image-classificationImage Classification	—Unverified
Towards Variable and Coordinated Holistic Co-Speech Motion Generation	Mar 30, 2024	Motion GenerationQuantization	—Unverified
Accurate Block Quantization in LLMs with Outliers	Mar 29, 2024	Quantization	—Unverified
Transformer-Lite: High-efficiency Deployment of Large Language Models on Mobile Phone GPUs	Mar 29, 2024	CPUGPU	—Unverified
QNCD: Quantization Noise Correction for Diffusion Models	Mar 28, 2024	DenoisingImage Generation	CodeCode Available
Meta-Heuristic Fronthaul Bit Allocation for Cell-free Massive MIMO Systems	Mar 28, 2024	CPUFairness	—Unverified
Uncertainty-Aware Deep Video Compression with Ensembles	Mar 28, 2024	DiversityMotion Estimation	—Unverified
Within the Dynamic Context: Inertia-aware 3D Human Modeling with Pose Sequence	Mar 28, 2024	Neural RenderingQuantization	—Unverified
Oh! We Freeze: Improving Quantized Knowledge Distillation via Signal Propagation Analysis for Large Language Models	Mar 26, 2024	Knowledge DistillationQuantization	—Unverified
Order of Compression: A Systematic and Optimal Sequence to Combinationally Compress CNN	Mar 26, 2024	Knowledge DistillationModel Compression	—Unverified

Show:10 25 50

← PrevPage 84 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified