Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1725 of 4925 papers

Title	Date	Tasks	Status
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation	Sep 22, 2024	Image GenerationKnowledge Distillation	—Unverified
CorBin-FL: A Differentially Private Federated Learning Mechanism using Common Randomness	Sep 20, 2024	Federated LearningQuantization	—Unverified
Reduced bit median quantization: A middle process for Efficient Image Compression	Sep 20, 2024	Image CompressionQuantization	—Unverified
PTQ4ADM: Post-Training Quantization for Efficient Text Conditional Audio Diffusion Models	Sep 20, 2024	Audio GenerationAudio Synthesis	—Unverified
TalkMosaic: Interactive PhotoMosaic with Multi-modal LLM Q&A Interactions	Sep 20, 2024	Quantization	—Unverified
NDVQ: Robust Neural Audio Codec with Normal Distribution-Based Vector Quantization	Sep 19, 2024	Audio CompressionAudio Generation	—Unverified
Impact of ML Optimization Tactics on Greener Pre-Trained ML Models	Sep 19, 2024	GPUimage-classification	—Unverified
Scaling FP8 training to trillion-token LLMs	Sep 19, 2024	Quantization	—Unverified
Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview	Sep 18, 2024	Quantization	—Unverified
Low Frame-rate Speech Codec: a Codec Designed for Fast High-quality Speech LLM Training and Inference	Sep 18, 2024	Audio CompressionLanguage Modeling	—Unverified
Pareto Data Framework: Steps Towards Resource-Efficient Decision Making Using Minimum Viable Data (MVD)	Sep 18, 2024	Decision MakingQuantization	—Unverified
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant	Sep 17, 2024	HallucinationInstruction Following	CodeCode Available
LASERS: LAtent Space Encoding for Representations with Sparsity for Generative Modeling	Sep 16, 2024	Dictionary LearningQuantization	—Unverified
Forearm Ultrasound based Gesture Recognition on Edge	Sep 16, 2024	Gesture RecognitionHand Gesture Recognition	—Unverified
Improving Statistical Significance in Human Evaluation of Automatic Metrics via Soft Pairwise Accuracy	Sep 15, 2024	Quantization	—Unverified
Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports	Sep 15, 2024	DiagnosticModel Selection	—Unverified
MesonGS: Post-training Compression of 3D Gaussians via Efficient Attribute Transformation	Sep 15, 2024	AttributeNovel View Synthesis	—Unverified
Privacy-Preserving SAM Quantization for Efficient Edge Intelligence in Healthcare	Sep 14, 2024	Data Free QuantizationImage Segmentation	—Unverified
Robust Training of Neural Networks at Arbitrary Precision and Sparsity	Sep 14, 2024	DenoisingQuantization	—Unverified
Investigating Disentanglement in a Phoneme-level Speech Codec for Prosody Modeling	Sep 13, 2024	DecoderDisentanglement	—Unverified
Efficient and Reliable Vector Similarity Search Using Asymmetric Encoding with NAND-Flash for Many-Class Few-Shot Learning	Sep 12, 2024	Few-Shot LearningQuantization	—Unverified
Dequantization of a signal from two parallel quantized observations	Sep 12, 2024	Quantization	—Unverified
STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM	Sep 11, 2024	Language ModellingLarge Language Model	—Unverified
NVRC: Neural Video Representation Compression	Sep 11, 2024	Model CompressionQuantization	—Unverified
Adaptive Error-Bounded Hierarchical Matrices for Efficient Neural Network Compression	Sep 11, 2024	Efficient Neural NetworkNeural Network Compression	—Unverified

Show:10 25 50

← PrevPage 69 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified