Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1750 of 4925 papers

Title	Date	Tasks	Status
Thinking in Granularity: Dynamic Quantization for Image Super-Resolution by Intriguing Multi-Granularity Clues	Sep 22, 2024	Image Super-ResolutionQuantization	CodeCode Available
CorBin-FL: A Differentially Private Federated Learning Mechanism using Common Randomness	Sep 20, 2024	Federated LearningQuantization	—Unverified
Reduced bit median quantization: A middle process for Efficient Image Compression	Sep 20, 2024	Image CompressionQuantization	—Unverified
PTQ4ADM: Post-Training Quantization for Efficient Text Conditional Audio Diffusion Models	Sep 20, 2024	Audio GenerationAudio Synthesis	—Unverified
TalkMosaic: Interactive PhotoMosaic with Multi-modal LLM Q&A Interactions	Sep 20, 2024	Quantization	—Unverified
Impact of ML Optimization Tactics on Greener Pre-Trained ML Models	Sep 19, 2024	GPUimage-classification	—Unverified
NDVQ: Robust Neural Audio Codec with Normal Distribution-Based Vector Quantization	Sep 19, 2024	Audio CompressionAudio Generation	—Unverified
Scaling FP8 training to trillion-token LLMs	Sep 19, 2024	Quantization	—Unverified
Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview	Sep 18, 2024	Quantization	—Unverified
Pareto Data Framework: Steps Towards Resource-Efficient Decision Making Using Minimum Viable Data (MVD)	Sep 18, 2024	Decision MakingQuantization	—Unverified
Low Frame-rate Speech Codec: a Codec Designed for Fast High-quality Speech LLM Training and Inference	Sep 18, 2024	Audio CompressionLanguage Modeling	—Unverified
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant	Sep 17, 2024	HallucinationInstruction Following	CodeCode Available
LASERS: LAtent Space Encoding for Representations with Sparsity for Generative Modeling	Sep 16, 2024	Dictionary LearningQuantization	—Unverified
Forearm Ultrasound based Gesture Recognition on Edge	Sep 16, 2024	Gesture RecognitionHand Gesture Recognition	—Unverified
Improving Statistical Significance in Human Evaluation of Automatic Metrics via Soft Pairwise Accuracy	Sep 15, 2024	Quantization	—Unverified
Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports	Sep 15, 2024	DiagnosticModel Selection	—Unverified
MesonGS: Post-training Compression of 3D Gaussians via Efficient Attribute Transformation	Sep 15, 2024	AttributeNovel View Synthesis	—Unverified
Robust Training of Neural Networks at Arbitrary Precision and Sparsity	Sep 14, 2024	DenoisingQuantization	—Unverified
Privacy-Preserving SAM Quantization for Efficient Edge Intelligence in Healthcare	Sep 14, 2024	Data Free QuantizationImage Segmentation	—Unverified
Investigating Disentanglement in a Phoneme-level Speech Codec for Prosody Modeling	Sep 13, 2024	DecoderDisentanglement	—Unverified
Efficient and Reliable Vector Similarity Search Using Asymmetric Encoding with NAND-Flash for Many-Class Few-Shot Learning	Sep 12, 2024	Few-Shot LearningQuantization	—Unverified
Dequantization of a signal from two parallel quantized observations	Sep 12, 2024	Quantization	—Unverified
Adaptive Error-Bounded Hierarchical Matrices for Efficient Neural Network Compression	Sep 11, 2024	Efficient Neural NetworkNeural Network Compression	—Unverified
Distributed Convolutional Neural Network Training on Mobile and Edge Clusters	Sep 11, 2024	object-detectionObject Detection	—Unverified
NVRC: Neural Video Representation Compression	Sep 11, 2024	Model CompressionQuantization	—Unverified
STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM	Sep 11, 2024	Language ModellingLarge Language Model	—Unverified
AgileIR: Memory-Efficient Group Shifted Windows Attention for Agile Image Restoration	Sep 10, 2024	Image RestorationQuantization	—Unverified
Rate-Constrained Quantization for Communication-Efficient Federated Learning	Sep 10, 2024	Data CompressionFederated Learning	—Unverified
Estimating the Completeness of Discrete Speech Units	Sep 9, 2024	DisentanglementQuantization	—Unverified
ECG Biometric Authentication Using Self-Supervised Learning for IoT Edge Sensors	Sep 9, 2024	Contrastive LearningCPU	—Unverified
TriplePlay: Enhancing Federated Learning with CLIP for Non-IID Data and Resource Efficiency	Sep 9, 2024	FairnessFederated Learning	—Unverified
Distributed Optimization with Finite Bit Adaptive Quantization for Efficient Communication and Precision Enhancement	Sep 9, 2024	Distributed OptimizationQuantization	—Unverified
SGC-VQGAN: Towards Complex Scene Representation via Semantic Guided Clustering Codebook	Sep 9, 2024	ClusteringOnline Clustering	—Unverified
Blind-Adaptive Quantizers	Sep 6, 2024	Quantization	—Unverified
OPAL: Outlier-Preserved Microscaling Quantization Accelerator for Generative Large Language Models	Sep 6, 2024	DecoderQuantization	—Unverified
Investigating Privacy Bias in Training Data of Language Models	Sep 5, 2024	Quantization	—Unverified
WaterMAS: Sharpness-Aware Maximization for Neural Network Watermarking	Sep 5, 2024	image-classificationImage Classification	—Unverified
LAST: Language Model Aware Speech Tokenization	Sep 5, 2024	Language ModelingLanguage Modelling	—Unverified
Recursive Quantization for L_2 Stabilization of a Finite Capacity Stochastic Control Loop with Intermittent State Observations	Sep 5, 2024	Quantization	—Unverified
CoAst: Validation-Free Contribution Assessment for Federated Learning based on Cross-Round Valuation	Sep 4, 2024	Contribution AssessmentFederated Learning	—Unverified
Gaussian Rate-Distortion-Perception Coding and Entropy-Constrained Scalar Quantization	Sep 4, 2024	Quantization	—Unverified
Task-Oriented Communication for Graph Data: A Graph Information Bottleneck Approach	Sep 4, 2024	Quantization	—Unverified
Learning Task-Based Trainable Neuromorphic ADCs via Power-Aware Distillation	Sep 4, 2024	Quantization	—Unverified
Sorbet: A Neuromorphic Hardware-Compatible Transformer-Based Spiking Language Model	Sep 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Foundations of Large Language Model Compression -- Part 1: Weight Quantization	Sep 3, 2024	Language ModelingLanguage Modelling	CodeCode Available
Optimization and Deployment of Deep Neural Networks for PPG-based Blood Pressure Estimation Targeting Low-power Wearables	Sep 3, 2024	Blood pressure estimationNeural Architecture Search	—Unverified
Robust Clustering on High-Dimensional Data with Stochastic Quantization	Sep 3, 2024	ClusteringComputational Efficiency	CodeCode Available
Compressing VAE-Based Out-of-Distribution Detectors for Embedded Deployment	Sep 2, 2024	CPUGPU	—Unverified
One-Index Vector Quantization Based Adversarial Attack on Image Classification	Sep 2, 2024	Adversarial Attackimage-classification	—Unverified
Edge AI: Evaluation of Model Compression Techniques for Convolutional Neural Networks	Sep 2, 2024	Edge-computingimage-classification	—Unverified

Show:10 25 50

← PrevPage 35 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified