Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 4925 papers

Title	Date	Tasks	Status	Hype
Deep activity propagation via weight initialization in spiking neural networks	Oct 1, 2024	Quantization	—Unverified	0
Trainable pruned ternary quantization for medical signal classification models	Oct 1, 2024	Model CompressionQuantization	CodeCode Available	0
Quantized and Asynchronous Federated Learning	Sep 30, 2024	Federated LearningQuantization	—Unverified	0
Mixed-Precision Embeddings for Large-Scale Recommendation Models	Sep 30, 2024	QuantizationRecommendation Systems	—Unverified	0
Constraint Guided Model Quantization of Neural Networks	Sep 30, 2024	modelQuantization	—Unverified	0
Accelerating PoT Quantization on Edge Devices	Sep 30, 2024	CPUQuantization	CodeCode Available	0
Aggressive Post-Training Compression on Extremely Large Language Models	Sep 30, 2024	Model CompressionNetwork Pruning	—Unverified	0
Rotated Runtime Smooth: Training-Free Activation Smoother for accurate INT4 inference	Sep 30, 2024	Quantization	—Unverified	0
InfantCryNet: A Data-driven Framework for Intelligent Analysis of Infant Cries	Sep 29, 2024	Knowledge DistillationModel Compression	—Unverified	0
Efficient Federated Intrusion Detection in 5G ecosystem using optimized BERT-based model	Sep 28, 2024	Federated LearningIntrusion Detection	CodeCode Available	0
Asymptotic tracking control of dynamic reference over homomorphically encrypted data with finite modulus	Sep 27, 2024	Quantization	—Unverified	0
Heterogeneous quantization regularizes spiking neural network activity	Sep 27, 2024	DenoisingQuantization	—Unverified	0
A method of using RSVD in residual calculation of LowBit GEMM	Sep 27, 2024	Data Free QuantizationQuantization	—Unverified	0
Fronthaul-Constrained Distributed Radar Sensing	Sep 26, 2024	Quantization	—Unverified	0
Digital and Hybrid Precoding Designs in Massive MIMO with Low-Resolution ADCs	Sep 26, 2024	Quantization	CodeCode Available	0
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available	0
Efficient Arbitrary Precision Acceleration for Large Language Models on GPU Tensor Cores	Sep 26, 2024	GPUManagement	—Unverified	0
P4Q: Learning to Prompt for Quantization in Visual-language Models	Sep 26, 2024	Quantization	—Unverified	0
MoGenTS: Motion Generation based on Spatial-Temporal Joint Modeling	Sep 26, 2024	Motion GenerationQuantization	—Unverified	0
Using Random Codebooks for Audio Neural AutoEncoders	Sep 25, 2024	Audio CompressionQuantization	—Unverified	0
Reinforcement Learning for Finite Space Mean-Field Type Games	Sep 25, 2024	Deep Reinforcement LearningQ-Learning	—Unverified	0
Search for Efficient Large Language Models	Sep 25, 2024	GPUModel Compression	CodeCode Available	1
AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantization	Sep 25, 2024	Quantization	CodeCode Available	0
A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms	Sep 25, 2024	Quantization	—Unverified	0
Accumulator-Aware Post-Training Quantization	Sep 25, 2024	image-classificationImage Classification	—Unverified	0
INT-FlashAttention: Enabling Flash Attention for INT8 Quantization	Sep 25, 2024	GPUQuantization	CodeCode Available	2
VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models	Sep 25, 2024	Quantization	CodeCode Available	4
BitQ: Tailoring Block Floating Point Precision for Improved DNN Efficiency on Resource-Constrained Devices	Sep 25, 2024	image-classificationImage Classification	CodeCode Available	1
PTQ4RIS: Post-Training Quantization for Referring Image Segmentation	Sep 25, 2024	Image SegmentationQuantization	CodeCode Available	0
LLaMa-SciQ: An Educational Chatbot for Answering Science MCQ	Sep 25, 2024	ChatbotGSM8K	—Unverified	0
Communication and Energy Efficient Federated Learning using Zero-Order Optimization Technique	Sep 24, 2024	Federated LearningQuantization	—Unverified	0
A Formalization of Image Vectorization by Region Merging	Sep 24, 2024	Image SegmentationQuantization	—Unverified	0
Twin Network Augmentation: A Novel Training Strategy for Improved Spiking Neural Networks and Efficient Weight Quantization	Sep 24, 2024	Knowledge DistillationQuantization	—Unverified	0
TCSinger: Zero-Shot Singing Voice Synthesis with Style Transfer and Multi-Level Style Control	Sep 24, 2024	ClusteringLanguage Modelling	CodeCode Available	3
Ultra-low latency quantum-inspired machine learning predictors implemented on FPGA	Sep 24, 2024	QuantizationTensor Networks	—Unverified	0
Disentanglement with Factor Quantized Variational Autoencoders	Sep 23, 2024	DisentanglementInductive Bias	CodeCode Available	0
MICSim: A Modular Simulator for Mixed-signal Compute-in-Memory based AI Accelerator	Sep 23, 2024	Quantization	CodeCode Available	1
SPAQ-DL-SLAM: Towards Optimizing Deep Learning-based SLAM for Resource-Constrained Embedded Platforms	Sep 22, 2024	QuantizationSimultaneous Localization and Mapping	—Unverified	0
Thinking in Granularity: Dynamic Quantization for Image Super-Resolution by Intriguing Multi-Granularity Clues	Sep 22, 2024	Image Super-ResolutionQuantization	CodeCode Available	0
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation	Sep 22, 2024	Image GenerationKnowledge Distillation	—Unverified	0
CorBin-FL: A Differentially Private Federated Learning Mechanism using Common Randomness	Sep 20, 2024	Federated LearningQuantization	—Unverified	0
Reduced bit median quantization: A middle process for Efficient Image Compression	Sep 20, 2024	Image CompressionQuantization	—Unverified	0
PTQ4ADM: Post-Training Quantization for Efficient Text Conditional Audio Diffusion Models	Sep 20, 2024	Audio GenerationAudio Synthesis	—Unverified	0
TalkMosaic: Interactive PhotoMosaic with Multi-modal LLM Q&A Interactions	Sep 20, 2024	Quantization	—Unverified	0
NDVQ: Robust Neural Audio Codec with Normal Distribution-Based Vector Quantization	Sep 19, 2024	Audio CompressionAudio Generation	—Unverified	0
Scaling FP8 training to trillion-token LLMs	Sep 19, 2024	Quantization	—Unverified	0
Impact of ML Optimization Tactics on Greener Pre-Trained ML Models	Sep 19, 2024	GPUimage-classification	—Unverified	0
Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview	Sep 18, 2024	Quantization	—Unverified	0
Low Frame-rate Speech Codec: a Codec Designed for Fast High-quality Speech LLM Training and Inference	Sep 18, 2024	Audio CompressionLanguage Modeling	—Unverified	0
Pareto Data Framework: Steps Towards Resource-Efficient Decision Making Using Minimum Viable Data (MVD)	Sep 18, 2024	Decision MakingQuantization	—Unverified	0

Show:10 25 50

← PrevPage 20 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified