Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1651–1675 of 4925 papers

Title	Date	Tasks	Status
Gesture2Text: A Generalizable Decoder for Word-Gesture Keyboards in XR Through Trajectory Coarse Discretization and Pre-training	Oct 8, 2024	DecoderQuantization	—Unverified
Variable Resolution Pixel Quantization for Low Power Machine Vision Application on Edge	Oct 7, 2024	Edge-computingimage-classification	—Unverified
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search	Oct 7, 2024	Fire DetectionNeural Architecture Search	—Unverified
Continuous Approximations for Improving Quantization Aware Training of LLMs	Oct 6, 2024	MMLUModel Compression	—Unverified
HALL-E: Hierarchical Neural Codec Language Model for Minute-Long Zero-Shot Text-to-Speech Synthesis	Oct 6, 2024	Language ModelingLanguage Modelling	—Unverified
PalmBench: A Comprehensive Benchmark of Compressed Large Language Models on Mobile Platforms	Oct 5, 2024	BenchmarkingGPU	—Unverified
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available
Generative Semantic Communication for Text-to-Speech Synthesis	Oct 4, 2024	QuantizationSemantic Communication	—Unverified
Resource-aware Mixed-precision Quantization for Enhancing Deployability of Transformers for Time-series Forecasting on Embedded FPGAs	Oct 4, 2024	Neural Architecture SearchQuantization	—Unverified
MIMO Detection with Spatial Sigma-Delta ADCs: A Variational Bayesian Approach	Oct 4, 2024	Quantization	—Unverified
SEAL: SEmantic-Augmented Imitation Learning via Language Model	Oct 3, 2024	Decision MakingImitation Learning	—Unverified
Remember and Recall: Associative-Memory-based Trajectory Prediction	Oct 3, 2024	Autonomous DrivingComputational Efficiency	—Unverified
Overcoming Representation Bias in Fairness-Aware data Repair using Optimal Transport	Oct 3, 2024	AttributeFairness	—Unverified
Restorative Speech Enhancement: A Progressive Approach Using SE and Codec Modules	Oct 2, 2024	QuantizationSpeech Enhancement	—Unverified
Getting Free Bits Back from Rotational Symmetries in LLMs	Oct 2, 2024	Quantization	—Unverified
Compressing Recurrent Neural Networks for FPGA-accelerated Implementation in Fluorescence Lifetime Imaging	Oct 1, 2024	Computational EfficiencyKnowledge Distillation	—Unverified
Trainable pruned ternary quantization for medical signal classification models	Oct 1, 2024	Model CompressionQuantization	CodeCode Available
Deep activity propagation via weight initialization in spiking neural networks	Oct 1, 2024	Quantization	—Unverified
STanH : Parametric Quantization for Variable Rate Learned Image Compression	Oct 1, 2024	DecoderImage Compression	—Unverified
Aggressive Post-Training Compression on Extremely Large Language Models	Sep 30, 2024	Model CompressionNetwork Pruning	—Unverified
Constraint Guided Model Quantization of Neural Networks	Sep 30, 2024	modelQuantization	—Unverified
Accelerating PoT Quantization on Edge Devices	Sep 30, 2024	CPUQuantization	CodeCode Available
Mixed-Precision Embeddings for Large-Scale Recommendation Models	Sep 30, 2024	QuantizationRecommendation Systems	—Unverified
Quantized and Asynchronous Federated Learning	Sep 30, 2024	Federated LearningQuantization	—Unverified
Rotated Runtime Smooth: Training-Free Activation Smoother for accurate INT4 inference	Sep 30, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 67 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified