Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2251–2300 of 4925 papers

Title	Date	Tasks	Status
A Cost-Efficient FPGA Implementation of Tiny Transformer Model using Neural ODE	Jan 5, 2024	CPUEdge-computing	—Unverified
Enhancing Generalization of Invisible Facial Privacy Cloak via Gradient Accumulation	Jan 3, 2024	Face RecognitionQuantization	—Unverified
Model-Free Learning for the Linear Quadratic Regulator over Rate-Limited Channels	Jan 2, 2024	Quantization	—Unverified
General Point Model Pretraining with Autoencoding and Autoregressive	Jan 1, 2024	DecoderLanguage Modeling	CodeCode Available
Are Conventional SNNs Really Efficient? A Perspective from Network Quantization	Jan 1, 2024	FairnessQuantization	—Unverified
Reg-PTQ: Regression-specialized Post-training Quantization for Fully Quantized Object Detector	Jan 1, 2024	Objectobject-detection	—Unverified
Enhancing Post-training Quantization Calibration through Contrastive Learning	Jan 1, 2024	Contrastive LearningQuantization	—Unverified
PredToken: Predicting Unknown Tokens and Beyond with Coarse-to-Fine Iterative Decoding	Jan 1, 2024	Quantization	—Unverified
PikeLPN: Mitigating Overlooked Inefficiencies of Low-Precision Neural Networks	Jan 1, 2024	Quantization	—Unverified
Data-Free Quantization via Pseudo-label Filtering	Jan 1, 2024	Data Free QuantizationModel Compression	—Unverified
HQ-VAE: Hierarchical Discrete Representation Learning with Variational Bayes	Dec 31, 2023	QuantizationRepresentation Learning	—Unverified
Compact Neural Graphics Primitives with Learned Hash Probing	Dec 28, 2023	Quantization	—Unverified
FALCON: Feature-Label Constrained Graph Net Collapse for Memory Efficient GNNs	Dec 27, 2023	BenchmarkingGPU	CodeCode Available
A-SDM: Accelerating Stable Diffusion through Redundancy Removal and Performance Optimization	Dec 24, 2023	Quantization	—Unverified
Efficient Asynchronous Federated Learning with Sparsification and Quantization	Dec 23, 2023	Federated LearningQuantization	—Unverified
Hardware-Aware DNN Compression via Diverse Pruning and Mixed-Precision Quantization	Dec 23, 2023	QuantizationReinforcement Learning (RL)	—Unverified
Cross-Layer Optimization for Fault-Tolerant Deep Learning	Dec 21, 2023	Bayesian OptimizationDeep Learning	—Unverified
Fed-QSSL: A Framework for Personalized Federated Learning under Bitwidth and Data Heterogeneity	Dec 20, 2023	Federated LearningPersonalized Federated Learning	CodeCode Available
Towards Efficient Verification of Quantized Neural Networks	Dec 20, 2023	Heuristic SearchQuantization	CodeCode Available
Find the Lady: Permutation and Re-Synchronization of Deep Neural Networks	Dec 19, 2023	Quantization	CodeCode Available
SimQ-NAS: Simultaneous Quantization Policy and Neural Architecture Search	Dec 19, 2023	Neural Architecture SearchQuantization	—Unverified
Power-Efficient Sampling	Dec 18, 2023	Quantization	—Unverified
Quantized Decoder in Learned Image Compression for Deterministic Reconstruction	Dec 18, 2023	DecoderImage Compression	—Unverified
Post-Training Quantization for Re-parameterization via Coarse & Fine Weight Splitting	Dec 17, 2023	Quantization	CodeCode Available
SPT: Fine-Tuning Transformer-based Language Models Efficiently with Sparsification	Dec 16, 2023	Quantization	CodeCode Available
IQNet: Image Quality Assessment Guided Just Noticeable Difference Prefiltering For Versatile Video Coding	Dec 15, 2023	Image Quality AssessmentQuantization	—Unverified
Adaptive Computation Modules: Granular Conditional Computation For Efficient Inference	Dec 15, 2023	Quantizationspeech-recognition	CodeCode Available
Design Space Exploration of Low-Bit Quantized Neural Networks for Visual Place Recognition	Dec 14, 2023	QuantizationVisual Place Recognition	—Unverified
USM-Lite: Quantization and Sparsity Aware Fine-tuning for Speech Recognition with Universal Speech Models	Dec 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CBQ: Cross-Block Quantization for Large Language Models	Dec 13, 2023	GPUQuantization	—Unverified
When Bio-Inspired Computing meets Deep Learning: Low-Latency, Accurate, & Energy-Efficient Spiking Neural Networks from Artificial Neural Networks	Dec 12, 2023	Quantization	—Unverified
Expand-and-Quantize: Unsupervised Semantic Segmentation Using High-Dimensional Space and Product Quantization	Dec 12, 2023	ClusteringDimensionality Reduction	—Unverified
IDKM: Memory Efficient Neural Network Quantization via Implicit, Differentiable k-Means	Dec 12, 2023	Efficient Neural NetworkQuantization	—Unverified
Decoupling Meta-Reinforcement Learning with Gaussian Task Contexts and Skills	Dec 11, 2023	continuous-controlContinuous Control	CodeCode Available
FP8-BERT: Post-Training Quantization for Transformer	Dec 10, 2023	Quantization	—Unverified
QMGeo: Differentially Private Federated Learning via Stochastic Quantization with Mixed Truncated Geometric Distribution	Dec 10, 2023	Federated LearningQuantization	—Unverified
Neural Architecture Codesign for Fast Bragg Peak Analysis	Dec 10, 2023	AutoMLModel Compression	—Unverified
Agile-Quant: Activation-Guided Quantization for Faster Inference of LLMs on the Edge	Dec 9, 2023	Language ModelingLanguage Modelling	CodeCode Available
Efficient Quantization Strategies for Latent Diffusion Models	Dec 9, 2023	Image GenerationQuantization	—Unverified
Automotive Radar Sensing with Sparse Linear Arrays Using One-Bit Hankel Matrix Completion	Dec 9, 2023	Matrix CompletionQuantization	—Unverified
Understanding the Effect of Model Compression on Social Bias in Large Language Models	Dec 9, 2023	Knowledge DistillationModel Compression	CodeCode Available
An Experimental Study: Assessing the Combined Framework of WavLM and BEST-RQ for Text-to-Speech Synthesis	Dec 8, 2023	BenchmarkingQuantization	—Unverified
GenQ: Quantization in Low Data Regimes with Generative Synthetic Data	Dec 7, 2023	Computational EfficiencyQuantization	CodeCode Available
Rate-splitting Multiple Access for Hierarchical HAP-LAP Networks under Limited Fronthaul	Dec 7, 2023	Quantization	—Unverified
Enhancing Kinship Verification through Multiscale Retinex and Combined Deep-Shallow features	Dec 6, 2023	Kinship VerificationQuantization	—Unverified
All Rivers Run to the Sea: Private Learning with Asymmetric Flows	Dec 5, 2023	AllQuantization	—Unverified
Unified learning-based lossy and lossless JPEG recompression	Dec 5, 2023	Image CompressionQuantization	—Unverified
PLUM: Improving Inference Efficiency By Leveraging Repetition-Sparsity Trade-Off	Dec 4, 2023	BinarizationComputational Efficiency	CodeCode Available
Low-Precision Mixed-Computation Models for Inference on Edge	Dec 3, 2023	Quantization	—Unverified
QuantAttack: Exploiting Dynamic Quantization to Attack Vision Transformers	Dec 3, 2023	Quantization	CodeCode Available

Show:10 25 50

← PrevPage 46 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified