Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2551–2600 of 4925 papers

Title	Date	Tasks	Status
Line Spectrum Estimation and Detection with Few-bit ADCs: Theoretical Analysis and Generalized NOMP Algorithm	Jul 2, 2023	QuantizationSuper-Resolution	—Unverified
Analysis of the influence of final resolution on ADC accuracy	Jul 1, 2023	Quantization	—Unverified
Q-YOLO: Efficient Inference for Real-time Object Detection	Jul 1, 2023	Objectobject-detection	—Unverified
On a Relation Between the Rate-Distortion Function and Optimal Transport	Jul 1, 2023	QuantizationRelation	—Unverified
Unlimited Sampling Radar: a Real-Time End-to-End Demonstrator	Jun 30, 2023	Quantization	—Unverified
Designing strong baselines for ternary neural network quantization through support and mass equalization	Jun 30, 2023	Quantization	—Unverified
ReLU Neural Networks, Polyhedral Decompositions, and Persistent Homolog	Jun 30, 2023	Quantization	—Unverified
Analysis of Oversampling in Uplink Massive MIMO-OFDM with Low-Resolution ADCs	Jun 30, 2023	Quantization	—Unverified
Rapid-INR: Storage Efficient CPU-free DNN Training Using Implicit Neural Representation	Jun 29, 2023	CPUGPU	CodeCode Available
A Structurally Regularized CNN Architecture via Adaptive Subband Decomposition	Jun 29, 2023	image-classificationImage Classification	—Unverified
DNA-TEQ: An Adaptive Exponential Quantization of Tensors for DNN Inference	Jun 28, 2023	Quantization	—Unverified
Efficient High-Resolution Template Matching with Vector Quantized Nearest Neighbour Fields	Jun 26, 2023	Image Registrationobject-detection	CodeCode Available
INR-MDSQC: Implicit Neural Representation Multiple Description Scalar Quantization for robust image Coding	Jun 24, 2023	Quantization	—Unverified
Partitioning-Guided K-Means: Extreme Empty Cluster Resolution for Extreme Model Compression	Jun 24, 2023	Model CompressionQuantization	—Unverified
QNNRepair: Quantized Neural Network Repair	Jun 23, 2023	Data Free QuantizationFault localization	—Unverified
Image storage on synthetic DNA using compressive autoencoders and DNA-adapted entropy coders	Jun 22, 2023	Image CompressionQuantization	—Unverified
Subgraph Stationary Hardware-Software Inference Co-Design	Jun 21, 2023	Quantization	—Unverified
An efficient and straightforward online quantization method for a data stream through remove-birth updating	Jun 21, 2023	Drift DetectionQuantization	CodeCode Available
DynaQuant: Compressing Deep Learning Training Checkpoints via Dynamic Quantization	Jun 20, 2023	Deep LearningModel Compression	—Unverified
Low-complexity Multidimensional DCT Approximations	Jun 20, 2023	QuantizationVisual Tracking	—Unverified
Randomized Quantization is All You Need for Differential Privacy in Federated Learning	Jun 20, 2023	AllFederated Learning	CodeCode Available
Pushing the Limits of 3D Shape Generation at Scale	Jun 20, 2023	3D Generation3D Shape Generation	—Unverified
Dynamic Cell Modeling of Li-Ion Polymer Batteries for Precise SOC Estimation in Power-Needy Autonomous Electric Vehicles	Jun 19, 2023	Quantization	—Unverified
Magnificent Minified Models	Jun 16, 2023	Quantization	—Unverified
ZeRO++: Extremely Efficient Collective Communication for Giant Model Training	Jun 16, 2023	GPUQuantization	—Unverified
PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with Dual-Discriminators	Jun 15, 2023	Image EnhancementQuantization	CodeCode Available
Neural Network Compression using Binarization and Few Full-Precision Weights	Jun 15, 2023	BinarizationCPU	—Unverified
High-performance deep spiking neural networks with 0.3 spikes per neuron	Jun 14, 2023	image-classificationImage Classification	—Unverified
GQFedWAvg: Optimization-Based Quantized Federated Learning in General Edge Computing Systems	Jun 13, 2023	Edge-computingFederated Learning	CodeCode Available
Discrete Graph Auto-Encoder	Jun 13, 2023	Graph GenerationQuantization	—Unverified
MFSN: Multi-perspective Fusion Search Network For Pre-training Knowledge in Speech Emotion Recognition	Jun 12, 2023	Emotion RecognitionQuantization	—Unverified
Sparse-Inductive Generative Adversarial Hashing for Nearest Neighbor Search	Jun 12, 2023	compressed sensingQuantization	—Unverified
Resource Efficient Neural Networks Using Hessian Based Pruning	Jun 12, 2023	GPUimage-classification	—Unverified
End-to-End Neural Network Compression via _1_2 Regularized Latency Surrogates	Jun 9, 2023	Neural Architecture SearchNeural Network Compression	—Unverified
Mixed-TD: Efficient Neural Network Accelerator with Layer-Specific Tensor Decomposition	Jun 8, 2023	Efficient Neural NetworkQuantization	CodeCode Available
Precision-aware Latency and Energy Balancing on Multi-Accelerator Platforms for DNN Inference	Jun 8, 2023	Quantization	—Unverified
Iterative Signal Processing for Integrated Sensing and Communication Systems	Jun 8, 2023	Integrated sensing and communicationISAC	—Unverified
Augmenting Hessians with Inter-Layer Dependencies for Mixed-Precision Post-Training Quantization	Jun 8, 2023	Quantization	—Unverified
Sensitivity-Aware Finetuning for Accuracy Recovery on Deep Learning Hardware	Jun 5, 2023	Deep LearningQuantization	—Unverified
An Information-Theoretic Analysis of Self-supervised Discrete Representations of Speech	Jun 4, 2023	QuantizationRepresentation Learning	CodeCode Available
Temporal Dynamic Quantization for Diffusion Models	Jun 4, 2023	Quantization	—Unverified
Modular Transformers: Compressing Transformers into Modularized Layers for Flexible Efficient Inference	Jun 4, 2023	DecoderKnowledge Distillation	—Unverified
Group channel pruning and spatial attention distilling for object detection	Jun 2, 2023	Knowledge DistillationModel Compression	—Unverified
Dynamic quantized consensus under DoS attacks: Towards a tight zooming-out factor	Jun 1, 2023	Quantization	—Unverified
On the Effectiveness of Hybrid Mutual Information Estimation	Jun 1, 2023	Mutual Information EstimationQuantization	—Unverified
Quantization-Aware and Tensor-Compressed Training of Transformers for Natural Language Understanding	Jun 1, 2023	Natural Language UnderstandingQuantization	—Unverified
Towards Learning Discrete Representations via Self-Supervision for Wearables-Based Human Activity Recognition	Jun 1, 2023	Activity RecognitionHuman Activity Recognition	—Unverified
FlexRound: Learnable Rounding based on Element-wise Division for Post-Training Quantization	Jun 1, 2023	image-classificationImage Classification	CodeCode Available
Asymptotic Performance Analysis of Large-Scale Active IRS-Aided Wireless Network	May 31, 2023	Quantization	—Unverified
PreQuant: A Task-agnostic Quantization Approach for Pre-trained Language Models	May 30, 2023	parameter-efficient fine-tuningQuantization	—Unverified

Show:10 25 50

← PrevPage 52 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified