Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3600 of 4925 papers

Title	Date	Tasks	Status
3U-EdgeAI: Ultra-Low Memory Training, Ultra-Low BitwidthQuantization, and Ultra-Low Latency Acceleration	May 11, 2021	Model CompressionQuantization	—Unverified
Estimation and Quantization of Expected Persistence Diagrams	May 11, 2021	QuantizationTime Series	—Unverified
In-Hindsight Quantization Range Estimation for Quantized Training	May 10, 2021	image-classificationImage Classification	—Unverified
RBNN: Memory-Efficient Reconfigurable Deep Binary Neural Network with IP Protection for Internet of Things	May 9, 2021	Quantization	—Unverified
Model Selection CNN-based VVC QualityEnhancement	May 7, 2021	Decodermodel	—Unverified
Q-Rater: Non-Convex Optimization for Post-Training Uniform Quantization	May 5, 2021	Quantization	—Unverified
Training Quantized Neural Networks to Global Optimality via Semidefinite Programming	May 4, 2021	Quantization	—Unverified
A reconfigurable neural network ASIC for detector front-end data compression at the HL-LHC	May 4, 2021	Data CompressionHigh-Level Synthesis	—Unverified
One Model for All Quantization: A Quantized Network Supporting Hot-Swap Bit-Width Adjustment	May 4, 2021	AllDiversity	—Unverified
On the Adversarial Robustness of Quantized Neural Networks	May 1, 2021	Adversarial RobustnessModel Compression	—Unverified
Stealthy Backdoors as Compression Artifacts	Apr 30, 2021	Backdoor AttackModel Compression	CodeCode Available
Memory-Efficient Deep Learning Inference in Trusted Execution Environments	Apr 30, 2021	Deep LearningQuantization	—Unverified
Hessian Aware Quantization of Spiking Neural Networks	Apr 29, 2021	Quantization	CodeCode Available
NUQSGD: Provably Communication-efficient Data-parallel SGD via Nonuniform Quantization	Apr 28, 2021	Quantization	—Unverified
HAO: Hardware-aware neural Architecture Optimization for Efficient Inference	Apr 26, 2021	Hardware Aware Neural Architecture Searchimage-classification	—Unverified
Spatio-Temporal Pruning and Quantization for Low-latency Spiking Neural Networks	Apr 26, 2021	Model CompressionQuantization	—Unverified
Quantization of Deep Neural Networks for Accurate Edge Computing	Apr 25, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Do All MobileNets Quantize Poorly? Gaining Insights into the Effect of Quantization on Depthwise Separable Convolutional Networks Through the Eyes of Multi-scale Distributional Dynamics	Apr 24, 2021	AllQuantization	—Unverified
FPGA Implementations of Layered MinSum LDPC Decoders Using RCQ Message Passing	Apr 19, 2021	DecoderQuantization	—Unverified
Filtering Empty Camera Trap Images in Embedded Systems	Apr 18, 2021	Image ClassificationQuantization	CodeCode Available
Random and Adversarial Bit Error Robustness: Energy-Efficient and Secure DNN Accelerators	Apr 16, 2021	Quantization	CodeCode Available
Homomorphic Encryption-Enabled Distance-Based Distributed Formation Control with Distance Mismatch Estimators	Apr 15, 2021	Quantization	—Unverified
Span Pointer Networks for Non-Autoregressive Task-Oriented Semantic Parsing	Apr 15, 2021	Cross-Lingual TransferDecoder	—Unverified
End-to-end Keyword Spotting using Neural Architecture Search and Quantization	Apr 14, 2021	Keyword SpottingNeural Architecture Search	—Unverified
NoiseVC: Towards High Quality Zero-Shot Voice Conversion	Apr 13, 2021	DisentanglementQuantization	—Unverified
Soft then Hard: Rethinking the Quantization in Neural Image Compression	Apr 12, 2021	Image CompressionQuantization	—Unverified
A Novel Unified Model for Multi-exposure Stereo Coding Based on Low Rank Tucker-ALS and 3D-HEVC	Apr 10, 2021	Quantization	—Unverified
Q-matrix Unaware Double JPEG Detection using DCT-Domain Deep BiLSTM Network	Apr 10, 2021	Quantization	—Unverified
Quantized State Feedback Stabilization of Nonlinear Systems under Denial-of-Service	Apr 9, 2021	DecoderQuantization	—Unverified
Functional quantization of rough volatility and applications to volatility derivatives	Apr 9, 2021	Quantization	—Unverified
Learned transform compression with optimized entropy encoding	Apr 7, 2021	Quantization	CodeCode Available
Towards On-Device Face Recognition in Body-worn Cameras	Apr 7, 2021	Face IdentificationFace Recognition	—Unverified
TENT: Efficient Quantization of Neural Networks on the tiny Edge with Tapered FixEd PoiNT	Apr 6, 2021	Quantization	—Unverified
Binary Neural Network for Speaker Verification	Apr 6, 2021	BinarizationQuantization	—Unverified
Unconstrained Face Recognition using ASURF and Cloud-Forest Classifier optimized with VLAD	Apr 2, 2021	Face DetectionFace Recognition	—Unverified
Arabic Compact Language Modelling for Resource Limited Devices	Apr 1, 2021	Language ModelingLanguage Modelling	—Unverified
Bit-Mixer: Mixed-precision networks with runtime bit-width selection	Mar 31, 2021	AutoMLBinarization	—Unverified
1-Bit Compressive Sensing for Efficient Federated Learning Over the Air	Mar 30, 2021	Compressive SensingDimensionality Reduction	—Unverified
Zero-shot Adversarial Quantization	Mar 29, 2021	Data Free QuantizationQuantization	—Unverified
Automated Backend-Aware Post-Training Quantization	Mar 27, 2021	CPUDiversity	—Unverified
Scalable and Efficient Neural Speech Coding: A Hybrid Design	Mar 27, 2021	Quantization	—Unverified
Hierarchical Federated Learning with Quantization: Convergence Analysis and System Design	Mar 26, 2021	Federated LearningQuantization	—Unverified
A Survey of Quantization Methods for Efficient Neural Network Inference	Mar 25, 2021	Efficient Neural NetworkQuantization	—Unverified
DNN Quantization with Attention	Mar 24, 2021	Object RecognitionQuantization	—Unverified
RPVNet: A Deep and Efficient Range-Point-Voxel Fusion Network for LiDAR Point Cloud Segmentation	Mar 24, 2021	Point Cloud SegmentationQuantization	—Unverified
The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Architectures	Mar 23, 2021	Information RetrievalKnowledge Distillation	—Unverified
Decomposing Normal and Abnormal Features of Medical Images into Discrete Latent Codes for Content-Based Image Retrieval	Mar 23, 2021	AnatomyContent-Based Image Retrieval	—Unverified
n-hot: Efficient bit-level sparsity for powers-of-two neural network quantization	Mar 22, 2021	object-detectionObject Detection	—Unverified
Evaluating Post-Training Compression in GANs using Locality-Sensitive Hashing	Mar 22, 2021	DiversityQuantization	—Unverified
Resilient Control under Quantization and Denial-of-Service: Co-designing a Deadbeat Controller and Transmission Protocol	Mar 22, 2021	DecoderQuantization	—Unverified

Show:10 25 50

← PrevPage 72 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified