Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4501–4550 of 4925 papers

Title	Date	Tasks	Status
Coreset-Based Neural Network Compression	Jul 25, 2018	Neural Network CompressionQuantization	—Unverified
StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction	Jul 24, 2018	Depth EstimationDepth Prediction	CodeCode Available
Statistical Model Compression for Small-Footprint Natural Language Understanding	Jul 19, 2018	Model CompressionNatural Language Understanding	—Unverified
Hybrid Scene Compression for Visual Localization	Jul 19, 2018	QuantizationSelf-Driving Cars	—Unverified
Performance, Power, and Area Design Trade-offs in Millimeter-Wave Transmitter Beamforming Architectures	Jul 19, 2018	Quantization	CodeCode Available
Defend Deep Neural Networks Against Adversarial Examples via Fixed and Dynamic Quantized Activation Functions	Jul 18, 2018	Quantization	—Unverified
Accuracy to Throughput Trade-offs for Reduced Precision Neural Networks on Reconfigurable Logic	Jul 17, 2018	Quantization	—Unverified
Bridging the Accuracy Gap for 2-bit Quantized Neural Networks (QNN)	Jul 17, 2018	General ClassificationQuantization	—Unverified
Learning Product Codebooks using Vector Quantized Autoencoders for Image Retrieval	Jul 12, 2018	Image RetrievalQuantization	—Unverified
FINN-L: Library Extensions and Design Trade-off Analysis for Variable Precision LSTM Networks on FPGAs	Jul 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Deep attention-based classification network for robust depth prediction	Jul 11, 2018	ClassificationDeep Attention	CodeCode Available
Two-stage iterative Procrustes match algorithm and its application for VQ-based speaker verification	Jul 10, 2018	QuantizationSpeaker Verification	—Unverified
Learning a Single Tucker Decomposition Network for Lossy Image Compression with Multiple Bits-Per-Pixel Rates	Jul 10, 2018	DecoderImage Compression	—Unverified
Deep Saliency Hashing	Jul 4, 2018	Deep HashingQuantization	—Unverified
SYQ: Learning Symmetric Quantization For Efficient Deep Neural Networks	Jul 1, 2018	Quantization	CodeCode Available
OpenNMT System Description for WNMT 2018: 800 words/sec on a single-core CPU	Jul 1, 2018	CPUMachine Translation	—Unverified
An Exact Quantized Decentralized Gradient Descent Algorithm	Jun 29, 2018	Distributed OptimizationQuantization	—Unverified
Convolutional Neural Networks to Enhance Coded Speech	Jun 25, 2018	Quantization	CodeCode Available
Segmentation of Overlapped Steatosis in Whole-Slide Liver Histopathology Microscopy Images	Jun 24, 2018	Quantization	—Unverified
Distributed Average Consensus under Quantized Communication via Event-Triggered Mass Summation	Jun 22, 2018	Quantization	—Unverified
Virtual Codec Supervised Re-Sampling Network for Image Compression	Jun 22, 2018	Dimensionality ReductionImage Compression	—Unverified
Error Compensated Quantized SGD and its Applications to Large-scale Distributed Optimization	Jun 21, 2018	Distributed OptimizationQuantization	—Unverified
Inference of Quantized Neural Networks on Heterogeneous All-Programmable Devices	Jun 21, 2018	AllCPU	—Unverified
Quantizing deep convolutional networks for efficient inference: A whitepaper	Jun 21, 2018	Quantization	CodeCode Available
Parcels of Universe or why Schr\"odinger and Fourier are so relatives?	Jun 18, 2018	Quantization	—Unverified
GroupReduce: Block-Wise Low-Rank Approximation for Neural Language Model Shrinking	Jun 18, 2018	Language ModelingLanguage Modelling	—Unverified
1-bit Localization Scheme for Radar using Dithered Quantized Compressed Sensing	Jun 15, 2018	compressed sensingQuantization	—Unverified
Detecting Dead Weights and Units in Neural Networks	Jun 15, 2018	Quantization	—Unverified
Scalable Neural Network Compression and Pruning Using Hard Clustering and L1 Regularization	Jun 14, 2018	ClusteringNeural Network Compression	—Unverified
Static Quantized Radix-2 FFT/IFFT Processor for Constraints Analysis	Jun 10, 2018	Quantization	—Unverified
Spreading vectors for similarity search	Jun 8, 2018	QuantizationTriplet	CodeCode Available
RGCNN: Regularized Graph CNN for Point Cloud Segmentation	Jun 8, 2018	Point Cloud ClassificationPoint Cloud Segmentation	CodeCode Available
Deep Image Compression via End-to-End Learning	Jun 5, 2018	Image CompressionMS-SSIM	CodeCode Available
Playing Atari with Six Neurons	Jun 4, 2018	Atari GamesDecision Making	CodeCode Available
Modeling Realistic Degradations in Non-blind Deconvolution	Jun 4, 2018	DeblurringImage Deblurring	—Unverified
Feature Quantization for Defending Against Distortion of Images	Jun 1, 2018	Quantization	—Unverified
CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization	Jun 1, 2018	image-classificationImage Classification	—Unverified
A Biresolution Spectral Framework for Product Quantization	Jun 1, 2018	Quantization	—Unverified
Two-Step Quantization for Low-Bit Neural Networks	Jun 1, 2018	QuantizationVocal Bursts Valence Prediction	CodeCode Available
Explicit Loss-Error-Aware Quantization for Low-Bit Deep Neural Networks	Jun 1, 2018	Quantization	—Unverified
Efficient Large-Scale Approximate Nearest Neighbor Search on OpenCL FPGA	Jun 1, 2018	CPUGPU	—Unverified
MPDCompress - Matrix Permutation Decomposition Algorithm for Deep Neural Network Compression	May 30, 2018	Neural Network CompressionQuantization	—Unverified
Retraining-Based Iterative Weight Quantization for Deep Neural Networks	May 29, 2018	Model CompressionQuantization	—Unverified
Convolutional neural network compression for natural language processing	May 28, 2018	Neural Network CompressionQuantization	—Unverified
Double Quantization for Communication-Efficient Distributed Optimization	May 25, 2018	Distributed OptimizationQuantization	—Unverified
Scalable Methods for 8-bit Training of Neural Networks	May 25, 2018	Quantization	CodeCode Available
Deploy Large-Scale Deep Neural Networks in Resource Constrained IoT Devices with Local Quantization Region	May 24, 2018	Quantization	—Unverified
Deep Learning Inference on Embedded Devices: Fixed-Point vs Posit	May 22, 2018	Deep LearningQuantization	—Unverified
DEEPEYE: A Compact and Accurate Video Comprehension at Terminal Devices Compressed with Quantization and Tensorization	May 21, 2018	Action RecognitionGeneral Classification	—Unverified
Compression of Deep Convolutional Neural Networks under Joint Sparsity Constraints	May 21, 2018	Quantization	—Unverified

Show:10 25 50

← PrevPage 91 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified