Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4250 of 4925 papers

Title	Date	Tasks	Status
Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT	Sep 12, 2019	Linguistic AcceptabilityNatural Language Inference	—Unverified
Variable Rate Deep Image Compression With a Conditional Autoencoder	Sep 11, 2019	Image CompressionQuantization	—Unverified
A Comprehensive Benchmark for Single Image Compression Artifacts Reduction	Sep 9, 2019	4kImage Compression	—Unverified
Sparse linear regression with compressed and low-precision data via concave quadratic programming	Sep 9, 2019	Quantizationregression	—Unverified
Communication-Censored Distributed Stochastic Gradient Descent	Sep 9, 2019	QuantizationStochastic Optimization	CodeCode Available
A Resource-Efficient Embedded Iris Recognition System Using Fully Convolutional Networks	Sep 8, 2019	CPUGPU	CodeCode Available
Quantized Fisher Discriminant Analysis	Sep 6, 2019	BIG-bench Machine LearningDimensionality Reduction	CodeCode Available
Restricted Minimum Error Entropy Criterion for Robust Classification	Sep 6, 2019	ClassificationDimensionality Reduction	—Unverified
DeepEvolution: A Search-Based Testing Approach for Deep Neural Networks	Sep 5, 2019	Autonomous VehiclesDiversity	—Unverified
Training High-Performance and Large-Scale Deep Neural Networks with Full 8-bit Integers	Sep 5, 2019	Quantization	CodeCode Available
Symbol-Level Precoding Design for Intelligent Reflecting Surface Assisted Multi-user MIMO Systems	Sep 3, 2019	Quantization	—Unverified
On the Downstream Performance of Compressed Word Embeddings	Sep 3, 2019	Generalization BoundsQuantization	CodeCode Available
Push for Quantization: Deep Fisher Hashing	Aug 31, 2019	QuantizationSemantic Similarity	—Unverified
Smaller Models, Better Generalization	Aug 29, 2019	Quantization	—Unverified
An Ultra-Efficient Memristor-Based DNN Framework with Structured Weight Pruning and Quantization Using ADMM	Aug 29, 2019	Quantization	—Unverified
PULP-NN: Accelerating Quantized Neural Networks on Parallel Ultra-Low-Power RISC-V Processors	Aug 29, 2019	Quantization	CodeCode Available
Accelerating Large-Scale Inference with Anisotropic Vector Quantization	Aug 27, 2019	BenchmarkingQuantization	CodeCode Available
Tiny but Accurate: A Pruned, Quantized and Optimized Memristor Crossbar Framework for Ultra Efficient DNN Implementation	Aug 27, 2019	Model CompressionQuantization	—Unverified
Differentiable Product Quantization for End-to-End Embedding Compression	Aug 26, 2019	Quantization	CodeCode Available
Incremental Binarization On Recurrent Neural Networks For Single-Channel Source Separation	Aug 23, 2019	BinarizationQuantization	—Unverified
RATQ: A Universal Fixed-Length Quantizer for Stochastic Optimization	Aug 22, 2019	QuantizationStochastic Optimization	—Unverified
A Gridless Compressive Sensing Based Channel Estimation for Millimeter Wave MIMO OFDM Systems with One-Bit Quantization	Aug 19, 2019	Compressive SensingQuantization	—Unverified
NUQSGD: Improved Communication Efficiency for Data-parallel SGD via Nonuniform Quantization	Aug 16, 2019	Quantization	CodeCode Available
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks	Aug 14, 2019	Quantization	CodeCode Available
Learn to Compress CSI and Allocate Resources in Vehicular Networks	Aug 12, 2019	Decision MakingQuantization	—Unverified
Unsupervised Neural Quantization for Compressed-Domain Similarity Search	Aug 11, 2019	Image RetrievalQuantization	CodeCode Available
Effective Training of Convolutional Neural Networks with Low-bitwidth Weights and Activations	Aug 10, 2019	Knowledge DistillationQuantization	—Unverified
Primary quantization matrix estimation of double compressed JPEG images via CNN	Aug 9, 2019	Quantization	CodeCode Available
Cheetah: Mixed Low-Precision Hardware & Software Co-Design Framework for DNNs on the Edge	Aug 6, 2019	Quantization	—Unverified
GDRQ: Group-based Distribution Reshaping for Quantization	Aug 5, 2019	Quantization	—Unverified
Efficient computation of counterfactual explanations of LVQ models	Aug 2, 2019	BIG-bench Machine Learningcounterfactual	CodeCode Available
U-Net Fixed-Point Quantization for Medical Image Segmentation	Aug 2, 2019	Image SegmentationMedical Image Segmentation	CodeCode Available
Deep Task-Based Quantization	Aug 1, 2019	Quantization	—Unverified
Central Similarity Quantization for Efficient Image and Video Retrieval	Aug 1, 2019	QuantizationRetrieval	CodeCode Available
Learn to Allocate Resources in Vehicular Networks	Jul 30, 2019	Decision MakingQuantization	—Unverified
DeepCABAC: A Universal Compression Algorithm for Deep Neural Networks	Jul 27, 2019	Neural Network CompressionQuantization	CodeCode Available
Robust and Communication-Efficient Collaborative Learning	Jul 24, 2019	Quantization	CodeCode Available
QRMODA and BRMODA: Novel Models for Face Recognition Accuracy in Computer Vision Systems with Adapted Video Streams	Jul 24, 2019	Face RecognitionQuantization	—Unverified
Exploring Semantic Segmentation on the DCT Representation	Jul 23, 2019	QuantizationSegmentation	—Unverified
Distributed Average Consensus under Quantized Communication via Event-Triggered Mass Splitting	Jul 23, 2019	Quantization	—Unverified
Learning Multimodal Fixed-Point Weights using Gradient Descent	Jul 16, 2019	Quantization	—Unverified
Light Multi-segment Activation for Model Compression	Jul 16, 2019	Knowledge Distillationmodel	CodeCode Available
An Inter-Layer Weight Prediction and Quantization for Deep Neural Networks based on a Smoothly Varying Weight Hypothesis	Jul 16, 2019	Quantization	—Unverified
The Bach Doodle: Approachable music composition with machine learning at scale	Jul 14, 2019	BIG-bench Machine LearningQuantization	—Unverified
A Targeted Acceleration and Compression Framework for Low bit Neural Networks	Jul 9, 2019	BinarizationComputational Efficiency	—Unverified
Multi-Scale Vector Quantization with Reconstruction Trees	Jul 8, 2019	Quantization	—Unverified
Non-Structured DNN Weight Pruning -- Is It Beneficial in Any Platform?	Jul 3, 2019	Model CompressionQuantization	—Unverified
Don't take it lightly: Phasing optical random projections with unknown operators	Jul 3, 2019	CPUGPU	CodeCode Available
Deep Convolutional Compression for Massive MIMO CSI Feedback	Jul 2, 2019	DiversityQuantization	—Unverified
Weight Normalization based Quantization for Deep Neural Network Compression	Jul 1, 2019	Model CompressionNeural Network Compression	—Unverified

Show:10 25 50

← PrevPage 85 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified