Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3201–3250 of 4925 papers

Title	Date	Tasks	Status
TinyM^2Net: A Flexible System Algorithm Co-designed Multimodal Learning Framework for Tiny Devices	Feb 9, 2022	Classificationobject-detection	—Unverified
Lightweight Jet Reconstruction and Identification as an Object Detection Task	Feb 9, 2022	Benchmarkingobject-detection	—Unverified
Binary Neural Networks as a general-propose compute paradigm for on-device computer vision	Feb 8, 2022	QuantizationSuper-Resolution	—Unverified
Robust Semantic Communications Against Semantic Noise	Feb 7, 2022	QuantizationSemantic Communication	—Unverified
Energy awareness in low precision neural networks	Feb 6, 2022	Quantization	—Unverified
A Fast Network Exploration Strategy to Profile Low Energy Consumption for Keyword Spotting	Feb 4, 2022	Keyword SpottingQuantization	—Unverified
Robust Vector Quantized-Variational Autoencoder	Feb 4, 2022	DecoderQuantization	—Unverified
The Ecological Footprint of Neural Machine Translation Systems	Feb 4, 2022	GPUMachine Translation	CodeCode Available
PRUNIX: Non-Ideality Aware Convolutional Neural Network Pruning for Memristive Accelerators	Feb 3, 2022	Network PruningQuantization	—Unverified
Adaptive Discrete Communication Bottlenecks with Dynamic Vector Quantization	Feb 2, 2022	Quantizationreinforcement-learning	—Unverified
Does Video Compression Impact Tracking Accuracy?	Feb 2, 2022	Multiple Object TrackingObject	—Unverified
Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed Video Quality Enhancement	Jan 31, 2022	QuantizationVideo Compression	—Unverified
Neural-PIM: Efficient Processing-In-Memory with Neural Approximation of Peripherals	Jan 30, 2022	Quantization	—Unverified
Training Thinner and Deeper Neural Networks: Jumpstart Regularization	Jan 30, 2022	Model CompressionQuantization	CodeCode Available
Deep Task-Based Analog-to-Digital Conversion	Jan 29, 2022	Meta-LearningQuantization	CodeCode Available
Bioinspired Cortex-based Fast Codebook Generation	Jan 28, 2022	Anomaly DetectionBIG-bench Machine Learning	—Unverified
Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG Encoder-Decoder	Jan 27, 2022	DecoderImage Compression	—Unverified
Neural Network based Inter bi-prediction Blending	Jan 26, 2022	CPUMotion Compensation	—Unverified
Resource-efficient Deep Neural Networks for Automotive Radar Interference Mitigation	Jan 25, 2022	Autonomous VehiclesDenoising	—Unverified
Spectral-PQ: A Novel Spectral Sensitivity-Orientated Perceptual Compression Technique for RGB 4:4:4 Video Data	Jan 24, 2022	QuantizationSensitivity	—Unverified
DCNGAN: A Deformable Convolutional-Based GAN with QP Adaptation for Perceptual Quality Enhancement of Compressed Video	Jan 22, 2022	Generative Adversarial NetworkQuantization	—Unverified
APack: Off-Chip, Lossless Data Compression for Efficient Deep Learning Inference	Jan 21, 2022	Data CompressionQuantization	—Unverified
Neural Network Quantization with AI Model Efficiency Toolkit (AIMET)	Jan 20, 2022	Model OptimizationQuantization	—Unverified
What can we learn from misclassified ImageNet images?	Jan 20, 2022	GPUQuantization	—Unverified
HEAM: High-Efficiency Approximate Multiplier Optimization for Deep Neural Networks	Jan 20, 2022	QuantizationVocal Bursts Intensity Prediction	CodeCode Available
FAT: An In-Memory Accelerator with Fast Addition for Ternary Weight Neural Networks	Jan 19, 2022	Quantization	—Unverified
Data-Driven Deep Learning Based Hybrid Beamforming for Aerial Massive MIMO-OFDM Systems with Implicit CSI	Jan 18, 2022	QuantizationTransfer Learning	—Unverified
Design Space Exploration of Dense and Sparse Mapping Schemes for RRAM Architectures	Jan 18, 2022	Quantization	—Unverified
Tk-merge: Computationally Efficient Robust Clustering Under General Assumptions	Jan 17, 2022	ClusteringQuantization	—Unverified
Improving Performance of Semantic Segmentation CycleGANs by Noise Injection into the Latent Segmentation Space	Jan 17, 2022	Image ReconstructionQuantization	—Unverified
VAQF: Fully Automatic Software-Hardware Co-Design Framework for Low-Bit Vision Transformer	Jan 17, 2022	High-Level SynthesisQuantization	—Unverified
Neural Network Compression of ACAS Xu Early Prototype is Unsafe: Closed-Loop Verification through Quantized State Backreachability	Jan 17, 2022	Collision AvoidanceNeural Network Compression	CodeCode Available
UWC: Unit-wise Calibration Towards Rapid Network Compression	Jan 17, 2022	Quantization	—Unverified
Egeria: Efficient DNN Training with Knowledge-Guided Layer Freezing	Jan 17, 2022	Quantization	—Unverified
Boosted Dense Retriever	Jan 16, 2022	QuantizationRetrieval	—Unverified
UDC: Unified DNAS for Compressible TinyML Models	Jan 15, 2022	Model CompressionNeural Architecture Search	—Unverified
ViT2Hash: Unsupervised Information-Preserving Hashing	Jan 14, 2022	Quantization	—Unverified
A Physics-Informed Vector Quantized Autoencoder for Data Compression of Turbulent Flow	Jan 10, 2022	Data CompressionQuantization	CodeCode Available
A Planck Radiation and Quantization Scheme for Human Cognition and Language	Jan 10, 2022	Quantization	—Unverified
Bandlimited signal reconstruction from leaky integrate-and-fire encoding using POCS	Jan 9, 2022	QuantizationRetrieval	—Unverified
An Adaptive Device-Edge Co-Inference Framework Based on Soft Actor-Critic	Jan 9, 2022	CPUDeep Reinforcement Learning	—Unverified
High-contrast, speckle-free, true 3D holography via binary CGH optimization	Jan 7, 2022	3D HolographyQuantization	—Unverified
Optimizing the Communication-Accuracy Trade-off in Federated Learning with Rate-Distortion Theory	Jan 7, 2022	Federated LearningQuantization	CodeCode Available
Video Coding for Machines: Partial transmission of SIFT features	Jan 7, 2022	Quantization	—Unverified
Detection of extragalactic Ultra-Compact Dwarfs and Globular Clusters using Explainable AI techniques	Jan 5, 2022	Feature ImportanceQuantization	CodeCode Available
Elastic Product Quantization for Time Series	Jan 4, 2022	QuantizationTime Series	CodeCode Available
A Robust Visual Sampling Model Inspired by Receptive Field	Jan 4, 2022	Quantization	—Unverified
IQDUBBING: Prosody modeling based on discrete self-supervised speech representation for expressive voice conversion	Jan 2, 2022	QuantizationVoice Conversion	—Unverified
RecDis-SNN: Rectifying Membrane Potential Distribution for Directly Training Spiking Neural Networks	Jan 1, 2022	Quantization	—Unverified
Channel Balancing for Accurate Quantization of Winograd Convolutions	Jan 1, 2022	Quantization	—Unverified

Show:10 25 50

← PrevPage 65 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified