Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1875 of 4925 papers

Title	Date	Tasks	Status
Distributed Deep Reinforcement Learning Based Gradient Quantization for Federated Learning Enabled Vehicle Edge Computing	Jul 11, 2024	Deep Reinforcement LearningEdge-computing	—Unverified
Autoregressive Speech Synthesis without Vector Quantization	Jul 11, 2024	Audio CompressionDiversity	—Unverified
Applying generative neural networks for fast simulations of the ALICE (CERN) experiment	Jul 10, 2024	Quantization	CodeCode Available
ERQ: Error Reduction for Post-Training Quantization of Vision Transformers	Jul 9, 2024	Quantizationregression	—Unverified
Ternary Spike-based Neuromorphic Signal Processing System	Jul 7, 2024	Quantization	—Unverified
Quantizing YOLOv7: A Comprehensive Study	Jul 6, 2024	Model Compressionobject-detection	—Unverified
Integer-only Quantized Transformers for Embedded FPGA-based Time-series Forecasting in AIoT	Jul 6, 2024	QuantizationTime Series	—Unverified
ZOBNN: Zero-Overhead Dependable Design of Binary Neural Networks with Deliberately Quantized Parameters	Jul 6, 2024	AttributeQuantization	—Unverified
Beyond Perplexity: Multi-dimensional Safety Evaluation of LLM Compression	Jul 6, 2024	Language ModelingLanguage Modelling	CodeCode Available
Balance of Number of Embedding and their Dimensions in Vector Quantization	Jul 6, 2024	Quantization	—Unverified
Resource-Efficient Speech Quality Prediction through Quantization Aware Training and Binary Activation Maps	Jul 5, 2024	Quantization	CodeCode Available
Hybrid Receiver Design for Massive MIMO-OFDM with Low-Resolution ADCs and Oversampling	Jul 5, 2024	Quantization	—Unverified
The Impact of Quantization and Pruning on Deep Reinforcement Learning Models	Jul 5, 2024	Deep Reinforcement LearningModel Compression	—Unverified
Low-latency machine learning FPGA accelerator for multi-qubit-state discrimination	Jul 4, 2024	Quantization	—Unverified
QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering	Jul 4, 2024	Computational EfficiencyEdge-computing	—Unverified
Joint Beamforming Design and Bit Allocation in Massive MIMO with Resolution-Adaptive ADCs	Jul 4, 2024	Quantization	—Unverified
Timestep-Aware Correction for Quantized Diffusion Models	Jul 4, 2024	AttributeNoise Estimation	—Unverified
Fisher-aware Quantization for DETR Detectors with Critical-category Objectives	Jul 3, 2024	object-detectionObject Detection	—Unverified
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers	Jul 3, 2024	Attributeimage-classification	—Unverified
How Does Quantization Affect Multilingual LLMs?	Jul 3, 2024	Mathematical ReasoningQuantization	—Unverified
Unified Anomaly Detection methods on Edge Device using Knowledge Distillation and Quantization	Jul 3, 2024	Anomaly DetectionCPU	—Unverified
Codec-ASR: Training Performant Automatic Speech Recognition Systems with Discrete Speech Representations	Jul 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
GPTQT: Quantize Large Language Models Twice to Push the Efficiency	Jul 3, 2024	Quantization	—Unverified
Edge AI-Enabled Chicken Health Detection Based on Enhanced FCOS-Lite and Knowledge Distillation	Jul 3, 2024	Knowledge DistillationQuantization	—Unverified
OSPC: Artificial VLM Features for Hateful Meme Detection	Jul 3, 2024	Computational EfficiencyFeature Engineering	—Unverified

Show:10 25 50

← PrevPage 75 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified