Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1176–1200 of 4925 papers

Title	Date	Tasks	Status	Hype
Distributed Deep Reinforcement Learning Based Gradient Quantization for Federated Learning Enabled Vehicle Edge Computing	Jul 11, 2024	Deep Reinforcement LearningEdge-computing	—Unverified	0
ADMM Based Semi-Structured Pattern Pruning Framework For Transformer	Jul 11, 2024	CoLAQuantization	—Unverified	0
FlashAttention-3: Fast and Accurate Attention with Asynchrony and Low-precision	Jul 11, 2024	GPUQuantization	CodeCode Available	12
Q-GaLore: Quantized GaLore with INT4 Projection and Layer-Adaptive Low-Rank Gradients	Jul 11, 2024	Quantization	CodeCode Available	5
Autoregressive Speech Synthesis without Vector Quantization	Jul 11, 2024	Audio CompressionDiversity	—Unverified	0
Applying generative neural networks for fast simulations of the ALICE (CERN) experiment	Jul 10, 2024	Quantization	CodeCode Available	0
EfficientQAT: Efficient Quantization-Aware Training for Large Language Models	Jul 10, 2024	GPUQuantization	CodeCode Available	3
RoLoRA: Fine-tuning Rotated Outlier-free LLMs for Effective Weight-Activation Quantization	Jul 10, 2024	parameter-efficient fine-tuningQuantization	CodeCode Available	1
Dataset Quantization with Active Learning based Adaptive Sampling	Jul 9, 2024	Active LearningDataset Distillation	CodeCode Available	1
ERQ: Error Reduction for Post-Training Quantization of Vision Transformers	Jul 9, 2024	Quantizationregression	—Unverified	0
CosyVoice: A Scalable Multilingual Zero-shot Text-to-speech Synthesizer based on Supervised Semantic Tokens	Jul 7, 2024	Language ModellingLarge Language Model	CodeCode Available	11
Ternary Spike-based Neuromorphic Signal Processing System	Jul 7, 2024	Quantization	—Unverified	0
CLAMP-ViT: Contrastive Data-Free Learning for Adaptive Post-Training Quantization of ViTs	Jul 7, 2024	Contrastive Learningobject-detection	CodeCode Available	1
OvSW: Overcoming Silent Weights for Accurate Binary Neural Networks	Jul 7, 2024	Quantization	CodeCode Available	1
Integer-only Quantized Transformers for Embedded FPGA-based Time-series Forecasting in AIoT	Jul 6, 2024	QuantizationTime Series	—Unverified	0
Quantizing YOLOv7: A Comprehensive Study	Jul 6, 2024	Model Compressionobject-detection	—Unverified	0
Beyond Perplexity: Multi-dimensional Safety Evaluation of LLM Compression	Jul 6, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Balance of Number of Embedding and their Dimensions in Vector Quantization	Jul 6, 2024	Quantization	—Unverified	0
ZOBNN: Zero-Overhead Dependable Design of Binary Neural Networks with Deliberately Quantized Parameters	Jul 6, 2024	AttributeQuantization	—Unverified	0
Hybrid Receiver Design for Massive MIMO-OFDM with Low-Resolution ADCs and Oversampling	Jul 5, 2024	Quantization	—Unverified	0
SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking	Jul 5, 2024	Language ModellingLarge Language Model	CodeCode Available	1
Resource-Efficient Speech Quality Prediction through Quantization Aware Training and Binary Activation Maps	Jul 5, 2024	Quantization	CodeCode Available	0
The Impact of Quantization and Pruning on Deep Reinforcement Learning Models	Jul 5, 2024	Deep Reinforcement LearningModel Compression	—Unverified	0
Joint Beamforming Design and Bit Allocation in Massive MIMO with Resolution-Adaptive ADCs	Jul 4, 2024	Quantization	—Unverified	0
Low-latency machine learning FPGA accelerator for multi-qubit-state discrimination	Jul 4, 2024	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 48 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified