Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2250 of 4925 papers

Title	Date	Tasks	Status
FoldToken: Learning Protein Language via Vector Quantization and Beyond	Feb 4, 2024	Quantization	—Unverified
Leveraging Continuously Differentiable Activation Functions for Learning in Quantized Noisy Environments	Feb 4, 2024	Quantization	CodeCode Available
Locally-Adaptive Quantization for Streaming Vector Search	Feb 3, 2024	QuantizationRetrieval	—Unverified
SignSGD with Federated Defense: Harnessing Adversarial Attacks through Gradient Sign Decoding	Feb 2, 2024	Adversarial AttackQuantization	CodeCode Available
FedShift: Tackling Dual Heterogeneity Problem of Federated Learning via Weight Shift Aggregation	Feb 2, 2024	DiversityFederated Learning	—Unverified
Faster Inference of Integer SWIN Transformer by Removing the GELU Activation	Feb 2, 2024	GPUimage-classification	—Unverified
Neural Language of Thought Models	Feb 2, 2024	Image GenerationObject	—Unverified
Truncated Non-Uniform Quantization for Distributed SGD	Feb 2, 2024	Quantization	—Unverified
Ultrafast jet classification on FPGAs for the HL-LHC	Feb 2, 2024	Quantization	CodeCode Available
An Intra-BRNN and GB-RVQ Based END-TO-END Neural Audio Codec	Feb 2, 2024	Quantization	—Unverified
Improved Quantization Strategies for Managing Heavy-tailed Gradients in Distributed Learning	Feb 2, 2024	Quantization	—Unverified
HW-SW Optimization of DNNs for Privacy-preserving People Counting on Low-resolution Infrared Arrays	Feb 2, 2024	Neural Architecture SearchPrivacy Preserving	—Unverified
Can Large Language Models Understand Context?	Feb 1, 2024	In-Context LearningQuantization	—Unverified
Analog-digital Scheduling for Federated Learning: A Communication-Efficient Approach	Feb 1, 2024	Federated LearningQuantization	—Unverified
Trainable Fixed-Point Quantization for Deep Learning Acceleration on FPGAs	Jan 31, 2024	Deep LearningQuantization	—Unverified
One-Step Forward and Backtrack: Overcoming Zig-Zagging in Loss-Aware Quantization Training	Jan 30, 2024	Quantization	CodeCode Available
Effect of Weight Quantization on Learning Models by Typical Case Analysis	Jan 30, 2024	Quantization	—Unverified
Effective Communication with Dynamic Feature Compression	Jan 29, 2024	Deep Reinforcement LearningFeature Compression	CodeCode Available
HEQuant: Marrying Homomorphic Encryption and Quantization for Communication-Efficient Private Inference	Jan 29, 2024	Quantization	—Unverified
Transformer-based Clipped Contrastive Quantization Learning for Unsupervised Image Retrieval	Jan 27, 2024	Contrastive LearningImage Retrieval	—Unverified
A Comprehensive Survey of Compression Algorithms for Language Models	Jan 27, 2024	Knowledge DistillationQuantization	—Unverified
LitE-SNN: Designing Lightweight and Efficient Spiking Neural Network through Spatial-Temporal Compressive Network Search and Joint Optimization	Jan 26, 2024	Quantization	—Unverified
MPTQ-ViT: Mixed-Precision Post-Training Quantization for Vision Transformer	Jan 26, 2024	Quantization	—Unverified
Towards Cheaper Inference in Deep Networks with Lower Bit-Width Accumulators	Jan 25, 2024	Quantization	—Unverified
CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks	Jan 25, 2024	Model CompressionQuantization	—Unverified
Within-basket Recommendation via Neural Pattern Associator	Jan 25, 2024	Quantization	—Unverified
Value-Driven Mixed-Precision Quantization for Patch-Based Inference on Microcontrollers	Jan 24, 2024	Quantization	—Unverified
Iterated Relevance Matrix Analysis (IRMA) for the identification of class-discriminative subspaces	Jan 23, 2024	Dimensionality ReductionQuantization	—Unverified
Scaling Up Quantization-Aware Neural Architecture Search for Efficient Deep Learning on the Edge	Jan 22, 2024	Neural Architecture SearchQuantization	—Unverified
Robustness to distribution shifts of compressed networks for edge devices	Jan 22, 2024	Knowledge DistillationQuantization	—Unverified
Another Way to the Top: Exploit Contextual Clustering in Learned Image Coding	Jan 21, 2024	ClusteringImage Compression	—Unverified
Edge-Enabled Real-time Railway Track Segmentation	Jan 21, 2024	GPUQuantization	—Unverified
LRP-QViT: Mixed-Precision Vision Transformer Quantization via Layer-wise Relevance Propagation	Jan 20, 2024	Quantization	—Unverified
Dynamic Q&A of Clinical Documents with Large Language Models	Jan 19, 2024	ChatbotDecision Making	—Unverified
A2Q+: Improving Accumulator-Aware Weight Quantization	Jan 19, 2024	Quantization	CodeCode Available
Model Compression Techniques in Biometrics Applications: A Survey	Jan 18, 2024	FairnessKnowledge Distillation	CodeCode Available
Enabling On-device Continual Learning with Binary Neural Networks	Jan 18, 2024	Continual LearningQuantization	—Unverified
Exploration of Activation Fault Reliability in Quantized Systolic Array-Based DNN Accelerators	Jan 17, 2024	Quantization	—Unverified
Hybrid of DiffStride and Spectral Pooling in Convolutional Neural Networks	Jan 17, 2024	Quantization	—Unverified
Hardware Acceleration for Real-Time Wildfire Detection Onboard Drone Networks	Jan 16, 2024	Classificationimage-classification	CodeCode Available
Activations and Gradients Compression for Model-Parallel Training	Jan 15, 2024	image-classificationImage Classification	CodeCode Available
TP-Aware Dequantization	Jan 15, 2024	GPUQuantization	—Unverified
MorpheusNet: Resource efficient sleep stage classifier for embedded on-line systems	Jan 14, 2024	Quantization	CodeCode Available
ENTED: Enhanced Neural Texture Extraction and Distribution for Reference-based Blind Face Restoration	Jan 13, 2024	Blind Face RestorationQuantization	—Unverified
Correlated Quantization for Faster Nonconvex Distributed Optimization	Jan 10, 2024	Distributed OptimizationQuantization	—Unverified
Memory-Efficient Fine-Tuning for Quantized Diffusion Model	Jan 9, 2024	modelQuantization	—Unverified
FlightLLM: Efficient Large Language Model Inference with a Complete Mapping Flow on FPGAs	Jan 8, 2024	Computational EfficiencyGPU	—Unverified
Detecting Face Synthesis Using a Concealed Fusion Model	Jan 8, 2024	Computer SecurityFace Generation	—Unverified
A Video Coding Method Based on Neural Network for CLIC2024	Jan 8, 2024	Deep LearningQuantization	—Unverified
Data-driven Dynamic Event-triggered Control	Jan 7, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 45 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified