Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 4925 papers

Title	Date	Tasks	Status
AWEQ: Post-Training Quantization with Activation-Weight Equalization for Large Language Models	Nov 2, 2023	Quantization	—Unverified
Crop Disease Classification using Support Vector Machines with Green Chromatic Coordinate (GCC) and Attention based feature extraction for IoT based Smart Agricultural Applications	Nov 1, 2023	NutritionQuantization	—Unverified
The bottleneck and ceiling effects in quantized tracking control of heterogeneous multi-agent systems under DoS attacks	Nov 1, 2023	Quantization	—Unverified
Q-Learning for Stochastic Control under General Information Structures and Non-Markovian Environments	Oct 31, 2023	Q-LearningQuantization	—Unverified
Resource Constrained Semantic Segmentation for Waste Sorting	Oct 30, 2023	QuantizationSemantic Segmentation	CodeCode Available
Exploring Post-Training Quantization of Protein Language Models	Oct 30, 2023	Protein Structure PredictionQuantization	CodeCode Available
A Principled Hierarchical Deep Learning Approach to Joint Image Compression and Classification	Oct 30, 2023	Decoderimage-classification	—Unverified
Conditional Denoising Diffusion Probabilistic Models for Data Reconstruction Enhancement in Wireless Communications	Oct 30, 2023	DenoisingQuantization	—Unverified
QWID: Quantized Weed Identification Deep neural network	Oct 29, 2023	QuantizationTransfer Learning	CodeCode Available
High-probability Convergence Bounds for Nonlinear Stochastic Gradient Descent Under Heavy-tailed Noise	Oct 28, 2023	Quantization	—Unverified
Med-DANet V2: A Flexible Dynamic Architecture for Efficient Medical Volumetric Segmentation	Oct 28, 2023	Computational EfficiencyMRI segmentation	—Unverified
NIF: A Fast Implicit Image Compression with Bottleneck Layers and Modulated Sinusoidal Activations	Oct 27, 2023	Image CompressionQuantization	CodeCode Available
Distributed Delay-Tolerant Strategies for Equality-Constraint Sum-Preserving Resource Allocation	Oct 27, 2023	AllCPU	—Unverified
ZeroQuant-HERO: Hardware-Enhanced Robust Optimized Post-Training Quantization Framework for W8A8 Transformers	Oct 26, 2023	Quantization	—Unverified
Deep Imbalanced Regression via Hierarchical Classification Adjustment	Oct 26, 2023	Age EstimationClassification	—Unverified
General Point Model with Autoencoding and Autoregressive	Oct 25, 2023	DecoderLanguage Modeling	—Unverified
Enhancing Low-Precision Sampling via Stochastic Gradient Hamiltonian Monte Carlo	Oct 25, 2023	QuantizationUncertainty Quantification	CodeCode Available
Transmitting Data Through Reconfigurable Intelligent Surface: A Spatial Sigma-Delta Modulation Approach	Oct 25, 2023	Quantization	—Unverified
Wide Flat Minimum Watermarking for Robust Ownership Verification of GANs	Oct 25, 2023	Quantization	—Unverified
Random Entity Quantization for Parameter-Efficient Compositional Knowledge Graph Representation	Oct 24, 2023	Knowledge GraphsQuantization	CodeCode Available
LDPC Decoding with Degree-Specific Neural Message Weights and RCQ Decoding	Oct 24, 2023	DecoderQuantization	—Unverified
Federated learning compression designed for lightweight communications	Oct 23, 2023	Cloud ComputingFederated Learning	CodeCode Available
VQ-NeRF: Vector Quantization Enhances Implicit Neural Representations	Oct 23, 2023	DecoderNeRF	—Unverified
Deep Autoencoder-based Z-Interference Channels with Perfect and Imperfect CSI	Oct 23, 2023	Quantization	—Unverified
Spatial Sigma-Delta Modulation for Coarsely Quantized Massive MIMO Downlink: Flexible Designs by Convex Optimization	Oct 22, 2023	Quantization	—Unverified
An Overview on IEEE 802.11bf: WLAN Sensing	Oct 20, 2023	Quantization	—Unverified
Zero-Shot Sharpness-Aware Quantization for Pre-trained Language Models	Oct 20, 2023	Language ModelingLanguage Modelling	—Unverified
VQ-NeRF: Neural Reflectance Decomposition and Editing with Vector Quantization	Oct 18, 2023	Material SegmentationNeRF	—Unverified
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning	Oct 18, 2023	Offline RLQuantization	—Unverified
A Comprehensive Survey on Vector Database: Storage and Retrieval Technique, Challenge	Oct 18, 2023	ArticlesQuantization	—Unverified
Functional Invariants to Watermark Large Transformers	Oct 17, 2023	Quantization	—Unverified
TEQ: Trainable Equivalent Transformation for Quantization of LLMs	Oct 17, 2023	Quantization	—Unverified
Image Compression using only Attention based Neural Networks	Oct 17, 2023	Image CompressionQuantization	—Unverified
Robustness and Approximation of Discrete-time Mean-field Games under Discounted Cost Criterion	Oct 16, 2023	Quantization	—Unverified
One-Shot Sensitivity-Aware Mixed Sparsity Pruning for Large Language Models	Oct 14, 2023	QuantizationSensitivity	CodeCode Available
LL-VQ-VAE: Learnable Lattice Vector-Quantization For Efficient Representations	Oct 13, 2023	Quantization	—Unverified
A Carbon Tracking Model for Federated Learning: Impact of Quantization and Sparsification	Oct 12, 2023	Federated LearningQuantization	—Unverified
Cost-Driven Hardware-Software Co-Optimization of Machine Learning Pipelines	Oct 11, 2023	Quantization	—Unverified
QFT: Quantized Full-parameter Tuning of LLMs with Affordable Resources	Oct 11, 2023	GPUparameter-efficient fine-tuning	—Unverified
Adaptive Quantization for Key Generation in Low-Power Wide-Area Networks	Oct 11, 2023	Quantization	—Unverified
Distillation Improves Visual Place Recognition for Low Quality Images	Oct 10, 2023	Knowledge DistillationQuantization	CodeCode Available
Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers	Oct 9, 2023	Image GenerationImage Reconstruction	—Unverified
Vector Quantized Multi-modal Guidance for Alzheimer’s Disease Diagnosis Based on Feature Imputation	Oct 8, 2023	ImputationQuantization	CodeCode Available
Dual Grained Quantization: Efficient Fine-Grained Quantization for LLM	Oct 7, 2023	Quantization	—Unverified
Sub-token ViT Embedding via Stochastic Resonance Transformers	Oct 6, 2023	Depth EstimationDepth Prediction	CodeCode Available
Hadamard Domain Training with Integers for Class Incremental Quantized Learning	Oct 5, 2023	Activity Recognitionclass-incremental learning	—Unverified
Robustness-Guided Image Synthesis for Data-Free Quantization	Oct 5, 2023	Data Free QuantizationDiversity	—Unverified
VaSAB: The variable size adaptive information bottleneck for disentanglement on speech and singing voice	Oct 5, 2023	DisentanglementQuantization	—Unverified
Learning A Disentangling Representation For PU Learning	Oct 5, 2023	ClusteringDensity Estimation	—Unverified
Soft Convex Quantization: Revisiting Vector Quantization with Convex Optimization	Oct 4, 2023	Image ReconstructionQuantization	—Unverified

Show:10 25 50

← PrevPage 48 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified