Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2150 of 4925 papers

Title	Date	Tasks	Status
FlashEval: Towards Fast and Accurate Evaluation of Text-to-image Diffusion Generative Models	Mar 25, 2024	Quantization	CodeCode Available
SignSGD with Federated Voting	Mar 25, 2024	Quantization	CodeCode Available
Work in Progress: Linear Transformers for TinyML	Mar 25, 2024	Keyword SpottingKeyword Spotting on Google Speech Commands	—Unverified
On the Impact of Black-box Deployment Strategies for Edge AI on Latency and Model Performance	Mar 25, 2024	CPUQuantization	CodeCode Available
Neural Image Compression with Quantization Rectifier	Mar 25, 2024	Feature CorrelationImage Compression	—Unverified
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization	Mar 25, 2024	Quantization	CodeCode Available
Infrastructure-Assisted Collaborative Perception in Automated Valet Parking: A Safety Perspective	Mar 22, 2024	Dimensionality ReductionQuantization	—Unverified
Magic for the Age of Quantized DNNs	Mar 22, 2024	Model CompressionQuantization	—Unverified
Super-High-Fidelity Image Compression via Hierarchical-ROI and Adaptive Quantization	Mar 19, 2024	Image CompressionQuantization	—Unverified
NoisyDECOLLE: Robust Local Learning for SNNs on Neuromorphic Hardware	Mar 19, 2024	Quantization	CodeCode Available
Provable Privacy with Non-Private Pre-Processing	Mar 19, 2024	ImputationQuantization	—Unverified
Floating-Point Quantization Analysis of Multi-Layer Perceptron Artificial Neural Networks	Mar 18, 2024	Quantization	CodeCode Available
HyperVQ: MLR-based Vector Quantization in Hyperbolic Space	Mar 18, 2024	QuantizationRepresentation Learning	—Unverified
Spatio-Temporal Fluid Dynamics Modeling via Physical-Awareness and Parameter Diffusion Guidance	Mar 18, 2024	Quantization	—Unverified
Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression	Mar 18, 2024	EthicsFairness	—Unverified
Hierarchical Frequency-based Upsampling and Refining for Compressed Video Quality Enhancement	Mar 18, 2024	QuantizationVideo Compression	—Unverified
Quantization Avoids Saddle Points in Distributed Optimization	Mar 15, 2024	Distributed OptimizationQuantization	—Unverified
Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models?	Mar 15, 2024	Quantization	CodeCode Available
CRB Analysis for Mixed-ADC Based DOA Estimation	Mar 14, 2024	QuantizationSparse Learning	—Unverified
Generalized Relevance Learning Grassmann Quantization	Mar 14, 2024	Activity RecognitionFace Recognition	CodeCode Available
Adversarial Fine-tuning of Compressed Neural Networks for Joint Improvement of Robustness and Efficiency	Mar 14, 2024	Adversarial RobustnessModel Compression	CodeCode Available
FedComLoc: Communication-Efficient Distributed Training of Sparse and Quantized Models	Mar 14, 2024	Federated LearningQuantization	—Unverified
UniCode: Learning a Unified Codebook for Multimodal Large Language Models	Mar 14, 2024	QuantizationVisual Question Answering (VQA)	—Unverified
BRIEDGE: EEG-Adaptive Edge AI for Multi-Brain to Multi-Robot Interaction	Mar 14, 2024	EEGModel Compression	—Unverified
Strategizing against Q-learners: A Control-theoretical Approach	Mar 13, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Collaborative Automotive Radar Sensing via Mixed-Precision Distributed Array Completion	Mar 13, 2024	Matrix CompletionQuantization	—Unverified
Vector Quantization for Deep-Learning-Based CSI Feedback in Massive MIMO Systems	Mar 12, 2024	Quantization	—Unverified
Approaching Rate-Distortion Limits in Neural Compression with Lattice Transform Coding	Mar 12, 2024	Quantization	—Unverified
FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization	Mar 11, 2024	Face GenerationQuantization	—Unverified
What Makes Quantization for Large Language Models Hard? An Empirical Study from the Lens of Perturbation	Mar 11, 2024	Computational EfficiencyQuantization	—Unverified
QuantTune: Optimizing Model Quantization with Adaptive Outlier-Driven Fine Tuning	Mar 11, 2024	Quantization	—Unverified
Enhancing Multimodal Unified Representations for Cross Modal Generalization	Mar 8, 2024	Contrastive LearningDisentanglement	—Unverified
Micro-Fracture Detection in Photovoltaic Cells with Hardware-Constrained Devices and Computer Vision	Mar 8, 2024	Fracture detectionQuantization	—Unverified
The Impact of Quantization on the Robustness of Transformer-based Text Classifiers	Mar 8, 2024	QuantizationSST-2	—Unverified
Algorithm-Hardware Co-Design of Distribution-Aware Logarithmic-Posit Encodings for Efficient DNN Inference	Mar 8, 2024	Quantization	CodeCode Available
LoCoDL: Communication-Efficient Distributed Learning with Local Training and Compression	Mar 7, 2024	Distributed OptimizationFederated Learning	—Unverified
On-demand Quantization for Green Federated Generative Diffusion in Mobile Edge Networks	Mar 7, 2024	DiversityFederated Learning	—Unverified
Adaptive Integrate-and-Fire Time Encoding Machine with Quantization	Mar 5, 2024	Quantization	—Unverified
EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs	Mar 5, 2024	Data Free QuantizationQuantization	—Unverified
Design of Stochastic Quantizers for Privacy Preservation	Mar 5, 2024	Privacy PreservingQuantization	—Unverified
VQSynery: Robust Drug Synergy Prediction With Vector Quantization Mechanism	Mar 5, 2024	Quantization	—Unverified
Deep-Learned Compression for Radio-Frequency Signal Classification	Mar 5, 2024	ClassificationDecision Making	—Unverified
FlowPrecision: Advancing FPGA-Based Real-Time Fluid Flow Estimation with Linear Quantization	Mar 4, 2024	Quantization	—Unverified
Neural Network Assisted Lifting Steps For Improved Fully Scalable Lossy Image Compression in JPEG 2000	Mar 4, 2024	Image CompressionQuantization	CodeCode Available
Towards efficient deep autoencoders for multivariate time series anomaly detection	Mar 4, 2024	Anomaly DetectionModel Compression	—Unverified
Better Schedules for Low Precision Training of Deep Neural Networks	Mar 4, 2024	Node ClassificationQuantization	—Unverified
A Hierarchical Federated Learning Approach for the Internet of Things	Mar 3, 2024	Federated LearningQuantization	—Unverified
On the Compressibility of Quantized Large Language Models	Mar 3, 2024	Data CompressionQuantization	—Unverified
Extracting Usable Predictions from Quantized Networks through Uncertainty Quantification for OOD Detection	Mar 2, 2024	QuantizationUncertainty Quantification	CodeCode Available
BasedAI: A decentralized P2P network for Zero Knowledge Large Language Models (ZK-LLMs)	Mar 1, 2024	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 43 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified