Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1575 of 4925 papers

Title	Date	Tasks	Status
Sketched Adaptive Federated Deep Learning: A Sharp Convergence Analysis	Nov 11, 2024	Deep LearningFederated Learning	—Unverified
HAFLQ: Heterogeneous Adaptive Federated LoRA Fine-tuned LLM with Quantization	Nov 10, 2024	Quantizationtext-classification	—Unverified
Optimizing Large Language Models through Quantization: A Comparative Analysis of PTQ and QAT Techniques	Nov 9, 2024	Quantization	—Unverified
Expansion Quantization Network: An Efficient Micro-emotion Annotation and Detection Framework	Nov 9, 2024	Emotion Detection and ClassificationQuantization	CodeCode Available
An asymmetric heuristic for trained ternary quantization based on the statistics of the weights: an application to medical signal classification	Nov 9, 2024	Quantization	CodeCode Available
Intelligent Fault Diagnosis of Type and Severity in Low-Frequency, Low Bit-Depth Signals	Nov 9, 2024	Fault DiagnosisQuantization	—Unverified
When are 1.58 bits enough? A Bottom-up Exploration of BitNet Quantization	Nov 8, 2024	DecoderQuantization	—Unverified
QuanCrypt-FL: Quantized Homomorphic Encryption with Pruning for Secure Federated Learning	Nov 8, 2024	Computational EfficiencyFederated Learning	—Unverified
Qwen2.5-32B: Leveraging Self-Consistent Tool-Integrated Reasoning for Bengali Mathematical Olympiad Problem Solving	Nov 8, 2024	Prompt EngineeringQuantization	—Unverified
Rate-aware Compression for NeRF-based Volumetric Video	Nov 8, 2024	NeRFQuantization	—Unverified
Aligned Vector Quantization for Edge-Cloud Collabrative Vision-Language Models	Nov 8, 2024	QuantizationQuestion Answering	—Unverified
Compressive Spectrum Sensing with 1-bit ADCs	Nov 7, 2024	compressed sensingQuantization	—Unverified
Green My LLM: Studying the key factors affecting the energy consumption of code assistants	Nov 7, 2024	Quantization	—Unverified
Saliency Assisted Quantization for Neural Networks	Nov 7, 2024	image-classificationImage Classification	—Unverified
Multi-bit Distributed Detection of Sparse Stochastic Signals over Error-Prone Reporting Channels	Nov 6, 2024	Quantization	—Unverified
An Edge Computing-Based Solution for Real-Time Leaf Disease Classification using Thermal Imaging	Nov 6, 2024	Deep LearningEdge-computing	CodeCode Available
Interactions Across Blocks in Post-Training Quantization of Large Language Models	Nov 6, 2024	Quantization	—Unverified
Sum Rate Maximization in the Constant Envelope MIMO Downlink with the RZF Precoder	Nov 5, 2024	Quantization	—Unverified
Stochastic Monkeys at Play: Random Augmentations Cheaply Break LLM Safety Alignment	Nov 5, 2024	QuantizationSafety Alignment	CodeCode Available
Hybrid Beamforming for Integrated Sensing and Communications With Low Resolution DACs	Nov 5, 2024	ISACQuantization	—Unverified
Transferable Sequential Recommendation via Vector Quantized Meta Learning	Nov 4, 2024	Meta-LearningQuantization	—Unverified
"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization	Nov 4, 2024	GPULarge Language Model	—Unverified
BF-IMNA: A Bit Fluid In-Memory Neural Architecture for Neural Network Acceleration	Nov 3, 2024	Quantization	—Unverified
Conformalized High-Density Quantile Regression via Dynamic Prototypes-based Probability Density Estimation	Nov 2, 2024	Density Estimationquantile regression	CodeCode Available
Fundamental Trade-offs in Quantized Hybrid Radar Fusion: A CRB-Rate Perspective	Nov 1, 2024	Integrated sensing and communicationISAC	—Unverified

Show:10 25 50

← PrevPage 63 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified