Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1276–1300 of 4925 papers

Title	Date	Tasks	Status
EmbBERT-Q: Breaking Memory Barriers in Embedded NLP	Feb 14, 2025	MambaQuantization	CodeCode Available
Towards Watermarking of Open-Source LLMs	Feb 14, 2025	Quantization	—Unverified
Low-Complexity On-Grid Channel Estimation for Partially-Connected Hybrid XL-MIMO	Feb 14, 2025	Quantization	—Unverified
RoSTE: An Efficient Quantization-Aware Supervised Fine-Tuning Approach for Large Language Models	Feb 13, 2025	Quantization	—Unverified
NestQuant: Nested Lattice Quantization for Matrix Products and LLMs	Feb 13, 2025	Quantization	—Unverified
LowRA: Accurate and Efficient LoRA Fine-Tuning of LLMs under 2 Bits	Feb 12, 2025	parameter-efficient fine-tuningQuantization	—Unverified
Contextual Compression Encoding for Large Language Models: A Novel Framework for Multi-Layered Parameter Space Pruning	Feb 12, 2025	Computational EfficiencyQuantization	—Unverified
Compression of Site-Specific Deep Neural Networks for Massive MIMO Precoding	Feb 12, 2025	Neural Architecture SearchNeural Network Compression	—Unverified
Loss Landscape Analysis for Reliable Quantized ML Models for Scientific Sensing	Feb 12, 2025	Quantization	CodeCode Available
Scalable Thermodynamic Second-order Optimization	Feb 12, 2025	Quantization	—Unverified
Exploiting Non-uniform Quantization for Enhanced ILC in Wideband Digital Pre-distortion	Feb 12, 2025	Quantization	—Unverified
Conditional Distribution Quantization in Machine Learning	Feb 11, 2025	QuantizationUncertainty Quantification	—Unverified
Column-wise Quantization of Weights and Partial Sums for Accurate and Efficient Compute-In-Memory Accelerators	Feb 11, 2025	Quantization	CodeCode Available
Vision-Language Models for Edge Networks: A Comprehensive Survey	Feb 11, 2025	Autonomous VehiclesImage Captioning	—Unverified
HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates	Feb 11, 2025	Image CompressionImage Reconstruction	—Unverified
MEMHD: Memory-Efficient Multi-Centroid Hyperdimensional Computing for Fully-Utilized In-Memory Computing Architectures	Feb 11, 2025	Quantization	—Unverified
GraNNite: Enabling High-Performance Execution of Graph Neural Networks on Resource-Constrained Neural Processing Units	Feb 10, 2025	Event-based visionQuantization	CodeCode Available
Matryoshka Quantization	Feb 10, 2025	Quantization	—Unverified
Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation	Feb 10, 2025	Blood pressure estimationEEG	—Unverified
Demystifying Singular Defects in Large Language Models	Feb 10, 2025	Quantization	—Unverified
Gradient Based Method for the Fusion of Lattice Quantizers	Feb 9, 2025	Quantization	—Unverified
Physics-Conditioned Diffusion Models for Lattice Gauge Theory	Feb 8, 2025	Quantization	CodeCode Available
Scalable and consistent embedding of probability measures into Hilbert spaces via measure quantization	Feb 7, 2025	Quantization	—Unverified
Efficient Evaluation of Quantization-Effects in Neural Codecs	Feb 7, 2025	DecoderQuantization	—Unverified
QLIP: Text-Aligned Visual Tokenization Unifies Auto-Regressive Multimodal Understanding and Generation	Feb 7, 2025	Image GenerationQuantization	—Unverified

Show:10 25 50

← PrevPage 52 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified