Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1426–1450 of 4925 papers

Title	Date	Tasks	Status
LSAQ: Layer-Specific Adaptive Quantization for Large Language Model Deployment	Dec 24, 2024	Language ModelingLanguage Modelling	—Unverified
1.58-bit FLUX	Dec 24, 2024	Computational EfficiencyImage Generation	—Unverified
Highly Optimized Kernels and Fine-Grained Codebooks for LLM Inference on Arm CPUs	Dec 23, 2024	Quantization	CodeCode Available
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference	Dec 23, 2024	GPULanguage Modeling	—Unverified
The HalluRAG Dataset: Detecting Closed-Domain Hallucinations in RAG Applications Using an LLM's Internal States	Dec 22, 2024	QuantizationRAG	CodeCode Available
Adaptive Dataset Quantization	Dec 22, 2024	Contrastive LearningDataset Distillation	—Unverified
Semantics Prompting Data-Free Quantization for Low-Bit Vision Transformers	Dec 21, 2024	Data Free QuantizationModel Compression	—Unverified
TCAQ-DM: Timestep-Channel Adaptive Quantization for Diffusion Models	Dec 21, 2024	QuantizationVideo Generation	—Unverified
Improving Quantization-aware Training of Low-Precision Network via Block Replacement on Full-Precision Counterpart	Dec 20, 2024	Quantization	—Unverified
MixLLM: LLM Quantization with Global Mixed-precision between Output-features and Highly-efficient System Design	Dec 19, 2024	MMLUQuantization	—Unverified
Progressive Fine-to-Coarse Reconstruction for Accurate Low-Bit Post-Training Quantization in Vision Transformers	Dec 19, 2024	Instance SegmentationPOS	—Unverified
Qua^2SeDiMo: Quantifiable Quantization Sensitivity of Diffusion Models	Dec 19, 2024	DenoisingImage Generation	—Unverified
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation	Dec 19, 2024	ClusteringQuantization	CodeCode Available
Self-control: A Better Conditional Mechanism for Masked Autoregressive Model	Dec 18, 2024	Conditional Image GenerationImage Generation	—Unverified
On the Compression of Language Models for Code: An Empirical Study on CodeBERT	Dec 18, 2024	Code SearchCode Summarization	—Unverified
More Tokens, Lower Precision: Towards the Optimal Token-Precision Trade-off in KV Cache Compression	Dec 17, 2024	Quantization	—Unverified
FinLoRA: Finetuning Quantized Financial Large Language Models Using Low-Rank Adaptation	Dec 16, 2024	GPUInformation Retrieval	—Unverified
Apollo-Forecast: Overcoming Aliasing and Inference Speed Challenges in Language Models for Time Series Forecasting	Dec 16, 2024	QuantizationTime Series	—Unverified
Quantifying Climate Change Impacts on Renewable Energy Generation: A Super-Resolution Recurrent Diffusion Model	Dec 16, 2024	DenoisingQuantization	—Unverified
QPruner: Probabilistic Decision Quantization for Structured Pruning in Large Language Models	Dec 16, 2024	Bayesian OptimizationQuantization	—Unverified
Fast and Slow Gradient Approximation for Binary Neural Network Optimization	Dec 16, 2024	Quantization	CodeCode Available
VRVVC: Variable-Rate NeRF-Based Volumetric Video Compression	Dec 16, 2024	NeRFQuantization	—Unverified
CSR:Achieving 1 Bit Key-Value Cache via Sparse Representation	Dec 16, 2024	Quantization	—Unverified
Nanoscaling Floating-Point (NxFP): NanoMantissa, Adaptive Microexponents, and Code Recycling for Direct-Cast Compression of Large Language Models	Dec 15, 2024	MMLUQuantization	—Unverified
Efficient Quantization-Aware Training on Segment Anything Model in Medical Images and Its Deployment	Dec 15, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available

Show:10 25 50

← PrevPage 58 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified