Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 726–750 of 4925 papers

Title	Date	Tasks	Status	Hype
Taming Scalable Visual Tokenizer for Autoregressive Image Generation	Dec 3, 2024	Image GenerationImage Reconstruction	CodeCode Available	4
CEGI: Measuring the trade-off between efficiency and carbon emissions for SLMs and VLMs	Dec 3, 2024	Image CaptioningQuantization	—Unverified	0
Optimizing Domain-Specific Image Retrieval: A Benchmark of FAISS and Annoy with Fine-Tuned Features	Dec 2, 2024	Image RetrievalQuantization	—Unverified	0
Memory-Efficient Training for Deep Speaker Embedding Learning in Speaker Verification	Dec 2, 2024	GPUQuantization	—Unverified	0
XQ-GAN: An Open-source Image Tokenization Framework for Autoregressive Generation	Dec 2, 2024	Image ReconstructionQuantization	CodeCode Available	3
Reducing Inference Energy Consumption Using Dual Complementary CNNs	Dec 2, 2024	Quantization	CodeCode Available	0
Improving Detail in Pluralistic Image Inpainting with Feature Dequantization	Dec 2, 2024	Image InpaintingQuantization	CodeCode Available	1
RILQ: Rank-Insensitive LoRA-based Quantization Error Compensation for Boosting 2-bit Large Language Model Accuracy	Dec 2, 2024	Computational EfficiencyLanguage Modeling	CodeCode Available	0
Quantization-Aware Imitation-Learning for Resource-Efficient Robotic Control	Dec 2, 2024	Autonomous DrivingDecision Making	—Unverified	0
DFRot: Achieving Outlier-Free and Massive Activation-Free for Rotated LLMs with Refined Rotation	Dec 1, 2024	Quantization	CodeCode Available	1
A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Series	Dec 1, 2024	ImputationQuantization	—Unverified	0
LAMBDA: Covering the Multimodal Critical Scenarios for Automated Driving Systems by Search Space Quantization	Nov 30, 2024	Quantization	—Unverified	0
Privacy-Preserving Orthogonal Aggregation for Guaranteeing Gender Fairness in Federated Recommendation	Nov 29, 2024	AttributeFairness	—Unverified	0
CogACT: A Foundational Vision-Language-Action Model for Synergizing Cognition and Action in Robotic Manipulation	Nov 29, 2024	QuantizationVision-Language-Action	—Unverified	0
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding	Nov 29, 2024	Motion SynthesisQuantization	—Unverified	0
Scaling Transformers for Low-Bitrate High-Quality Speech Coding	Nov 29, 2024	Quantization	CodeCode Available	3
Quantized Delta Weight Is Safety Keeper	Nov 29, 2024	Quantization	—Unverified	0
Orthus: Autoregressive Interleaved Image-Text Generation with Modality-Specific Heads	Nov 28, 2024	GPULanguage Modeling	—Unverified	0
On the effectiveness of discrete representations in sparse mixture of experts	Nov 28, 2024	Mixture-of-ExpertsQuantization	—Unverified	0
FAMES: Fast Approximate Multiplier Substitution for Mixed-Precision Quantized DNNs--Down to 2 Bits!	Nov 27, 2024	Quantization	—Unverified	0
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection	Nov 26, 2024	Quantization	—Unverified	0
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available	0
Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens	Nov 26, 2024	Quantization	—Unverified	0
MotionLLaMA: A Unified Framework for Motion Synthesis and Comprehension	Nov 26, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
Rapid Deployment of Domain-specific Hyperspectral Image Processors with Application to Autonomous Driving	Nov 26, 2024	Autonomous DrivingQuantization	—Unverified	0

Show:10 25 50

← PrevPage 30 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified