Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1126–1150 of 4925 papers

Title	Date	Tasks	Status
BBQRec: Behavior-Bind Quantization for Multi-Modal Sequential Recommendation	Apr 9, 2025	QuantizationRecommendation Systems	—Unverified
Achieving binary weight and activation for LLMs using Post-Training Quantization	Apr 7, 2025	Quantization	—Unverified
Two is Better than One: Efficient Ensemble Defense for Robust and Compact Models	Apr 7, 2025	Adversarial RobustnessDiversity	—Unverified
AccLLM: Accelerating Long-Context LLM Inference Via Algorithm-Hardware Co-Design	Apr 7, 2025	Quantization	—Unverified
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs	Apr 7, 2025	BenchmarkingFairness	CodeCode Available
Bridging the Gap between Continuous and Informative Discrete Representations by Random Product Quantization	Apr 7, 2025	QuantizationSelf-Supervised Learning	—Unverified
Balancing Robustness and Efficiency in Embedded DNNs Through Activation Function Selection	Apr 7, 2025	Autonomous DrivingDecoder	—Unverified
PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters	Apr 7, 2025	CPUGPU	CodeCode Available
Skin Color Measurement from Dermatoscopic Images: An Evaluation on a Synthetic Dataset	Apr 6, 2025	Quantization	—Unverified
Autoregressive High-Order Finite Difference Modulo Imaging: High-Dynamic Range for Computer Vision Applications	Apr 5, 2025	Autonomous DrivingImage Reconstruction	—Unverified
Shape My Moves: Text-Driven Shape-Aware Synthesis of Human Motions	Apr 4, 2025	Language ModelingLanguage Modelling	—Unverified
Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats	Apr 4, 2025	Cloud DetectionQuantization	—Unverified
Sustainable LLM Inference for Edge AI: Evaluating Quantized LLMs for Energy Efficiency, Output Accuracy, and Inference Latency	Apr 4, 2025	BenchmarkingGSM8K	—Unverified
Compressing 3D Gaussian Splatting by Noise-Substituted Vector Quantization	Apr 3, 2025	3DGS3D Reconstruction	CodeCode Available
HPGN: Hybrid Priors-Guided Network for Compressed Low-Light Image Enhancement	Apr 3, 2025	Image EnhancementLow-Light Image Enhancement	—Unverified
Bridging the Gap between Gaussian Diffusion Models and Universal Quantization for Image Compression	Apr 3, 2025	Image CompressionQuantization	—Unverified
Moment Quantization for Video Temporal Grounding	Apr 3, 2025	QuantizationVideo Understanding	—Unverified
When Reasoning Meets Compression: Benchmarking Compressed Large Reasoning Models on Complex Reasoning Tasks	Apr 2, 2025	BenchmarkingLanguage Modeling	—Unverified
LLMPi: Optimizing LLMs for High-Throughput on Raspberry Pi	Apr 2, 2025	Computational EfficiencyQuantization	—Unverified
QSViT: A Methodology for Quantizing Spiking Vision Transformers	Apr 1, 2025	Quantization	—Unverified
Model Hemorrhage and the Robustness Limits of Large Language Models	Mar 31, 2025	Quantization	—Unverified
Style Quantization for Data-Efficient GAN Training	Mar 31, 2025	NavigateQuantization	—Unverified
SQuat: Subspace-orthogonal KV Cache Quantization	Mar 31, 2025	Quantization	—Unverified
Cocktail: Chunk-Adaptive Mixed-Precision Quantization for Long-Context LLM Inference	Mar 30, 2025	GPUQuantization	—Unverified
NeuralGS: Bridging Neural Fields and 3D Gaussian Splatting for Compact 3D Representations	Mar 29, 2025	3DGSNeRF	—Unverified

Show:10 25 50

← PrevPage 46 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified