Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 4925 papers

Title	Date	Tasks	Status
FGMP: Fine-Grained Mixed-Precision Weight and Activation Quantization for Hardware-Accelerated LLM Inference	Apr 19, 2025	Large Language ModelQuantization	—Unverified
Lightweight Road Environment Segmentation using Vector Quantization	Apr 19, 2025	Autonomous DrivingImage Segmentation	—Unverified
Gradual Binary Search and Dimension Expansion : A general method for activation quantization in LLMs	Apr 18, 2025	Quantization	—Unverified
From Large to Super-Tiny: End-to-End Optimization for Cost-Efficient LLMs	Apr 18, 2025	Knowledge DistillationModel Compression	—Unverified
The Binary and Ternary Quantization Can Improve Feature Discrimination	Apr 18, 2025	ClassificationQuantization	—Unverified
ImPart: Importance-Aware Delta-Sparsification for Improved Model Compression and Merging in LLMs	Apr 17, 2025	Model CompressionQuantization	CodeCode Available
FedX: Adaptive Model Decomposition and Quantization for IoT Federated Learning	Apr 17, 2025	Federated LearningQuantization	—Unverified
D^2MoE: Dual Routing and Dynamic Scheduling for Efficient On-Device MoE-based LLM Serving	Apr 17, 2025	Mixture-of-ExpertsModel Compression	—Unverified
GT-SVQ: A Linear-Time Graph Transformer for Node Classification Using Spiking Vector Quantization	Apr 16, 2025	Graph LearningGraph Representation Learning	CodeCode Available
Résumé abstractif à partir d'une transcription audio	Apr 16, 2025	Quantization	—Unverified
ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization	Apr 16, 2025	DecoderQuantization	—Unverified
Neural Network Emulation of the Classical Limit in Quantum Systems via Learned Observable Mappings	Apr 15, 2025	PhilosophyQuantization	—Unverified
GOAT-TTS: Expressive and Realistic Speech Generation via A Dual-Branch LLM	Apr 15, 2025	QuantizationReading Comprehension	—Unverified
CSPLADE: Learned Sparse Retrieval with Causal Language Models	Apr 15, 2025	Information RetrievalQuantization	—Unverified
Quantization Error Propagation: Revisiting Layer-Wise Post-Training Quantization	Apr 13, 2025	Quantization	—Unverified
Simultaneous Input and State Estimation under Output Quantization: A Gaussian Mixture approach	Apr 13, 2025	Fault DetectionQuantization	—Unverified
Asymptotic stabilization under homomorphic encryption: A re-encryption free method	Apr 12, 2025	Quantization	—Unverified
Deploying Large AI Models on Resource-Limited Devices with Split Federated Learning	Apr 12, 2025	Federated LearningQuantization	—Unverified
SpecEE: Accelerating Large Language Model Inference with Speculative Early Exiting	Apr 11, 2025	GPULanguage Modeling	—Unverified
MixDiT: Accelerating Image Diffusion Transformer Inference with Mixed-Precision MX Quantization	Apr 11, 2025	Image GenerationQuantization	—Unverified
Muon-Accelerated Attention Distillation for Real-Time Edge Synthesis via Optimized Latent Diffusion	Apr 11, 2025	Image GenerationQuantization	—Unverified
MotionDreamer: One-to-Many Motion Synthesis with Localized Generative Masked Transformer	Apr 11, 2025	Motion SynthesisQuantization	—Unverified
APSQ: Additive Partial Sum Quantization with Algorithm-Hardware Co-Design	Apr 10, 2025	Model CompressionQuantization	CodeCode Available
PoGO: A Scalable Proof of Useful Work via Quantized Gradient Descent and Merkle Proofs	Apr 10, 2025	GPUQuantization	—Unverified
CHIME: A Compressive Framework for Holistic Interest Modeling	Apr 9, 2025	Contrastive LearningQuantization	—Unverified
BBQRec: Behavior-Bind Quantization for Multi-Modal Sequential Recommendation	Apr 9, 2025	QuantizationRecommendation Systems	—Unverified
Achieving binary weight and activation for LLMs using Post-Training Quantization	Apr 7, 2025	Quantization	—Unverified
Two is Better than One: Efficient Ensemble Defense for Robust and Compact Models	Apr 7, 2025	Adversarial RobustnessDiversity	—Unverified
AccLLM: Accelerating Long-Context LLM Inference Via Algorithm-Hardware Co-Design	Apr 7, 2025	Quantization	—Unverified
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs	Apr 7, 2025	BenchmarkingFairness	CodeCode Available
Bridging the Gap between Continuous and Informative Discrete Representations by Random Product Quantization	Apr 7, 2025	QuantizationSelf-Supervised Learning	—Unverified
Balancing Robustness and Efficiency in Embedded DNNs Through Activation Function Selection	Apr 7, 2025	Autonomous DrivingDecoder	—Unverified
PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters	Apr 7, 2025	CPUGPU	CodeCode Available
Skin Color Measurement from Dermatoscopic Images: An Evaluation on a Synthetic Dataset	Apr 6, 2025	Quantization	—Unverified
Autoregressive High-Order Finite Difference Modulo Imaging: High-Dynamic Range for Computer Vision Applications	Apr 5, 2025	Autonomous DrivingImage Reconstruction	—Unverified
Shape My Moves: Text-Driven Shape-Aware Synthesis of Human Motions	Apr 4, 2025	Language ModelingLanguage Modelling	—Unverified
Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats	Apr 4, 2025	Cloud DetectionQuantization	—Unverified
Sustainable LLM Inference for Edge AI: Evaluating Quantized LLMs for Energy Efficiency, Output Accuracy, and Inference Latency	Apr 4, 2025	BenchmarkingGSM8K	—Unverified
Compressing 3D Gaussian Splatting by Noise-Substituted Vector Quantization	Apr 3, 2025	3DGS3D Reconstruction	CodeCode Available
HPGN: Hybrid Priors-Guided Network for Compressed Low-Light Image Enhancement	Apr 3, 2025	Image EnhancementLow-Light Image Enhancement	—Unverified
Bridging the Gap between Gaussian Diffusion Models and Universal Quantization for Image Compression	Apr 3, 2025	Image CompressionQuantization	—Unverified
Moment Quantization for Video Temporal Grounding	Apr 3, 2025	QuantizationVideo Understanding	—Unverified
When Reasoning Meets Compression: Benchmarking Compressed Large Reasoning Models on Complex Reasoning Tasks	Apr 2, 2025	BenchmarkingLanguage Modeling	—Unverified
LLMPi: Optimizing LLMs for High-Throughput on Raspberry Pi	Apr 2, 2025	Computational EfficiencyQuantization	—Unverified
QSViT: A Methodology for Quantizing Spiking Vision Transformers	Apr 1, 2025	Quantization	—Unverified
Model Hemorrhage and the Robustness Limits of Large Language Models	Mar 31, 2025	Quantization	—Unverified
Style Quantization for Data-Efficient GAN Training	Mar 31, 2025	NavigateQuantization	—Unverified
SQuat: Subspace-orthogonal KV Cache Quantization	Mar 31, 2025	Quantization	—Unverified
Cocktail: Chunk-Adaptive Mixed-Precision Quantization for Long-Context LLM Inference	Mar 30, 2025	GPUQuantization	—Unverified
NeuralGS: Bridging Neural Fields and 3D Gaussian Splatting for Compact 3D Representations	Mar 29, 2025	3DGSNeRF	—Unverified

Show:10 25 50

← PrevPage 23 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified