Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1076–1100 of 4925 papers

Title	Date	Tasks	Status
Efficient Fine-Tuning of Quantized Models via Adaptive Rank and Bitwidth	May 2, 2025	GSM8KQuantization	—Unverified
LMDepth: Lightweight Mamba-based Monocular Depth Estimation for Real-World Deployment	May 2, 2025	Autonomous DrivingComputational Efficiency	—Unverified
Efficient Vision-based Vehicle Speed Estimation	May 2, 2025	Quantizationvehicle detection	—Unverified
Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free	May 2, 2025	Quantization	—Unverified
Aggregating empirical evidence from data strategy studies: a case on model quantization	May 1, 2025	GPUQuantization	—Unverified
Optimizing Deep Neural Networks using Safety-Guided Self Compression	May 1, 2025	Language ModelingLanguage Modelling	CodeCode Available
Generative QoE Modeling: A Lightweight Approach for Telecom Networks	Apr 30, 2025	Computational EfficiencyQuantization	—Unverified
Optimization of embeddings storage for RAG systems using quantization and dimensionality reduction techniques	Apr 30, 2025	Dimensionality ReductionMTEB Benchmark	—Unverified
Precision Where It Matters: A Novel Spike Aware Mixed-Precision Quantization Strategy for LLaMA-based Language Models	Apr 30, 2025	Quantization	—Unverified
Clustering-Based Evolutionary Federated Multiobjective Optimization and Learning	Apr 29, 2025	ClusteringDiversity	—Unverified
APG-MOS: Auditory Perception Guided-MOS Predictor for Synthetic Speech	Apr 29, 2025	Quantization	—Unverified
FineQ: Software-Hardware Co-Design for Low-Bit Fine-Grained Mixed-Precision Quantization of LLMs	Apr 28, 2025	Quantization	—Unverified
TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate	Apr 28, 2025	Quantization	—Unverified
Partition Map-Based Fast Block Partitioning for VVC Inter Coding	Apr 25, 2025	Quantization	CodeCode Available
Pushing the boundary on Natural Language Inference	Apr 25, 2025	Fact CheckingInformation Retrieval	—Unverified
On-Device Qwen2.5: Efficient LLM Inference with Model Compression and Hardware Acceleration	Apr 24, 2025	CPUModel Compression	—Unverified
Fast Autoregressive Models for Continuous Latent Generation	Apr 24, 2025	DenoisingImage Generation	—Unverified
Precision Neural Network Quantization via Learnable Adaptive Modules	Apr 24, 2025	Computational EfficiencyQuantization	—Unverified
Distributed Optimization with Efficient Communication, Event-Triggered Solution Enhancement, and Operation Stopping	Apr 23, 2025	Distributed OptimizationQuantization	—Unverified
TeLLMe: An Energy-Efficient Ternary LLM Accelerator for Prefilling and Decoding on Edge FPGAs	Apr 22, 2025	Quantization	—Unverified
Hexcute: A Tile-based Programming Language with Automatic Layout and Task-Mapping Synthesis	Apr 22, 2025	GPUQuantization	—Unverified
A LoRA-Based Approach to Fine-Tuning LLMs for Educational Guidance in Resource-Constrained Settings	Apr 22, 2025	Computational EfficiencyGPU	CodeCode Available
Compute-Optimal LLMs Provably Generalize Better With Scale	Apr 21, 2025	Generalization BoundsQuantization	—Unverified
StableQuant: Layer Adaptive Post-Training Quantization for Speech Foundation Models	Apr 21, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Efficient Implicit Neural Compression of Point Clouds via Learnable Activation in Latent Space	Apr 20, 2025	AttributeDecoder	—Unverified

Show:10 25 50

← PrevPage 44 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified