Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 4925 papers

Title	Date	Tasks	Status
Private LoRA Fine-tuning of Open-Source LLMs with Homomorphic Encryption	May 12, 2025	GPUKnowledge Base Question Answering	—Unverified
Improving Block-Wise LLM Quantization by 4-bit Block-Wise Optimal Float (BOF4): Analysis and Variations	May 10, 2025	Language ModelingLanguage Modelling	—Unverified
Challenging GPU Dominance: When CPUs Outperform for On-Device LLM Inference	May 9, 2025	CPUGPU	—Unverified
Turbo-ICL: In-Context Learning-Based Turbo Equalization	May 9, 2025	DecoderDiversity	—Unverified
LightNobel: Improving Sequence Length Limitation in Protein Structure Prediction Model via Adaptive Activation Quantization	May 9, 2025	Protein FoldingProtein Structure Prediction	—Unverified
Mix-QSAM: Mixed-Precision Quantization of the Segment Anything Model	May 8, 2025	Computational EfficiencyInstance Segmentation	—Unverified
ReactDance: Progressive-Granular Representation for Long-Term Coherent Reactive Dance Generation	May 8, 2025	Quantization	—Unverified
Low-bit Model Quantization for Deep Neural Networks: A Survey	May 8, 2025	Quantization	CodeCode Available
LiteLMGuard: Seamless and Lightweight On-Device Prompt Filtering for Safeguarding Small Language Models against Quantization-induced Risks and Vulnerabilities	May 8, 2025	FairnessQuantization	CodeCode Available
Learning from Loss Landscape: Generalizable Mixed-Precision Quantization via Adaptive Sharpness-Aware Gradient Aligning	May 8, 2025	Quantization	—Unverified
On-Device LLM for Context-Aware Wi-Fi Roaming	May 7, 2025	Language ModelingLanguage Modelling	CodeCode Available
3D Gaussian Splatting Data Compression with Mixture of Priors	May 6, 2025	3DGSData Compression	—Unverified
Lightweight Clinical Decision Support System using QLoRA-Fine-Tuned LLMs and Retrieval-Augmented Generation	May 6, 2025	Disease PredictionQuantization	—Unverified
PROM: Prioritize Reduction of Multiplications Over Lower Bit-Widths for Efficient CNNs	May 6, 2025	Quantization	—Unverified
Optimizing LLMs for Resource-Constrained Environments: A Survey of Model Compression Techniques	May 5, 2025	Knowledge DistillationMixture-of-Experts	—Unverified
RobSurv: Vector Quantization-Based Multi-Modal Learning for Robust Cancer Survival Prediction	May 5, 2025	PrognosisQuantization	—Unverified
Rapid yet accurate Tile-circuit and device modeling for Analog In-Memory Computing	May 5, 2025	Quantization	—Unverified
Quantitative Analysis of Performance Drop in DeepSeek Model Quantization	May 5, 2025	GPUQuantization	CodeCode Available
End-to-end fully-binarized network design: from Generic Learned Thermometer to Block Pruning	May 5, 2025	Knowledge DistillationQuantization	—Unverified
Radio: Rate-Distortion Optimization for Large Language Model Compression	May 5, 2025	Language ModelingLanguage Modelling	—Unverified
EntroLLM: Entropy Encoded Weight Compression for Efficient Large Language Model Inference on Edge Devices	May 5, 2025	4kLanguage Modeling	—Unverified
Bielik 11B v2 Technical Report	May 5, 2025	Language ModelingLanguage Modelling	—Unverified
NeuroSim V1.5: Improved Software Backbone for Benchmarking Compute-in-Memory Accelerators with Device and Circuit-level Non-idealities	May 5, 2025	BenchmarkingQuantization	CodeCode Available
Quantizing Diffusion Models from a Sampling-Aware Perspective	May 4, 2025	DenoisingNoise Estimation	—Unverified
PASCAL: Precise and Efficient ANN- SNN Conversion using Spike Accumulation and Adaptive Layerwise Activation	May 3, 2025	Quantization	—Unverified
Efficient Fine-Tuning of Quantized Models via Adaptive Rank and Bitwidth	May 2, 2025	GSM8KQuantization	—Unverified
LMDepth: Lightweight Mamba-based Monocular Depth Estimation for Real-World Deployment	May 2, 2025	Autonomous DrivingComputational Efficiency	—Unverified
Efficient Vision-based Vehicle Speed Estimation	May 2, 2025	Quantizationvehicle detection	—Unverified
Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free	May 2, 2025	Quantization	—Unverified
Aggregating empirical evidence from data strategy studies: a case on model quantization	May 1, 2025	GPUQuantization	—Unverified
Optimizing Deep Neural Networks using Safety-Guided Self Compression	May 1, 2025	Language ModelingLanguage Modelling	CodeCode Available
Generative QoE Modeling: A Lightweight Approach for Telecom Networks	Apr 30, 2025	Computational EfficiencyQuantization	—Unverified
Optimization of embeddings storage for RAG systems using quantization and dimensionality reduction techniques	Apr 30, 2025	Dimensionality ReductionMTEB Benchmark	—Unverified
Precision Where It Matters: A Novel Spike Aware Mixed-Precision Quantization Strategy for LLaMA-based Language Models	Apr 30, 2025	Quantization	—Unverified
Clustering-Based Evolutionary Federated Multiobjective Optimization and Learning	Apr 29, 2025	ClusteringDiversity	—Unverified
APG-MOS: Auditory Perception Guided-MOS Predictor for Synthetic Speech	Apr 29, 2025	Quantization	—Unverified
FineQ: Software-Hardware Co-Design for Low-Bit Fine-Grained Mixed-Precision Quantization of LLMs	Apr 28, 2025	Quantization	—Unverified
TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate	Apr 28, 2025	Quantization	—Unverified
Partition Map-Based Fast Block Partitioning for VVC Inter Coding	Apr 25, 2025	Quantization	CodeCode Available
Pushing the boundary on Natural Language Inference	Apr 25, 2025	Fact CheckingInformation Retrieval	—Unverified
On-Device Qwen2.5: Efficient LLM Inference with Model Compression and Hardware Acceleration	Apr 24, 2025	CPUModel Compression	—Unverified
Fast Autoregressive Models for Continuous Latent Generation	Apr 24, 2025	DenoisingImage Generation	—Unverified
Precision Neural Network Quantization via Learnable Adaptive Modules	Apr 24, 2025	Computational EfficiencyQuantization	—Unverified
Distributed Optimization with Efficient Communication, Event-Triggered Solution Enhancement, and Operation Stopping	Apr 23, 2025	Distributed OptimizationQuantization	—Unverified
TeLLMe: An Energy-Efficient Ternary LLM Accelerator for Prefilling and Decoding on Edge FPGAs	Apr 22, 2025	Quantization	—Unverified
Hexcute: A Tile-based Programming Language with Automatic Layout and Task-Mapping Synthesis	Apr 22, 2025	GPUQuantization	—Unverified
A LoRA-Based Approach to Fine-Tuning LLMs for Educational Guidance in Resource-Constrained Settings	Apr 22, 2025	Computational EfficiencyGPU	CodeCode Available
Compute-Optimal LLMs Provably Generalize Better With Scale	Apr 21, 2025	Generalization BoundsQuantization	—Unverified
StableQuant: Layer Adaptive Post-Training Quantization for Speech Foundation Models	Apr 21, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Efficient Implicit Neural Compression of Point Clouds via Learnable Activation in Latent Space	Apr 20, 2025	AttributeDecoder	—Unverified

Show:10 25 50

← PrevPage 22 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified