Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 4925 papers

Title	Date	Tasks	Status
Speech Enhancement Using Continuous Embeddings of Neural Audio Codec	Feb 22, 2025	QuantizationSpeech Enhancement	—Unverified
A 2-bit Wideband 5G mm-Wave RIS with Low Side Lobe Levels and no Quantization Lobe	Feb 22, 2025	Quantization	—Unverified
Verification of Bit-Flip Attacks against Quantized Neural Networks	Feb 22, 2025	Neural Network SecurityQuantization	—Unverified
Exact Recovery of Sparse Binary Vectors from Generalized Linear Measurements	Feb 21, 2025	2kQuantization	—Unverified
SVDq: 1.25-bit and 410x Key Cache Compression for LLM Attention	Feb 21, 2025	Quantization	—Unverified
FD-LSCIC: Frequency Decomposition-based Learned Screen Content Image Compression	Feb 21, 2025	Image CompressionMS-SSIM	—Unverified
Q-PETR: Quant-aware Position Embedding Transformation for Multi-View 3D Object Detection	Feb 21, 2025	3D Object DetectionAutonomous Driving	—Unverified
When Compression Meets Model Compression: Memory-Efficient Double Compression for Large Language Models	Feb 21, 2025	Model CompressionQuantization	—Unverified
Interleaved Block-based Learned Image Compression with Feature Enhancement and Quantization Error Compensation	Feb 21, 2025	Image CompressionMS-SSIM	—Unverified
Efficient AI in Practice: Training and Deployment of Efficient LLMs for Industry Applications	Feb 20, 2025	Knowledge DistillationModel Compression	—Unverified
Hardware-Friendly Static Quantization Method for Video Diffusion Transformers	Feb 20, 2025	QuantizationVideo Generation	—Unverified
More for Keys, Less for Values: Adaptive KV Cache Quantization	Feb 20, 2025	Quantization	—Unverified
A General Error-Theoretical Analysis Framework for Constructing Compression Strategies	Feb 19, 2025	Quantization	—Unverified
Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis	Feb 18, 2025	BenchmarkingMamba	CodeCode Available
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models	Feb 18, 2025	Quantization	CodeCode Available
A^2ATS: Retrieval-Based KV Cache Reduction via Windowed Rotary Position Embedding and Query-Aware Vector Quantization	Feb 18, 2025	CPUPosition	—Unverified
Towards Reasoning Ability of Small Language Models	Feb 17, 2025	Quantization	—Unverified
Fate: Fast Edge Inference of Mixture-of-Experts Models via Cross-Layer Gate	Feb 17, 2025	GPUMixture-of-Experts	CodeCode Available
Continual Quantization-Aware Pre-Training: When to transition from 16-bit to 1.58-bit pre-training for BitNet language models?	Feb 17, 2025	Quantization	—Unverified
Rotate, Clip, and Partition: Towards W2A4KV4 Quantization by Integrating Rotation and Learnable Non-uniform Quantizer	Feb 17, 2025	GPUQuantization	—Unverified
Towards Efficient Pre-training: Exploring FP4 Precision in Large Language Models	Feb 17, 2025	Quantization	—Unverified
On Quantizing Neural Representation for Variable-Rate Video Coding	Feb 17, 2025	Quantization	CodeCode Available
On the Logic Elements Associated with Round-Off Errors and Gaussian Blur in Image Registration: A Simple Case of Commingling	Feb 17, 2025	Image RegistrationQuantization	—Unverified
Unveiling Environmental Impacts of Large Language Model Serving: A Functional Unit View	Feb 16, 2025	Language ModelingLanguage Modelling	CodeCode Available
Weighted quantization using MMD: From mean field to mean shift via gradient flows	Feb 14, 2025	ClusteringQuantization	CodeCode Available
EmbBERT-Q: Breaking Memory Barriers in Embedded NLP	Feb 14, 2025	MambaQuantization	CodeCode Available
Towards Watermarking of Open-Source LLMs	Feb 14, 2025	Quantization	—Unverified
Low-Complexity On-Grid Channel Estimation for Partially-Connected Hybrid XL-MIMO	Feb 14, 2025	Quantization	—Unverified
RoSTE: An Efficient Quantization-Aware Supervised Fine-Tuning Approach for Large Language Models	Feb 13, 2025	Quantization	—Unverified
NestQuant: Nested Lattice Quantization for Matrix Products and LLMs	Feb 13, 2025	Quantization	—Unverified
LowRA: Accurate and Efficient LoRA Fine-Tuning of LLMs under 2 Bits	Feb 12, 2025	parameter-efficient fine-tuningQuantization	—Unverified
Contextual Compression Encoding for Large Language Models: A Novel Framework for Multi-Layered Parameter Space Pruning	Feb 12, 2025	Computational EfficiencyQuantization	—Unverified
Compression of Site-Specific Deep Neural Networks for Massive MIMO Precoding	Feb 12, 2025	Neural Architecture SearchNeural Network Compression	—Unverified
Loss Landscape Analysis for Reliable Quantized ML Models for Scientific Sensing	Feb 12, 2025	Quantization	CodeCode Available
Scalable Thermodynamic Second-order Optimization	Feb 12, 2025	Quantization	—Unverified
Exploiting Non-uniform Quantization for Enhanced ILC in Wideband Digital Pre-distortion	Feb 12, 2025	Quantization	—Unverified
Conditional Distribution Quantization in Machine Learning	Feb 11, 2025	QuantizationUncertainty Quantification	—Unverified
Column-wise Quantization of Weights and Partial Sums for Accurate and Efficient Compute-In-Memory Accelerators	Feb 11, 2025	Quantization	CodeCode Available
Vision-Language Models for Edge Networks: A Comprehensive Survey	Feb 11, 2025	Autonomous VehiclesImage Captioning	—Unverified
HDCompression: Hybrid-Diffusion Image Compression for Ultra-Low Bitrates	Feb 11, 2025	Image CompressionImage Reconstruction	—Unverified
MEMHD: Memory-Efficient Multi-Centroid Hyperdimensional Computing for Fully-Utilized In-Memory Computing Architectures	Feb 11, 2025	Quantization	—Unverified
GraNNite: Enabling High-Performance Execution of Graph Neural Networks on Resource-Constrained Neural Processing Units	Feb 10, 2025	Event-based visionQuantization	CodeCode Available
Matryoshka Quantization	Feb 10, 2025	Quantization	—Unverified
Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation	Feb 10, 2025	Blood pressure estimationEEG	—Unverified
Demystifying Singular Defects in Large Language Models	Feb 10, 2025	Quantization	—Unverified
Gradient Based Method for the Fusion of Lattice Quantizers	Feb 9, 2025	Quantization	—Unverified
Physics-Conditioned Diffusion Models for Lattice Gauge Theory	Feb 8, 2025	Quantization	CodeCode Available
Scalable and consistent embedding of probability measures into Hilbert spaces via measure quantization	Feb 7, 2025	Quantization	—Unverified
Efficient Evaluation of Quantization-Effects in Neural Codecs	Feb 7, 2025	DecoderQuantization	—Unverified
QLIP: Text-Aligned Visual Tokenization Unifies Auto-Regressive Multimodal Understanding and Generation	Feb 7, 2025	Image GenerationQuantization	—Unverified

Show:10 25 50

← PrevPage 26 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified