Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 4925 papers

Title	Date	Tasks	Status	Hype
Exploiting Latent Properties to Optimize Neural Codecs	Jan 2, 2025	DecoderQuantization	—Unverified	0
MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization	Jan 2, 2025	Contrastive LearningKey Detection	CodeCode Available	3
TabTreeFormer: Tabular Data Generation Using Hybrid Tree-Transformer	Jan 2, 2025	BenchmarkingQuantization	—Unverified	0
BlockDialect: Block-wise Fine-grained Mixed Format Quantization for Energy-Efficient LLM Inference	Jan 2, 2025	Quantization	CodeCode Available	0
PillarHist: A Quantization-aware Pillar Feature Encoder based on Height-aware Histogram	Jan 1, 2025	3D Object DetectionAutonomous Driving	—Unverified	0
Pioneering 4-Bit FP Quantization for Diffusion Models: Mixup-Sign Quantization and Timestep-Aware Fine-Tuning	Jan 1, 2025	DenoisingQuantization	—Unverified	0
Self-Supervised Learning for Color Spike Camera Reconstruction	Jan 1, 2025	Motion EstimationQuantization	CodeCode Available	0
Enhancing Diversity for Data-free Quantization	Jan 1, 2025	Data Free QuantizationDiversity	—Unverified	0
Multirate Neural Image Compression with Adaptive Lattice Vector Quantization	Jan 1, 2025	Domain AdaptationImage Compression	—Unverified	0
Secret Lies in Color: Enhancing AI-Generated Images Detection with Color Distribution Analysis	Jan 1, 2025	Image RestorationMisinformation	—Unverified	0
Frequency-Biased Synergistic Design for Image Compression and Compensation	Jan 1, 2025	Image CompressionQuantization	—Unverified	0
CacheQuant: Comprehensively Accelerated Diffusion Models	Jan 1, 2025	Image GenerationQuantization	—Unverified	0
STEPS: Sequential Probability Tensor Estimation for Text-to-Image Hard Prompt Search	Jan 1, 2025	Computational EfficiencyQuantization	—Unverified	0
DynScene: Scalable Generation of Dynamic Robotic Manipulation Scenes for Embodied AI	Jan 1, 2025	Dataset GenerationDiversity	—Unverified	0
Rethinking Diffusion for Text-Driven Human Motion Generation: Redundant Representations, Evaluation, and Masked Autoregression	Jan 1, 2025	Motion GenerationQuantization	—Unverified	0
Efficient Decoupled Feature 3D Gaussian Splatting via Hierarchical Compression	Jan 1, 2025	3DGSQuantization	—Unverified	0
Intuitive Analysis of the Quantization-based Optimization: From Stochastic and Quantum Mechanical Perspective	Dec 31, 2024	global-optimizationQuantization	—Unverified	0
PQD: Post-training Quantization for Efficient Diffusion Models	Dec 30, 2024	DiversityImage Generation	—Unverified	0
DoTA: Weight-Decomposed Tensor Adaptation for Large Language Models	Dec 30, 2024	Arithmetic ReasoningQuantization	—Unverified	0
Accelerating Energy-Efficient Federated Learning in Cell-Free Networks with Adaptive Quantization	Dec 30, 2024	Federated LearningQuantization	—Unverified	0
Improving Acoustic Scene Classification in Low-Resource Conditions	Dec 30, 2024	Acoustic Scene ClassificationClassification	—Unverified	0
PTQ4VM: Post-Training Quantization for Visual Mamba	Dec 29, 2024	MambaQuantization	CodeCode Available	1
IMSSA: Deploying modern state-space models on memristive in-memory compute hardware	Dec 28, 2024	GPUQuantization	—Unverified	0
Pushing the Envelope of Low-Bit LLM via Dynamic Error Compensation	Dec 28, 2024	CPUGPU	—Unverified	0
Data-Free Group-Wise Fully Quantized Winograd Convolution via Learnable Scales	Dec 27, 2024	image-classificationImage Classification	—Unverified	0
A Survey on Large Language Model Acceleration based on KV Cache Management	Dec 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
MBQ: Modality-Balanced Quantization for Large Vision-Language Models	Dec 27, 2024	GPUQuantization	CodeCode Available	2
Causal Speech Enhancement with Predicting Semantics based on Quantized Self-supervised Learning Features	Dec 26, 2024	Multi-Task LearningQuantization	—Unverified	0
Semantic Residual for Multimodal Unified Discrete Representation	Dec 26, 2024	DisentanglementQuantization	—Unverified	0
Advanced Knowledge Transfer: Refined Feature Distillation for Zero-Shot Quantization in Edge Computing	Dec 26, 2024	Edge-computingQuantization	CodeCode Available	0
Resource-Efficient Transformer Architecture: Optimizing Memory and Execution Time for Real-Time Applications	Dec 25, 2024	Quantization	—Unverified	0
Recommending Pre-Trained Models for IoT Devices	Dec 25, 2024	Model SelectionQuantization	—Unverified	0
1.58-bit FLUX	Dec 24, 2024	Computational EfficiencyImage Generation	—Unverified	0
Achieving Robustness in Blind Modulo Analog-to-Digital Conversion	Dec 24, 2024	Quantization	—Unverified	0
Unified Stochastic Framework for Neural Network Quantization and Pruning	Dec 24, 2024	Quantization	—Unverified	0
An Automatic Graph Construction Framework based on Large Language Models for Recommendation	Dec 24, 2024	graph constructionQuantization	CodeCode Available	1
LSAQ: Layer-Specific Adaptive Quantization for Large Language Model Deployment	Dec 24, 2024	Language ModelingLanguage Modelling	—Unverified	0
Highly Optimized Kernels and Fine-Grained Codebooks for LLM Inference on Arm CPUs	Dec 23, 2024	Quantization	CodeCode Available	0
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference	Dec 23, 2024	GPULanguage Modeling	—Unverified	0
Hierarchical Vector Quantization for Unsupervised Action Segmentation	Dec 23, 2024	Action SegmentationClustering	CodeCode Available	1
The HalluRAG Dataset: Detecting Closed-Domain Hallucinations in RAG Applications Using an LLM's Internal States	Dec 22, 2024	QuantizationRAG	CodeCode Available	0
Adaptive Dataset Quantization	Dec 22, 2024	Contrastive LearningDataset Distillation	—Unverified	0
TCAQ-DM: Timestep-Channel Adaptive Quantization for Diffusion Models	Dec 21, 2024	QuantizationVideo Generation	—Unverified	0
Semantics Prompting Data-Free Quantization for Low-Bit Vision Transformers	Dec 21, 2024	Data Free QuantizationModel Compression	—Unverified	0
Improving Quantization-aware Training of Low-Precision Network via Block Replacement on Full-Precision Counterpart	Dec 20, 2024	Quantization	—Unverified	0
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation	Dec 19, 2024	ClusteringQuantization	CodeCode Available	0
MixLLM: LLM Quantization with Global Mixed-precision between Output-features and Highly-efficient System Design	Dec 19, 2024	MMLUQuantization	—Unverified	0
Qua^2SeDiMo: Quantifiable Quantization Sensitivity of Diffusion Models	Dec 19, 2024	DenoisingImage Generation	—Unverified	0
Preventing Local Pitfalls in Vector Quantization via Optimal Transport	Dec 19, 2024	Image ReconstructionQuantization	CodeCode Available	2
Progressive Fine-to-Coarse Reconstruction for Accurate Low-Bit Post-Training Quantization in Vision Transformers	Dec 19, 2024	Instance SegmentationPOS	—Unverified	0

Show:10 25 50

← PrevPage 13 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified