Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 4925 papers

Title	Date	Tasks	Status
Self-Supervised Learning for Color Spike Camera Reconstruction	Jan 1, 2025	Motion EstimationQuantization	CodeCode Available
Multirate Neural Image Compression with Adaptive Lattice Vector Quantization	Jan 1, 2025	Domain AdaptationImage Compression	—Unverified
Secret Lies in Color: Enhancing AI-Generated Images Detection with Color Distribution Analysis	Jan 1, 2025	Image RestorationMisinformation	—Unverified
CacheQuant: Comprehensively Accelerated Diffusion Models	Jan 1, 2025	Image GenerationQuantization	—Unverified
DynScene: Scalable Generation of Dynamic Robotic Manipulation Scenes for Embodied AI	Jan 1, 2025	Dataset GenerationDiversity	—Unverified
Enhancing Diversity for Data-free Quantization	Jan 1, 2025	Data Free QuantizationDiversity	—Unverified
Rethinking Diffusion for Text-Driven Human Motion Generation: Redundant Representations, Evaluation, and Masked Autoregression	Jan 1, 2025	Motion GenerationQuantization	—Unverified
Frequency-Biased Synergistic Design for Image Compression and Compensation	Jan 1, 2025	Image CompressionQuantization	—Unverified
STEPS: Sequential Probability Tensor Estimation for Text-to-Image Hard Prompt Search	Jan 1, 2025	Computational EfficiencyQuantization	—Unverified
PillarHist: A Quantization-aware Pillar Feature Encoder based on Height-aware Histogram	Jan 1, 2025	3D Object DetectionAutonomous Driving	—Unverified
Intuitive Analysis of the Quantization-based Optimization: From Stochastic and Quantum Mechanical Perspective	Dec 31, 2024	global-optimizationQuantization	—Unverified
Accelerating Energy-Efficient Federated Learning in Cell-Free Networks with Adaptive Quantization	Dec 30, 2024	Federated LearningQuantization	—Unverified
DoTA: Weight-Decomposed Tensor Adaptation for Large Language Models	Dec 30, 2024	Arithmetic ReasoningQuantization	—Unverified
PQD: Post-training Quantization for Efficient Diffusion Models	Dec 30, 2024	DiversityImage Generation	—Unverified
Improving Acoustic Scene Classification in Low-Resource Conditions	Dec 30, 2024	Acoustic Scene ClassificationClassification	—Unverified
IMSSA: Deploying modern state-space models on memristive in-memory compute hardware	Dec 28, 2024	GPUQuantization	—Unverified
Pushing the Envelope of Low-Bit LLM via Dynamic Error Compensation	Dec 28, 2024	CPUGPU	—Unverified
Data-Free Group-Wise Fully Quantized Winograd Convolution via Learnable Scales	Dec 27, 2024	image-classificationImage Classification	—Unverified
Semantic Residual for Multimodal Unified Discrete Representation	Dec 26, 2024	DisentanglementQuantization	—Unverified
Advanced Knowledge Transfer: Refined Feature Distillation for Zero-Shot Quantization in Edge Computing	Dec 26, 2024	Edge-computingQuantization	CodeCode Available
Causal Speech Enhancement with Predicting Semantics based on Quantized Self-supervised Learning Features	Dec 26, 2024	Multi-Task LearningQuantization	—Unverified
Resource-Efficient Transformer Architecture: Optimizing Memory and Execution Time for Real-Time Applications	Dec 25, 2024	Quantization	—Unverified
Recommending Pre-Trained Models for IoT Devices	Dec 25, 2024	Model SelectionQuantization	—Unverified
Achieving Robustness in Blind Modulo Analog-to-Digital Conversion	Dec 24, 2024	Quantization	—Unverified
Unified Stochastic Framework for Neural Network Quantization and Pruning	Dec 24, 2024	Quantization	—Unverified
LSAQ: Layer-Specific Adaptive Quantization for Large Language Model Deployment	Dec 24, 2024	Language ModelingLanguage Modelling	—Unverified
1.58-bit FLUX	Dec 24, 2024	Computational EfficiencyImage Generation	—Unverified
Highly Optimized Kernels and Fine-Grained Codebooks for LLM Inference on Arm CPUs	Dec 23, 2024	Quantization	CodeCode Available
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference	Dec 23, 2024	GPULanguage Modeling	—Unverified
The HalluRAG Dataset: Detecting Closed-Domain Hallucinations in RAG Applications Using an LLM's Internal States	Dec 22, 2024	QuantizationRAG	CodeCode Available
Adaptive Dataset Quantization	Dec 22, 2024	Contrastive LearningDataset Distillation	—Unverified
Semantics Prompting Data-Free Quantization for Low-Bit Vision Transformers	Dec 21, 2024	Data Free QuantizationModel Compression	—Unverified
TCAQ-DM: Timestep-Channel Adaptive Quantization for Diffusion Models	Dec 21, 2024	QuantizationVideo Generation	—Unverified
Improving Quantization-aware Training of Low-Precision Network via Block Replacement on Full-Precision Counterpart	Dec 20, 2024	Quantization	—Unverified
MixLLM: LLM Quantization with Global Mixed-precision between Output-features and Highly-efficient System Design	Dec 19, 2024	MMLUQuantization	—Unverified
Progressive Fine-to-Coarse Reconstruction for Accurate Low-Bit Post-Training Quantization in Vision Transformers	Dec 19, 2024	Instance SegmentationPOS	—Unverified
Qua^2SeDiMo: Quantifiable Quantization Sensitivity of Diffusion Models	Dec 19, 2024	DenoisingImage Generation	—Unverified
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation	Dec 19, 2024	ClusteringQuantization	CodeCode Available
Self-control: A Better Conditional Mechanism for Masked Autoregressive Model	Dec 18, 2024	Conditional Image GenerationImage Generation	—Unverified
On the Compression of Language Models for Code: An Empirical Study on CodeBERT	Dec 18, 2024	Code SearchCode Summarization	—Unverified
More Tokens, Lower Precision: Towards the Optimal Token-Precision Trade-off in KV Cache Compression	Dec 17, 2024	Quantization	—Unverified
FinLoRA: Finetuning Quantized Financial Large Language Models Using Low-Rank Adaptation	Dec 16, 2024	GPUInformation Retrieval	—Unverified
Apollo-Forecast: Overcoming Aliasing and Inference Speed Challenges in Language Models for Time Series Forecasting	Dec 16, 2024	QuantizationTime Series	—Unverified
Quantifying Climate Change Impacts on Renewable Energy Generation: A Super-Resolution Recurrent Diffusion Model	Dec 16, 2024	DenoisingQuantization	—Unverified
QPruner: Probabilistic Decision Quantization for Structured Pruning in Large Language Models	Dec 16, 2024	Bayesian OptimizationQuantization	—Unverified
Fast and Slow Gradient Approximation for Binary Neural Network Optimization	Dec 16, 2024	Quantization	CodeCode Available
VRVVC: Variable-Rate NeRF-Based Volumetric Video Compression	Dec 16, 2024	NeRFQuantization	—Unverified
CSR:Achieving 1 Bit Key-Value Cache via Sparse Representation	Dec 16, 2024	Quantization	—Unverified
Nanoscaling Floating-Point (NxFP): NanoMantissa, Adaptive Microexponents, and Code Recycling for Direct-Cast Compression of Large Language Models	Dec 15, 2024	MMLUQuantization	—Unverified
Efficient Quantization-Aware Training on Segment Anything Model in Medical Images and Its Deployment	Dec 15, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available

Show:10 25 50

← PrevPage 29 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified