Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1350 of 4925 papers

Title	Date	Tasks	Status
AIQViT: Architecture-Informed Post-Training Quantization for Vision Transformers	Feb 7, 2025	image-classificationImage Classification	—Unverified
A Performance Analysis of You Only Look Once Models for Deployment on Constrained Computational Edge Devices in Drone Applications	Feb 6, 2025	NVIDIA Jetson Orin Nanoobject-detection	—Unverified
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference	Feb 6, 2025	Mathematical ReasoningQuantization	CodeCode Available
TQ-DiT: Efficient Time-Aware Quantization for Diffusion Transformers	Feb 6, 2025	Computational EfficiencyQuantization	—Unverified
Exploring Model Invariance with Discrete Search for Ultra-Low-Bit Quantization	Feb 6, 2025	Quantization	—Unverified
Asymptotic Analysis of One-bit Quantized Box-Constrained Precoding in Large-Scale Multi-User Systems	Feb 5, 2025	Quantization	—Unverified
SensorChat: Answering Qualitative and Quantitative Questions during Long-Term Multimodal Sensor Interactions	Feb 5, 2025	QuantizationQuestion Answering	—Unverified
HACK: Homomorphic Acceleration via Compression of the Key-Value Cache for Disaggregated LLM Inference	Feb 5, 2025	Language ModelingLanguage Modelling	—Unverified
BRIDLE: Generalized Self-supervised Learning with Quantization	Feb 4, 2025	image-classificationImage Classification	CodeCode Available
Unlocking Efficient Large Inference Models: One-Bit Unrolling Tips the Scales	Feb 4, 2025	Language ModelingLanguage Modelling	—Unverified
Survey of Quantization Techniques for On-Device Vision-based Crack Detection	Feb 4, 2025	QuantizationStructural Health Monitoring	—Unverified
Continuous Autoregressive Modeling with Stochastic Monotonic Alignment for Speech Synthesis	Feb 3, 2025	QuantizationSpeech Synthesis	—Unverified
Nearly Lossless Adaptive Bit Switching	Feb 3, 2025	Quantization	CodeCode Available
QLESS: A Quantized Approach for Data Valuation and Selection in Large Language Model Fine-Tuning	Feb 3, 2025	Data ValuationLanguage Modeling	CodeCode Available
Choose Your Model Size: Any Compression by a Single Gradient Descent	Feb 3, 2025	Quantization	—Unverified
An Inquiry into Datacenter TCO for LLM Inference with FP8	Feb 3, 2025	Language ModelingLanguage Modelling	—Unverified
On Noncommutative Quantum Mechanics and the Black-Scholes Model	Feb 2, 2025	Quantization	—Unverified
Huff-LLM: End-to-End Lossless Compression for Efficient LLM Inference	Feb 2, 2025	Model CompressionQuantization	—Unverified
Structural Latency Perturbation in Large Language Models Through Recursive State Induction	Feb 2, 2025	Computational EfficiencyQuantization	—Unverified
Enhancing Field-Oriented Control of Electric Drives with Tiny Neural Network Optimized for Micro-controllers	Feb 1, 2025	Quantization	—Unverified
MQuant: Unleashing the Inference Potential of Multimodal Large Language Models via Full Static Quantization	Feb 1, 2025	Quantization	—Unverified
Fully Distributed and Quantized Algorithm for MPC-based Autonomous Vehicle Platooning Optimization	Jan 31, 2025	Model Predictive ControlQuantization	—Unverified
LLM-based Affective Text Generation Quality Based on Different Quantization Values	Jan 31, 2025	GPUQuantization	—Unverified
CodeBrain: Impute Any Brain MRI via Instance-specific Scalar-quantized Codes	Jan 30, 2025	ImputationQuantization	—Unverified
Mixed-Precision Graph Neural Quantization for Low Bit Large Language Models	Jan 30, 2025	Graph Neural NetworkQuantization	—Unverified
Distinguished Quantized Guidance for Diffusion-based Sequence Recommendation	Jan 29, 2025	DenoisingQuantization	—Unverified
Optimizing Large Language Model Training Using FP4 Quantization	Jan 28, 2025	Language ModelingLanguage Modelling	—Unverified
Post-Training Quantization for Vision Mamba with k-Scaled Quantization and Reparameterization	Jan 28, 2025	MambaQuantization	—Unverified
EdgeMLOps: Operationalizing ML models with Cumulocity IoT and thin-edge.io for Visual quality Inspection	Jan 28, 2025	Asset ManagementManagement	—Unverified
Post-Training Quantization for 3D Medical Image Segmentation: A Practical Study on Real Inference Engines	Jan 28, 2025	Image SegmentationMedical Image Segmentation	CodeCode Available
Stabilization of an unstable reaction-diffusion PDE with input delay despite state and input quantization	Jan 27, 2025	Quantization	—Unverified
One-Bit Sigma-Delta DFRC Waveform Design: Using Quantization Noise for Radar Probing	Jan 27, 2025	Quantization	—Unverified
SQ-DM: Accelerating Diffusion Models with Aggressive Quantization and Temporal Sparsity	Jan 26, 2025	Image GenerationQuantization	—Unverified
Decentralized Low-Rank Fine-Tuning of Large Language Models	Jan 26, 2025	Federated Learningparameter-efficient fine-tuning	—Unverified
RotateKV: Accurate and Robust 2-Bit KV Cache Quantization for LLMs via Outlier-Aware Adaptive Rotations	Jan 25, 2025	Computational EfficiencyGSM8K	—Unverified
FBQuant: FeedBack Quantization for Large Language Models	Jan 25, 2025	Quantization	—Unverified
AKVQ-VL: Attention-Aware KV Cache Adaptive 2-Bit Quantization for Vision-Language Models	Jan 25, 2025	Quantization	—Unverified
On Accelerating Edge AI: Optimizing Resource-Constrained Environments	Jan 25, 2025	Knowledge DistillationModel Compression	—Unverified
On Hardening DNNs against Noisy Computations	Jan 24, 2025	Quantization	—Unverified
Channel-Aware Constellation Design for Digital OTA Computation	Jan 24, 2025	Quantization	—Unverified
End-to-end workflow for machine learning-based qubit readout with QICK and hls4ml	Jan 24, 2025	Quantization	—Unverified
SwiftPrune: Hessian-Free Weight Pruning for Large Language Models	Jan 24, 2025	Model CompressionQuantization	—Unverified
MambaQuant: Quantizing the Mamba Family with Variance Aligned Rotation Methods	Jan 23, 2025	MambaQuantization	—Unverified
Qrazor: Reliable and effortless 4-bit llm quantization by significant data razoring	Jan 23, 2025	Quantization	—Unverified
DQ-Data2vec: Decoupling Quantization for Multilingual Speech Recognition	Jan 23, 2025	QuantizationRepresentation Learning	—Unverified
QMamba: Post-Training Quantization for Vision State Space Models	Jan 23, 2025	QuantizationState Space Models	—Unverified
Diffusion-based Perceptual Neural Video Compression with Temporal Diffusion Information Reuse	Jan 23, 2025	Image CompressionQuantization	—Unverified
Irrational Complex Rotations Empower Low-bit Optimizers	Jan 22, 2025	GPUQuantization	—Unverified
GANQ: GPU-Adaptive Non-Uniform Quantization for Large Language Models	Jan 22, 2025	GPUQuantization	CodeCode Available
HEPPO: Hardware-Efficient Proximal Policy Optimization -- A Universal Pipelined Architecture for Generalized Advantage Estimation	Jan 22, 2025	CPUGPU	—Unverified

Show:10 25 50

← PrevPage 27 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified