Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4601–4650 of 4925 papers

Title	Date	Tasks	Status
Fisher-aware Quantization for DETR Detectors with Critical-category Objectives	Jul 3, 2024	object-detectionObject Detection	—Unverified
FIT: A Metric for Model Sensitivity	Oct 16, 2022	modelModel Compression	—Unverified
FIXAR: A Fixed-Point Deep Reinforcement Learning Platform with Quantization-Aware Training and Adaptive Parallelism	Feb 24, 2021	CPUDeep Reinforcement Learning	—Unverified
Fixed-Point Back-Propagation Training	Jun 1, 2020	CPUimage-classification	—Unverified
Fixed-point optimization of deep neural networks with adaptive step size retraining	Feb 27, 2017	Quantization	—Unverified
Fixed-Point Performance Analysis of Recurrent Neural Networks	Dec 4, 2015	Language ModelingLanguage Modelling	—Unverified
Fixed-point quantization aware training for on-device keyword-spotting	Mar 4, 2023	Keyword SpottingQuantization	—Unverified
Fixed Point Quantization of Deep Convolutional Networks	Nov 19, 2015	Quantization	—Unverified
Fixflow: A Framework to Evaluate Fixed-point Arithmetic in Light-Weight CNN Inference	Feb 19, 2023	ClassificationQuantization	—Unverified
FLARE: FP-Less PTQ and Low-ENOB ADC Based AMS-PiM for Error-Resilient, Fast, and Efficient Transformer Acceleration	Nov 22, 2024	Quantization	—Unverified
FlashAttention on a Napkin: A Diagrammatic Approach to Deep Learning IO-Awareness	Dec 4, 2024	GPUQuantization	—Unverified
FlatENN: Train Flat for Enhanced Fault Tolerance of Quantized Deep Neural Networks	Dec 29, 2022	Model CompressionQuantization	—Unverified
Flattened one-bit stochastic gradient descent: compressed distributed optimization with controlled variance	May 17, 2024	Distributed OptimizationQuantization	—Unverified
FlattenQuant: Breaking Through the Inference Compute-bound for Large Language Models with Per-tensor Quantization	Feb 28, 2024	GPUQuantization	—Unverified
Flexible Neural Image Compression via Code Editing	Sep 19, 2022	DecoderImage Compression	—Unverified
Flexible Unsupervised Learning for Massive MIMO Subarray Hybrid Beamforming	Aug 10, 2022	Quantization	—Unverified
FleXOR: Trainable Fractional Quantization	Sep 9, 2020	Quantization	—Unverified
FlexQuant: Elastic Quantization Framework for Locally Hosted LLM on Edge Devices	Jan 13, 2025	Quantization	—Unverified
FlightLLM: Efficient Large Language Model Inference with a Complete Mapping Flow on FPGAs	Jan 8, 2024	Computational EfficiencyGPU	—Unverified
FLightNNs: Lightweight Quantized Deep Neural Networks for Fast and Accurate Inference	Apr 5, 2019	Quantization	—Unverified
FLIQS: One-Shot Mixed-Precision Floating-Point and Integer Quantization Search	Aug 7, 2023	Quantization	—Unverified
FlowPrecision: Advancing FPGA-Based Real-Time Fluid Flow Estimation with Linear Quantization	Mar 4, 2024	Quantization	—Unverified
FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization	Mar 11, 2024	Face GenerationQuantization	—Unverified
FoldToken2: Learning compact, invariant and generative protein structure language	Jun 11, 2024	DecoderQuantization	—Unverified
FoldToken: Learning Protein Language via Vector Quantization and Beyond	Feb 4, 2024	Quantization	—Unverified
Foothill: A Quasiconvex Regularization for Edge Computing of Deep Neural Networks	Jan 18, 2019	Edge-computingGeneral Classification	—Unverified
Forearm Ultrasound based Gesture Recognition on Edge	Sep 16, 2024	Gesture RecognitionHand Gesture Recognition	—Unverified
Formal Uncertainty Propagation for Stochastic Dynamical Systems with Additive Noise	May 16, 2025	QuantizationStochastic Optimization	—Unverified
Forward Link Analysis for Full-Duplex Cellular Networks with Low Resolution ADC/DAC	Mar 7, 2022	Quantization	—Unverified
Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own	Oct 4, 2023	Quantizationreinforcement-learning	—Unverified
FoVolNet: Fast Volume Rendering using Foveated Deep Neural Networks	Sep 20, 2022	Data VisualizationImage Reconstruction	—Unverified
FP8-BERT: Post-Training Quantization for Transformer	Dec 10, 2023	Quantization	—Unverified
FP8 versus INT8 for efficient deep learning inference	Mar 31, 2023	Deep LearningQuantization	—Unverified
FPGA Implementations of Layered MinSum LDPC Decoders Using RCQ Message Passing	Apr 19, 2021	DecoderQuantization	—Unverified
FPGA Resource-aware Structured Pruning for Real-Time Neural Networks	Aug 9, 2023	Classificationimage-classification	—Unverified
FPRaker: A Processing Element For Accelerating Neural Network Training	Oct 15, 2020	Quantization	—Unverified
FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion	Jun 5, 2025	DenoisingQuantization	—Unverified
FPTQ: Fine-grained Post-Training Quantization for Large Language Models	Aug 30, 2023	Quantization	—Unverified
FPTQuant: Function-Preserving Transforms for LLM Quantization	Jun 5, 2025	Quantization	—Unverified
FP=xINT:A Low-Bit Series Expansion Algorithm for Post-Training Quantization	Dec 9, 2024	Quantization	—Unverified
FQ-Conv: Fully Quantized Convolution for Efficient and Accurate Inference	Dec 19, 2019	Quantization	—Unverified
Frame Quantization of Neural Networks	Apr 11, 2024	Quantization	—Unverified
Free Bits: Latency Optimization of Mixed-Precision Quantized Neural Networks on the Edge	Jul 6, 2023	NavigateQuantization	—Unverified
freePruner: A Training-free Approach for Large Multimodal Model Acceleration	Nov 23, 2024	QuantizationQuestion Answering	—Unverified
Frequency Autoregressive Image Generation with Continuous Tokens	Mar 7, 2025	Image GenerationLanguage Modeling	—Unverified
Frequency-Biased Synergistic Design for Image Compression and Compensation	Jan 1, 2025	Image CompressionQuantization	—Unverified
Frequency Disentangled Features in Neural Image Compression	Aug 4, 2023	DisentanglementImage Compression	—Unverified
From Algorithm to Hardware: A Survey on Efficient and Safe Deployment of Deep Neural Networks	May 9, 2024	Knowledge DistillationModel Compression	—Unverified
From Hard to Soft: Understanding Deep Network Nonlinearities via Vector Quantization and Statistical Inference	Oct 22, 2018	Quantization	—Unverified
From Large to Super-Tiny: End-to-End Optimization for Cost-Efficient LLMs	Apr 18, 2025	Knowledge DistillationModel Compression	—Unverified

Show:10 25 50

← PrevPage 93 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified