Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2901–2950 of 4925 papers

Title	Date	Tasks	Status
ReTAG: Reasoning Aware Table to Analytic Text Generation	May 19, 2023	Data-to-Text GenerationDescriptive	—Unverified
Stochastic Gradient Langevin Dynamics Based on Quantization with Increasing Resolution	May 30, 2023	Quantization	—Unverified
Stochastic Hybrid Combining Design for Quantized Massive MIMO Systems	Aug 24, 2020	QuantizationStochastic Optimization	—Unverified
Stochastic Learning Equation using Monotone Increasing Resolution of Quantization	Dec 24, 2021	global-optimizationQuantization	—Unverified
Stochastic Markov Gradient Descent and Training Low-Bit Neural Networks	Aug 25, 2020	Quantization	—Unverified
Stochastic Precision Ensemble: Self-Knowledge Distillation for Quantized Deep Neural Networks	Sep 30, 2020	image-classificationImage Classification	—Unverified
Stochastic-Sign SGD for Federated Learning with Theoretical Guarantees	Feb 25, 2020	Federated Learningparameter estimation	—Unverified
Stopping Rules for Bag-of-Words Image Search and Its Application in Appearance-Based Localization	Dec 28, 2013	Image RetrievalQuantization	—Unverified
STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM	Sep 11, 2024	Language ModellingLarge Language Model	—Unverified
Straightening Out the Straight-Through Estimator: Overcoming Optimization Challenges in Vector Quantized Networks	May 15, 2023	image-classificationImage Classification	—Unverified
Strategizing against Q-learners: A Control-theoretical Approach	Mar 13, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Streaming Parrotron for on-device speech-to-speech conversion	Oct 25, 2022	CPUDecoder	—Unverified
Streamlining Tensor and Network Pruning in PyTorch	Apr 28, 2020	Model CompressionNetwork Pruning	—Unverified
Strong Solutions and Quantization-Based Numerical Schemes for a Class of Non-Markovian Volatility Models	Feb 28, 2025	Quantization	—Unverified
Structural and Statistical Texture Knowledge Distillation for Semantic Segmentation	May 6, 2023	Knowledge DistillationQuantization	—Unverified
Structural Latency Perturbation in Large Language Models Through Recursive State Induction	Feb 2, 2025	Computational EfficiencyQuantization	—Unverified
Structured adaptive and random spinners for fast machine learning computations	Oct 19, 2016	BIG-bench Machine LearningDimensionality Reduction	—Unverified
Structured Binary Neural Networks for Accurate Image Classification and Semantic Segmentation	Nov 22, 2018	General Classificationimage-classification	—Unverified
Structured Compression by Weight Encryption for Unstructured Pruning and Quantization	May 24, 2019	Model CompressionQuantization	—Unverified
Neural Language of Thought Models	Feb 2, 2024	Image GenerationObject	—Unverified
Structure Information is the Key: Self-Attention RoI Feature Extractor in 3D Object Detection	Nov 1, 2021	2D Object Detection3D Object Detection	—Unverified
Studying the Interplay between Information Loss and Operation Loss in Representations for Classification	Dec 30, 2021	FormQuantization	—Unverified
Study of Encoder-Decoder Architectures for Code-Mix Search Query Translation	Aug 7, 2022	Data AugmentationDecoder	—Unverified
Study of Energy-Efficient Distributed RLS-based Learning with Coarsely Quantized Signals	Dec 20, 2020	parameter estimationQuantization	—Unverified
Style Quantization for Data-Efficient GAN Training	Mar 31, 2025	NavigateQuantization	—Unverified
Sub-8-Bit Quantization Aware Training for 8-Bit Neural Network Accelerator with On-Device Speech Recognition	Jun 30, 2022	Quantizationspeech-recognition	—Unverified
Sub-8-bit quantization for on-device speech recognition: a regularization-free approach	Oct 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sub 8-Bit Quantization of Streaming Keyword Spotting Models for Embedded Chipsets	Jul 13, 2022	CPUKeyword Spotting	—Unverified
Subgraph Stationary Hardware-Software Inference Co-Design	Jun 21, 2023	Quantization	—Unverified
SUBIC: A supervised, structured binary code for image search	Aug 9, 2017	Deep HashingImage Retrieval	—Unverified
Subjective Quality Database and Objective Study of Compressed Point Clouds With 6DoF Head-Mounted Display	Aug 6, 2020	Point Cloud Quality AssessmentQuantization	—Unverified
Sublinear quantum algorithms for training linear and kernel-based classifiers	Apr 4, 2019	Quantization	—Unverified
Subspace Robust Wasserstein Distances	Jan 25, 2019	Quantization	—Unverified
Subtensor Quantization for Mobilenets	Nov 4, 2020	image-classificationImage Classification	—Unverified
Succinct Compression: Near-Optimal and Lossless Compression of Deep Neural Networks during Inference Runtime	Sep 29, 2021	Quantization	—Unverified
Sum Rate Maximization in the Constant Envelope MIMO Downlink with the RZF Precoder	Nov 5, 2024	Quantization	—Unverified
Super-High-Fidelity Image Compression via Hierarchical-ROI and Adaptive Quantization	Mar 19, 2024	Image CompressionQuantization	—Unverified
Super-relaxation of space-time-quantized ensemble of energy loads to curtail their synchronization after demand response perturbation	Aug 3, 2020	Quantization	—Unverified
Super-Resolution by Predicting Offsets: An Ultra-Efficient Super-Resolution Network for Rasterized Images	Oct 9, 2022	QuantizationSuper-Resolution	—Unverified
Supervised Deep Hashing for High-dimensional and Heterogeneous Case-based Reasoning	Jun 29, 2022	Deep HashingIncremental Learning	—Unverified
Supervised Learning in the Presence of Concept Drift: A modelling framework	May 21, 2020	Quantization	—Unverified
Supervised Matrix Factorization for Cross-Modality Hashing	Apr 16, 2016	QuantizationRetrieval	—Unverified
Supervised Quantization for Similarity Search	Feb 2, 2019	feature selectionGeneral Classification	—Unverified
Support Recovery in Universal One-bit Compressed Sensing	Jul 19, 2021	compressed sensingQuantization	—Unverified
Survey of Quantization Techniques for On-Device Vision-based Crack Detection	Feb 4, 2025	QuantizationStructural Health Monitoring	—Unverified
Sustainable LLM Inference for Edge AI: Evaluating Quantized LLMs for Energy Efficiency, Output Accuracy, and Inference Latency	Apr 4, 2025	BenchmarkingGSM8K	—Unverified
SUT System Description for Anti-Spoofing 2017 Challenge	Nov 1, 2017	QuantizationSpeaker Verification	—Unverified
SVDq: 1.25-bit and 410x Key Cache Compression for LLM Attention	Feb 21, 2025	Quantization	—Unverified
SVGformer: Representation Learning for Continuous Vector Graphics Using Transformers	Jan 1, 2023	QuantizationRepresentation Learning	—Unverified
SWIS -- Shared Weight bIt Sparsity for Efficient Neural Network Acceleration	Mar 1, 2021	Efficient Neural NetworkQuantization	—Unverified

Show:10 25 50

← PrevPage 59 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified