Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4476–4500 of 4925 papers

Title	Date	Tasks	Status
Deep reverse tone mapping	Nov 20, 2017	inverse tone mappingQuantization	CodeCode Available
Autoregressive Co-Training for Learning Discrete Speech Representations	Mar 29, 2022	Quantization	CodeCode Available
Quantized Prompt for Efficient Generalization of Vision-Language Models	Jul 15, 2024	General KnowledgeLanguage Modelling	CodeCode Available
A Binary Variational Autoencoder for Hashing	Oct 22, 2019	QuantizationRetrieval	CodeCode Available
An Information-Theoretic Analysis of Self-supervised Discrete Representations of Speech	Jun 4, 2023	QuantizationRepresentation Learning	CodeCode Available
Semi-supervised 3D Object Detection with PatchTeacher and PillarMix	Jul 13, 2024	3D Object DetectionData Augmentation	CodeCode Available
Adaptive Computation Modules: Granular Conditional Computation For Efficient Inference	Dec 15, 2023	Quantizationspeech-recognition	CodeCode Available
Light Multi-segment Activation for Model Compression	Jul 16, 2019	Knowledge Distillationmodel	CodeCode Available
QuaRL: Quantization for Fast and Environmentally Sustainable Reinforcement Learning	Oct 2, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Communication-Efficient Federated Learning via Predictive Coding	Aug 2, 2021	Data CompressionFederated Learning	CodeCode Available
Algorithm and VLSI Design for 1-bit Data Detection in Massive MIMO-OFDM	Sep 4, 2020	Quantization	CodeCode Available
LiFT: Lightweight, FPGA-tailored 3D object detection based on LiDAR data	Jan 19, 2025	3D Object Detectionobject-detection	CodeCode Available
LFZip: Lossy compression of multivariate floating-point time series data via improved prediction	Nov 1, 2019	Data CompressionQuantization	CodeCode Available
Expansion Quantization Network: An Efficient Micro-emotion Annotation and Detection Framework	Nov 9, 2024	Emotion Detection and ClassificationQuantization	CodeCode Available
Communication-Efficient Federated Linear and Deep Generalized Canonical Correlation Analysis	Sep 25, 2021	Distributed ComputingDistributed Optimization	CodeCode Available
ExpandNet: A Deep Convolutional Neural Network for High Dynamic Range Expansion from Low Dynamic Range Content	Mar 6, 2018	inverse tone mappingInverse-Tone-Mapping	CodeCode Available
SYQ: Learning Symmetric Quantization For Efficient Deep Neural Networks	Jul 1, 2018	Quantization	CodeCode Available
One-Shot Sensitivity-Aware Mixed Sparsity Pruning for Large Language Models	Oct 14, 2023	QuantizationSensitivity	CodeCode Available
One-Step Forward and Backtrack: Overcoming Zig-Zagging in Loss-Aware Quantization Training	Jan 30, 2024	Quantization	CodeCode Available
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available
Leveraging Continuously Differentiable Activation Functions for Learning in Quantized Noisy Environments	Feb 4, 2024	Quantization	CodeCode Available
Accelerating and Compressing Deep Neural Networks for Massive MIMO CSI Feedback	Jan 20, 2023	Model CompressionNetwork Pruning	CodeCode Available
An exploration of the effect of quantisation on energy consumption and inference time of StarCoder2	Nov 15, 2024	Model CompressionQuantization	CodeCode Available
Towards Highly Accurate and Stable Face Alignment for High-Resolution Videos	Nov 1, 2018	Face AlignmentPose Estimation	CodeCode Available
Vision-Language and Large Language Model Performance in Gastroenterology: GPT, Claude, Llama, Phi, Mistral, Gemma, and Quantized Models	Aug 25, 2024	Language ModelingLanguage Modelling	CodeCode Available

Show:10 25 50

← PrevPage 180 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified