Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 926–950 of 4925 papers

Title	Date	Tasks	Status	Hype
Integrated Encoding and Quantization to Enhance Quanvolutional Neural Networks	Oct 8, 2024	QuantizationQuantum Machine Learning	CodeCode Available	0
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search	Oct 7, 2024	Fire DetectionNeural Architecture Search	—Unverified	0
Variable Resolution Pixel Quantization for Low Power Machine Vision Application on Edge	Oct 7, 2024	Edge-computingimage-classification	—Unverified	0
PrefixQuant: Eliminating Outliers by Prefixed Tokens for Large Language Models Quantization	Oct 7, 2024	Common Sense ReasoningQuantization	CodeCode Available	2
Continuous Approximations for Improving Quantization Aware Training of LLMs	Oct 6, 2024	MMLUModel Compression	—Unverified	0
HALL-E: Hierarchical Neural Codec Language Model for Minute-Long Zero-Shot Text-to-Speech Synthesis	Oct 6, 2024	Language ModelingLanguage Modelling	—Unverified	0
PalmBench: A Comprehensive Benchmark of Compressed Large Language Models on Mobile Platforms	Oct 5, 2024	BenchmarkingGPU	—Unverified	0
MIMO Detection with Spatial Sigma-Delta ADCs: A Variational Bayesian Approach	Oct 4, 2024	Quantization	—Unverified	0
Resource-aware Mixed-precision Quantization for Enhancing Deployability of Transformers for Time-series Forecasting on Embedded FPGAs	Oct 4, 2024	Neural Architecture SearchQuantization	—Unverified	0
Generative Semantic Communication for Text-to-Speech Synthesis	Oct 4, 2024	QuantizationSemantic Communication	—Unverified	0
ARB-LLM: Alternating Refined Binarizations for Large Language Models	Oct 4, 2024	BinarizationQuantization	CodeCode Available	1
Mitigating Adversarial Perturbations for Deep Reinforcement Learning via Vector Quantization	Oct 4, 2024	Deep Reinforcement LearningQuantization	CodeCode Available	1
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available	0
Lightweight Diffusion Models for Resource-Constrained Semantic Communication	Oct 3, 2024	QuantizationSemantic Communication	CodeCode Available	1
Overcoming Representation Bias in Fairness-Aware data Repair using Optimal Transport	Oct 3, 2024	AttributeFairness	—Unverified	0
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration	Oct 3, 2024	Image GenerationQuantization	CodeCode Available	7
SEAL: SEmantic-Augmented Imitation Learning via Language Model	Oct 3, 2024	Decision MakingImitation Learning	—Unverified	0
Remember and Recall: Associative-Memory-based Trajectory Prediction	Oct 3, 2024	Autonomous DrivingComputational Efficiency	—Unverified	0
A Spark of Vision-Language Intelligence: 2-Dimensional Autoregressive Transformer for Efficient Finegrained Image Generation	Oct 2, 2024	Image GenerationQuantization	CodeCode Available	2
Restorative Speech Enhancement: A Progressive Approach Using SE and Codec Modules	Oct 2, 2024	QuantizationSpeech Enhancement	—Unverified	0
Locret: Enhancing Eviction in Long-Context LLM Inference with Trained Retaining Heads on Consumer-Grade Devices	Oct 2, 2024	GPULanguage Modeling	CodeCode Available	1
ImageFolder: Autoregressive Image Generation with Folded Tokens	Oct 2, 2024	Image GenerationImage Reconstruction	CodeCode Available	3
Getting Free Bits Back from Rotational Symmetries in LLMs	Oct 2, 2024	Quantization	—Unverified	0
Compressing Recurrent Neural Networks for FPGA-accelerated Implementation in Fluorescence Lifetime Imaging	Oct 1, 2024	Computational EfficiencyKnowledge Distillation	—Unverified	0
Deep activity propagation via weight initialization in spiking neural networks	Oct 1, 2024	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 38 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified