Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2350 of 4925 papers

Title	Date	Tasks	Status
Adaptive Resource Allocation for Semantic Communication Networks	Dec 2, 2023	Deep Reinforcement LearningQuantization	—Unverified
Physics Inspired Criterion for Pruning-Quantization Joint Learning	Dec 1, 2023	image-classificationImage Classification	CodeCode Available
The Cost of Compression: Investigating the Impact of Compression on Parametric Knowledge in Language Models	Dec 1, 2023	DecoderQuantization	CodeCode Available
A New Old Idea: Beam-Steering Reflectarrays for Efficient Sub-THz Multiuser MIMO	Nov 30, 2023	3D geometryQuantization	—Unverified
Routing-Guided Learned Product Quantization for Graph-Based Approximate Nearest Neighbor Search	Nov 30, 2023	Quantization	CodeCode Available
Improving the Robustness of Quantized Deep Neural Networks to White-Box Attacks using Stochastic Quantization and Information-Theoretic Ensemble Training	Nov 30, 2023	DiversityInformation Plane	—Unverified
Mixed-Precision Quantization for Federated Learning on Resource-Constrained Heterogeneous Devices	Nov 29, 2023	BenchmarkingFederated Learning	—Unverified
Fault-Tolerant Four-Dimensional Constellation for Coherent Optical Transmission Systems	Nov 29, 2023	Quantization	—Unverified
Fast and Efficient 2-bit LLM Inference on GPU: 2/4/16-bit in a Weight Matrix with Asynchronous Dequantization	Nov 28, 2023	GPUQuantization	—Unverified
Relationship between Model Compression and Adversarial Robustness: A Review of Current Evidence	Nov 27, 2023	Adversarial RobustnessModel Compression	—Unverified
PIPE : Parallelized Inference Through Post-Training Quantization Ensembling of Residual Expansions	Nov 27, 2023	Quantization	—Unverified
CUCL: Codebook for Unsupervised Continual Learning	Nov 25, 2023	Continual LearningDiversity	CodeCode Available
SNN Architecture for Differential Time Encoding Using Decoupled Processing Time	Nov 24, 2023	Quantization	—Unverified
SySMOL: Co-designing Algorithms and Hardware for Neural Networks with Heterogeneous Precisions	Nov 23, 2023	CPUGPU	—Unverified
A Blockchain Solution for Collaborative Machine Learning over IoT	Nov 23, 2023	Federated LearningIncremental Learning	—Unverified
Uncertainty Estimation in Multi-Agent Distributed Learning	Nov 22, 2023	Edge-computingQuantization	—Unverified
Modulation For Modulo: A Sampling-Efficient High-Dynamic Range ADC	Nov 22, 2023	Quantization	—Unverified
Shedding the Bits: Pushing the Boundaries of Quantization with Minifloats on FPGAs	Nov 21, 2023	Model CompressionQuantization	—Unverified
Eliminating Quantization Errors in Classification-Based Sound Source Localization	Nov 21, 2023	ClassificationQuantization	CodeCode Available
Deep Learning-Based Real-Time Quality Control of Standard Video Compression for Live Streaming	Nov 21, 2023	QuantizationVideo Compression	—Unverified
McQueen : Mixed Precision Quantization of Early Exit Networks	Nov 20, 2023	Quantization	CodeCode Available
Efficient Neural Networks for Tiny Machine Learning: A Comprehensive Review	Nov 20, 2023	Model CompressionQuantization	—Unverified
Tiny-VBF: Resource-Efficient Vision Transformer based Lightweight Beamformer for Ultrasound Single-Angle Plane Wave Imaging	Nov 20, 2023	Deep LearningQuantization	—Unverified
Low-Precision Floating-Point for Efficient On-Board Deep Neural Network Processing	Nov 18, 2023	Earth ObservationQuantization	—Unverified
Compressed 3D Gaussian Splatting for Accelerated Novel View Synthesis	Nov 17, 2023	GPUNovel View Synthesis	CodeCode Available
Is Conventional SNN Really Efficient? A Perspective from Network Quantization	Nov 17, 2023	FairnessQuantization	—Unverified
A Speed Odyssey for Deployable Quantization of LLMs	Nov 16, 2023	Language ModelingLanguage Modelling	—Unverified
I&S-ViT: An Inclusive & Stable Method for Pushing the Limit of Post-Training ViTs Quantization	Nov 16, 2023	Quantization	CodeCode Available
On the Impact of Calibration Data in Post-training Quantization and Pruning	Nov 16, 2023	Model CompressionQuantization	—Unverified
A Diffusion Model Based Quality Enhancement Method for HEVC Compressed Video	Nov 15, 2023	DecoderQuantization	—Unverified
Data Augmentations in Deep Weight Spaces	Nov 15, 2023	Data AugmentationNetwork Pruning	—Unverified
MetaMix: Meta-state Precision Searcher for Mixed-precision Activation Quantization	Nov 12, 2023	Quantization	—Unverified
A Different View of Sigma-Delta Modulators Under the Lens of Pulse Frequency Modulation	Nov 12, 2023	Quantization	—Unverified
EPIM: Efficient Processing-In-Memory Accelerators based on Epitome	Nov 12, 2023	Model CompressionNeural Architecture Search	—Unverified
Post-training Quantization for Text-to-Image Diffusion Models with Progressive Calibration and Activation Relaxing	Nov 10, 2023	Quantization	CodeCode Available
BICM-compatible Rate Adaptive Geometric Constellation Shaping Using Optimized Many-to-one Labeling	Nov 10, 2023	Quantization	—Unverified
In-Context Learning for MIMO Equalization Using Transformer-Based Sequence Models	Nov 10, 2023	In-Context LearningMeta-Learning	CodeCode Available
Automated Heterogeneous Low-Bit Quantization of Multi-Model Deep Learning Inference Pipeline	Nov 10, 2023	Ensemble LearningMulti-Task Learning	—Unverified
Compressed and Sparse Models for Non-Convex Decentralized Learning	Nov 9, 2023	Quantization	—Unverified
Enhancing Computation Efficiency in Large Language Models through Weight and Activation Quantization	Nov 9, 2023	Computational EfficiencyQuantization	—Unverified
Reducing the Side-Effects of Oscillations in Training of Quantized YOLO Networks	Nov 9, 2023	object-detectionObject Detection	—Unverified
RepQ: Generalizing Quantization-Aware Training for Re-Parametrized Architectures	Nov 9, 2023	Quantization	—Unverified
Learning-Based Latency-Constrained Fronthaul Compression Optimization in C-RAN	Nov 7, 2023	Deep Reinforcement LearningQuantization	—Unverified
Dissecting the Runtime Performance of the Training, Fine-tuning, and Inference of Large Language Models	Nov 7, 2023	GPUQuantization	—Unverified
Deep Hashing via Householder Quantization	Nov 7, 2023	BinarizationDeep Hashing	CodeCode Available
Generative Diffusion Models for Lattice Field Theory	Nov 6, 2023	Quantization	—Unverified
Learned layered coding for Successive Refinement in the Wyner-Ziv Problem	Nov 6, 2023	Quantization	—Unverified
Attention or Convolution: Transformer Encoders in Audio Language Models for Inference Efficiency	Nov 5, 2023	Quantization	—Unverified
Effective Quantization for Diffusion Models on CPUs	Nov 2, 2023	Quantization	—Unverified
Divergent Token Metrics: Measuring degradation to prune away LLM components -- and optimize quantization	Nov 2, 2023	ManagementModel Compression	—Unverified

Show:10 25 50

← PrevPage 47 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified