Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1951–2000 of 4925 papers

Title	Date	Tasks	Status	Hype
Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models	Sep 27, 2023	HumanEvalLanguage Modeling	CodeCode Available	0
Quantum Block-Matching Algorithm using Dissimilarity Measure	Sep 27, 2023	ClusteringImage Clustering	—Unverified	0
Highly Efficient SNNs for High-speed Object Detection	Sep 27, 2023	GPUObject	—Unverified	0
Low Latency of object detection for spikng neural network	Sep 27, 2023	Objectobject-detection	—Unverified	0
SHACIRA: Scalable HAsh-grid Compression for Implicit Neural Representations	Sep 27, 2023	Quantization	—Unverified	0
QA-LoRA: Quantization-Aware Low-Rank Adaptation of Large Language Models	Sep 26, 2023	Quantization	CodeCode Available	5
Constrained Deep Reinforcement Learning for Fronthaul Compression Optimization	Sep 26, 2023	Deep Reinforcement LearningQuantization	—Unverified	0
Efficient Post-training Quantization with FP8 Formats	Sep 26, 2023	image-classificationImage Classification	CodeCode Available	4
On the Impact of Quantization and Pruning of Self-Supervised Speech Models for Downstream Speech Recognition Tasks "In-the-Wild''	Sep 25, 2023	Data AugmentationModel Compression	—Unverified	0
AsymFormer: Asymmetrical Cross-Modal Representation Learning for Mobile Platform Real-Time RGB-D Semantic Segmentation	Sep 25, 2023	Computational EfficiencyFeature Correlation	CodeCode Available	1
IBVC: Interpolation-driven B-frame Video Compression	Sep 25, 2023	DecoderMotion Compensation	CodeCode Available	0
LORD: Low Rank Decomposition Of Monolingual Code LLMs For One-Shot Compression	Sep 25, 2023	Code GenerationHumanEval	—Unverified	0
Data Upcycling Knowledge Distillation for Image Super-Resolution	Sep 25, 2023	Image Super-ResolutionKnowledge Distillation	CodeCode Available	0
On Calibration of Modern Quantized Efficient Neural Networks	Sep 25, 2023	Quantization	—Unverified	0
GHN-QAT: Training Graph Hypernetworks to Predict Quantization-Robust Parameters of Unseen Limited Precision Neural Networks	Sep 24, 2023	Quantization	—Unverified	0
Causal-DFQ: Causality Guided Data-free Network Quantization	Sep 24, 2023	Data Free QuantizationNeural Network Compression	CodeCode Available	0
Probabilistic Weight Fixing: Large-scale training of neural network weight uncertainties for quantization	Sep 24, 2023	PositionQuantization	CodeCode Available	0
Model-enhanced Vector Index	Sep 23, 2023	modelNatural Questions	CodeCode Available	1
From Text to Source: Results in Detecting Large Language Model-Generated Content	Sep 23, 2023	AttributeLanguage Modeling	—Unverified	0
Poster: Self-Supervised Quantization-Aware Knowledge Distillation	Sep 22, 2023	Knowledge DistillationQuantization	—Unverified	0
Activation Compression of Graph Neural Networks using Block-wise Quantization with Improved Variance Minimization	Sep 21, 2023	GPUQuantization	CodeCode Available	0
Benchmarking quantized LLaMa-based models on the Brazilian Secondary School Exam	Sep 21, 2023	BenchmarkingComputational Efficiency	—Unverified	0
BELT:Bootstrapping Electroencephalography-to-Language Decoding and Zero-Shot Sentiment Classification by Natural Language Supervision	Sep 21, 2023	Brain DecodingContrastive Learning	—Unverified	0
Autoregressive Sign Language Production: A Gloss-Free Approach with Discrete Representations	Sep 21, 2023	QuantizationSign Language Production	—Unverified	0
EPTQ: Enhanced Post-Training Quantization via Hessian-guided Network-wise Optimization	Sep 20, 2023	Knowledge Distillationobject-detection	CodeCode Available	2
CPLLM: Clinical Prediction with Large Language Models	Sep 20, 2023	Disease PredictionLanguage Modeling	CodeCode Available	1
SPFQ: A Stochastic Algorithm and Its Error Analysis for Neural Network Quantization	Sep 20, 2023	Quantization	—Unverified	0
Towards Real-Time Neural Video Codec for Cross-Platform Application Using Calibration Information	Sep 20, 2023	GPUQuantization	—Unverified	0
Discrete Audio Representation as an Alternative to Mel-Spectrograms for Speaker and Speech Recognition	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified	0
Deep Learning based Fast and Accurate Beamforming for Millimeter-Wave Systems	Sep 19, 2023	Quantization	—Unverified	0
Semantic Text Compression for Classification	Sep 19, 2023	ClassificationDecoder	—Unverified	0
DeepliteRT: Computer Vision at the Edge	Sep 19, 2023	Quantization	—Unverified	0
RIS-Assisted Energy Harvesting Gains for Bistatic Backscatter Networks: Performance Analysis and RIS Phase Optimization	Sep 18, 2023	QuantizationTAG	—Unverified	0
TransMUSIC: A Transformer-Aided Subspace Method for DOA Estimation with Low-Resolution ADCs	Sep 15, 2023	Quantization	CodeCode Available	1
Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-training and Multi-modal Tokens	Sep 15, 2023	Image ComprehensionLanguage Modeling	—Unverified	0
A Precision-Scalable RISC-V DNN Processor with On-Device Learning Capability at the Extreme Edge	Sep 15, 2023	Quantization	—Unverified	0
Communication Efficient Private Federated Learning Using Dithering	Sep 14, 2023	Federated LearningQuantization	CodeCode Available	0
Differentiable JPEG: The Devil is in the Details	Sep 13, 2023	Adversarial AttackQuantization	CodeCode Available	1
Comparing Iterative and Least-Squares Based Phase Noise Tracking in Receivers with 1-bit Quantization and Oversampling	Sep 12, 2023	Quantization	—Unverified	0
RawHash2: Mapping Raw Nanopore Signals Using Hash-Based Seeding and Adaptive Quantization	Sep 11, 2023	Quantization	CodeCode Available	1
Quantized Fourier and Polynomial Features for more Expressive Tensor Network Models	Sep 11, 2023	Quantization	CodeCode Available	0
Understanding the Impact of Post-Training Quantization on Large Language Models	Sep 11, 2023	Quantization	—Unverified	0
Optimize Weight Rounding via Signed Gradient Descent for the Quantization of LLMs	Sep 11, 2023	Quantization	CodeCode Available	4
One-Bit-Aided Modulo Sampling for DOA Estimation	Sep 10, 2023	DecoderQuantization	—Unverified	0
Leveraging Pretrained Image-text Models for Improving Audio-Visual Learning	Sep 8, 2023	audio-visual learningQuantization	—Unverified	0
Distributed Optimization via Gradient Descent with Event-Triggered Zooming over Quantized Communication	Sep 8, 2023	Distributed OptimizationQuantization	—Unverified	0
Soft Quantization using Entropic Regularization	Sep 8, 2023	Quantization	CodeCode Available	0
Channel Estimation for Quantized Systems based on Conditionally Gaussian Latent Models	Sep 7, 2023	Quantization	CodeCode Available	1
HDR Imaging With One-Bit Quantization	Sep 7, 2023	Quantization	—Unverified	0
Training Acceleration of Low-Rank Decomposed Networks using Sequential Freezing and Rank Quantization	Sep 7, 2023	Model CompressionQuantization	—Unverified	0

Show:10 25 50

← PrevPage 40 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified