Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 4925 papers

Title	Date	Tasks	Status
BitNet b1.58 Reloaded: State-of-the-art Performance Also on Smaller Networks	Jun 24, 2024	Quantization	—Unverified
Received Power Maximization Using Nonuniform Discrete Phase Shifts for RISs With a Limited Phase Range	Jun 23, 2024	2kQuantization	—Unverified
Towards Real-Time Neural Volumetric Rendering on Mobile Devices: A Measurement Study	Jun 23, 2024	NeRFQuantization	—Unverified
HLQ: Fast and Efficient Backpropagation via Hadamard Low-rank Quantization	Jun 21, 2024	Quantization	—Unverified
Predicting Probabilities of Error to Combine Quantization and Early Exiting: QuEE	Jun 20, 2024	Quantization	—Unverified
FLoCoRA: Federated learning compression with low-rank adaptation	Jun 20, 2024	Federated LearningModel Compression	CodeCode Available
xCOMET-lite: Bridging the Gap Between Efficiency and Quality in Learned MT Evaluation Metrics	Jun 20, 2024	Machine TranslationQuantization	CodeCode Available
SDQ: Sparse Decomposed Quantization for LLM Inference	Jun 19, 2024	Model CompressionQuantization	—Unverified
Q-SNNs: Quantized Spiking Neural Networks	Jun 19, 2024	Quantization	—Unverified
High-Fidelity Facial Albedo Estimation via Texture Quantization	Jun 19, 2024	3D Face ReconstructionFace Reconstruction	—Unverified
Attention-aware Post-training Quantization without Backpropagation	Jun 19, 2024	Quantization	—Unverified
MSE Minimization in RIS-Aided MU-MIMO with Discrete Phase Shifts and Fronthaul Quantization	Jun 18, 2024	Quantization	—Unverified
Bayesian-LoRA: LoRA based Parameter Efficient Fine-Tuning using Optimal Quantization levels and Rank Values trough Differentiable Bayesian Gates	Jun 18, 2024	parameter-efficient fine-tuningQuantization	—Unverified
Prefixing Attention Sinks can Mitigate Activation Outliers for Large Language Model Quantization	Jun 17, 2024	Language ModelingLanguage Modelling	—Unverified
Deep-Learning-Based Channel Estimation for Distributed MIMO with 1-bit Radio-Over-Fiber Fronthaul	Jun 17, 2024	Quantization	—Unverified
Promoting Data and Model Privacy in Federated Learning through Quantized LoRA	Jun 16, 2024	Federated Learningparameter-efficient fine-tuning	—Unverified
Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization	Jun 16, 2024	QuantizationTensor Decomposition	—Unverified
An Analysis on Quantizing Diffusion Transformers	Jun 16, 2024	Conditional Image GenerationDenoising	—Unverified
Optimization of Armv9 architecture general large language model inference performance based on Llama.cpp	Jun 16, 2024	Compiler OptimizationLanguage Modeling	CodeCode Available
How Should We Extract Discrete Audio Tokens from Self-Supervised Models?	Jun 15, 2024	QuantizationSelf-Supervised Learning	—Unverified
Memory Faults in Activation-sparse Quantized Deep Neural Networks: Analysis and Mitigation using Sharpness-aware Training	Jun 15, 2024	Quantization	—Unverified
GEB-1.3B: Open Lightweight Large Language Model	Jun 14, 2024	CPULanguage Modeling	—Unverified
Optimizing Byte-level Representation for End-to-end ASR	Jun 14, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
One-pass Multiple Conformer and Foundation Speech Systems Compression and Quantization Using An All-in-one Neural Model	Jun 14, 2024	AllQuantization	—Unverified
Precipitation Nowcasting Using Physics Informed Discriminator Generative Models	Jun 14, 2024	Generative Adversarial NetworkQuantization	—Unverified
Human-level molecular optimization driven by mol-gene evolution	Jun 13, 2024	Drug DiscoveryQuantization	—Unverified
MGRQ: Post-Training Quantization For Vision Transformer With Mixed Granularity Reconstruction	Jun 13, 2024	Quantization	—Unverified
ToneUnit: A Speech Discretization Approach for Tonal Language Speech Synthesis	Jun 13, 2024	QuantizationSpeech Synthesis	—Unverified
ME-Switch: A Memory-Efficient Expert Switching Framework for Large Language Models	Jun 13, 2024	Code Generationdomain classification	—Unverified
Q-S5: Towards Quantized State Space Models	Jun 13, 2024	Computational EfficiencyQuantization	CodeCode Available
Asymptotic Unbiased Sample Sampling to Speed Up Sharpness-Aware Minimization	Jun 12, 2024	Computational EfficiencyPose Estimation	—Unverified
Compressive Beam Alignment for Indoor Millimeter-Wave Systems	Jun 12, 2024	compressed sensingQuantization	—Unverified
MobileAIBench: Benchmarking LLMs and LMMs for On-Device Use Cases	Jun 12, 2024	BenchmarkingModel Compression	—Unverified
VALL-E R: Robust and Efficient Zero-Shot Text-to-Speech Synthesis via Monotonic Alignment	Jun 12, 2024	QuantizationSpeech Synthesis	—Unverified
FoldToken2: Learning compact, invariant and generative protein structure language	Jun 11, 2024	DecoderQuantization	—Unverified
T2S-GPT: Dynamic Vector Quantization for Autoregressive Sign Language Production from Text	Jun 11, 2024	QuantizationSign Language Production	—Unverified
TernaryLLM: Ternarized Large Language Model	Jun 11, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Topological Analysis for Detecting Anomalies (TADA) in Time Series	Jun 10, 2024	QuantizationTime Series	—Unverified
Efficient Neural Compression with Inference-time Decoding	Jun 10, 2024	DecoderQuantization	—Unverified
Latent Representation Matters: Human-like Sketches in One-shot Drawing Tasks	Jun 10, 2024	Quantization	—Unverified
The Impact of Quantization on Retrieval-Augmented Generation: An Analysis of Small LLMs	Jun 10, 2024	QuantizationRAG	—Unverified
Towards Lightweight Speaker Verification via Adaptive Neural Network Quantization	Jun 8, 2024	QuantizationSpeaker Verification	—Unverified
Spectral Codecs: Improving Non-Autoregressive Speech Synthesis with Spectrogram-Based Audio Codecs	Jun 7, 2024	QuantizationSpeech Synthesis	—Unverified
Activation Map-based Vector Quantization for 360-degree Image Semantic Communication	Jun 7, 2024	QuantizationSemantic Communication	—Unverified
Winner-takes-all learners are geometry-aware conditional density estimators	Jun 7, 2024	AllDensity Estimation	CodeCode Available
Proofread: Fixes All Errors with One Tap	Jun 6, 2024	AllQuantization	—Unverified
BitsFusion: 1.99 bits Weight Quantization of Diffusion Model	Jun 6, 2024	Image Generationmodel	—Unverified
Real-Time Spacecraft Pose Estimation Using Mixed-Precision Quantized Neural Network on COTS Reconfigurable MPSoC	Jun 6, 2024	Pose EstimationQuantization	CodeCode Available
VQUNet: Vector Quantization U-Net for Defending Adversarial Atacks by Regularizing Unwanted Noise	Jun 5, 2024	Adversarial AttackQuantization	—Unverified
Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsity	Jun 5, 2024	GPUQuantization	—Unverified

Show:10 25 50

← PrevPage 39 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified