Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 4925 papers

Title	Date	Tasks	Status	Hype
Image Compression using only Attention based Neural Networks	Oct 17, 2023	Image CompressionQuantization	—Unverified	0
Robustness and Approximation of Discrete-time Mean-field Games under Discounted Cost Criterion	Oct 16, 2023	Quantization	—Unverified	0
RoomDesigner: Encoding Anchor-latents for Style-consistent and Shape-compatible Indoor Scene Generation	Oct 16, 2023	QuantizationScene Generation	CodeCode Available	1
One-Shot Sensitivity-Aware Mixed Sparsity Pruning for Large Language Models	Oct 14, 2023	QuantizationSensitivity	CodeCode Available	0
LL-VQ-VAE: Learnable Lattice Vector-Quantization For Efficient Representations	Oct 13, 2023	Quantization	—Unverified	0
QUIK: Towards End-to-End 4-Bit Inference on Generative Large Language Models	Oct 13, 2023	Computational EfficiencyGPU	CodeCode Available	1
Enhancing Text-based Knowledge Graph Completion with Zero-Shot Large Language Models: A Focus on Semantic Enhancement	Oct 12, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
QLLM: Accurate and Efficient Low-Bitwidth Quantization for Large Language Models	Oct 12, 2023	GPUQuantization	CodeCode Available	1
LoftQ: LoRA-Fine-Tuning-Aware Quantization for Large Language Models	Oct 12, 2023	Natural Language UnderstandingQuantization	CodeCode Available	2
A Carbon Tracking Model for Federated Learning: Impact of Quantization and Sparsification	Oct 12, 2023	Federated LearningQuantization	—Unverified	0
Adaptive Quantization for Key Generation in Low-Power Wide-Area Networks	Oct 11, 2023	Quantization	—Unverified	0
Cost-Driven Hardware-Software Co-Optimization of Machine Learning Pipelines	Oct 11, 2023	Quantization	—Unverified	0
QFT: Quantized Full-parameter Tuning of LLMs with Affordable Resources	Oct 11, 2023	GPUparameter-efficient fine-tuning	—Unverified	0
CacheGen: KV Cache Compression and Streaming for Fast Large Language Model Serving	Oct 11, 2023	Language ModelingLanguage Modelling	CodeCode Available	5
Sparse Fine-tuning for Inference Acceleration of Large Language Models	Oct 10, 2023	CPUGPU	CodeCode Available	1
Distillation Improves Visual Place Recognition for Low Quality Images	Oct 10, 2023	Knowledge DistillationQuantization	CodeCode Available	0
Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers	Oct 9, 2023	Image GenerationImage Reconstruction	—Unverified	0
Vector Quantized Multi-modal Guidance for Alzheimer’s Disease Diagnosis Based on Feature Imputation	Oct 8, 2023	ImputationQuantization	CodeCode Available	0
Dual Grained Quantization: Efficient Fine-Grained Quantization for LLM	Oct 7, 2023	Quantization	—Unverified	0
Sub-token ViT Embedding via Stochastic Resonance Transformers	Oct 6, 2023	Depth EstimationDepth Prediction	CodeCode Available	0
VaSAB: The variable size adaptive information bottleneck for disentanglement on speech and singing voice	Oct 5, 2023	DisentanglementQuantization	—Unverified	0
Learning A Disentangling Representation For PU Learning	Oct 5, 2023	ClusteringDensity Estimation	—Unverified	0
EfficientDM: Efficient Quantization-Aware Fine-Tuning of Low-Bit Diffusion Models	Oct 5, 2023	DenoisingImage Generation	CodeCode Available	1
Hadamard Domain Training with Integers for Class Incremental Quantized Learning	Oct 5, 2023	Activity Recognitionclass-incremental learning	—Unverified	0
Robustness-Guided Image Synthesis for Data-Free Quantization	Oct 5, 2023	Data Free QuantizationDiversity	—Unverified	0
QuATON: Quantization Aware Training of Optical Neurons	Oct 4, 2023	Quantization	—Unverified	0
Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own	Oct 4, 2023	Quantizationreinforcement-learning	—Unverified	0
Soft Convex Quantization: Revisiting Vector Quantization with Convex Optimization	Oct 4, 2023	Image ReconstructionQuantization	—Unverified	0
Mixture of Quantized Experts (MoQE): Complementary Effect of Low-bit Quantization and Robustness	Oct 3, 2023	GPUMachine Translation	—Unverified	0
Discrete, compositional, and symbolic representations through attractor dynamics	Oct 3, 2023	Quantization	CodeCode Available	0
Generating 3D Brain Tumor Regions in MRI using Vector-Quantization Generative Adversarial Networks	Oct 2, 2023	Brain Tumor ClassificationBrain Tumor Segmentation	—Unverified	0
Compressing LLMs: The Truth is Rarely Pure and Never Simple	Oct 2, 2023	QuantizationRetrieval	CodeCode Available	1
MobileNVC: Real-time 1080p Neural Video Compression on a Mobile Device	Oct 2, 2023	DecoderGPU	—Unverified	0
DiskANN++: Efficient Page-based Search over Isomorphic Mapped Graph Index using Query-sensitivity Entry Vertex	Sep 30, 2023	QuantizationSensitivity	—Unverified	0
Quantization of Deep Neural Networks to facilitate self-correction of weights on Phase Change Memory-based analog hardware	Sep 30, 2023	Edge-computingQuantization	—Unverified	0
One-Bit Channel Estimation for IRS-aided Millimeter-Wave Massive MU-MISO System	Sep 29, 2023	Quantization	—Unverified	0
Pruning Small Pre-Trained Weights Irreversibly and Monotonically Impairs "Difficult" Downstream Tasks in LLMs	Sep 29, 2023	Quantization	CodeCode Available	1
Revolutionizing Mobile Interaction: Enabling a 3 Billion Parameter GPT LLM on Mobile	Sep 29, 2023	Quantization	—Unverified	0
QDFormer: Towards Robust Audiovisual Segmentation in Complex Environments with Quantization-based Semantic Decomposition	Sep 29, 2023	Quantization	CodeCode Available	1
Revisiting Cephalometric Landmark Detection from the view of Human Pose Estimation with Lightweight Super-Resolution Head	Sep 29, 2023	Pose EstimationQuantization	CodeCode Available	1
On Uniform Scalar Quantization for Learned Image Compression	Sep 29, 2023	Image CompressionQuantization	—Unverified	0
Diffusion Models as Stochastic Quantization in Lattice Field Theory	Sep 29, 2023	Quantization	CodeCode Available	0
RECOMBINER: Robust and Enhanced Compression with Bayesian Implicit Neural Representations	Sep 29, 2023	Data CompressionQuantization	CodeCode Available	1
Network Memory Footprint Compression Through Jointly Learnable Codebooks and Mappings	Sep 29, 2023	Quantization	—Unverified	0
PB-LLM: Partially Binarized Large Language Models	Sep 29, 2023	BinarizationQuantization	CodeCode Available	1
MixQuant: Mixed Precision Quantization with a Bit-width Optimization Search	Sep 29, 2023	Quantization	—Unverified	0
Pushing Large Language Models to the 6G Edge: Vision, Challenges, and Opportunities	Sep 28, 2023	Edge-computingparameter-efficient fine-tuning	—Unverified	0
ModuLoRA: Finetuning 2-Bit LLMs on Consumer GPUs by Integrating with Modular Quantizers	Sep 28, 2023	GPUInstruction Following	CodeCode Available	2
Transformer-VQ: Linear-Time Transformers via Vector Quantization	Sep 28, 2023	8kDecoder	CodeCode Available	2
Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models	Sep 27, 2023	HumanEvalLanguage Modeling	CodeCode Available	0

Show:10 25 50

← PrevPage 39 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified