Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2200 of 4925 papers

Title	Date	Tasks	Status
Variable-Rate Learned Image Compression with Multi-Objective Optimization and Quantization-Reconstruction Offsets	Feb 29, 2024	Image CompressionQuantization	—Unverified
T3DNet: Compressing Point Cloud Models for Lightweight 3D Recognition	Feb 29, 2024	Autonomous DrivingQuantization	—Unverified
FlattenQuant: Breaking Through the Inference Compute-bound for Large Language Models with Per-tensor Quantization	Feb 28, 2024	GPUQuantization	—Unverified
No Token Left Behind: Reliable KV Cache Compression via Importance-Aware Mixed Precision Quantization	Feb 28, 2024	Quantization	—Unverified
Ef-QuantFace: Streamlined Face Recognition with Small Data and Low-Bit Precision	Feb 28, 2024	Face RecognitionQuantization	—Unverified
Inpainting Computational Fluid Dynamics with Deep Learning	Feb 27, 2024	Deep LearningQuantization	—Unverified
Neural Video Compression with Feature Modulation	Feb 27, 2024	BlockingQuantization	—Unverified
Rethinking Mutual Information for Language Conditioned Skill Discovery on Imitation Learning	Feb 27, 2024	Imitation LearningQuantization	—Unverified
Adaptive quantization with mixed-precision based on low-cost proxy	Feb 27, 2024	Neural Architecture SearchQuantization	—Unverified
SPC-NeRF: Spatial Predictive Compression for Voxel Based Radiance Field	Feb 26, 2024	Image CompressionNeRF	—Unverified
Distortion-Controlled Dithering with Reduced Recompression Rate	Feb 26, 2024	Data CompressionImage Compression	—Unverified
A Comprehensive Evaluation of Quantization Strategies for Large Language Models	Feb 26, 2024	Language ModelingLanguage Modelling	CodeCode Available
Data-freeWeight Compress and Denoise for Large Language Models	Feb 26, 2024	GPUQuantization	—Unverified
EncodingNet: A Novel Encoding-based MAC Design for Efficient Neural Network Acceleration	Feb 25, 2024	Efficient Neural Networkimage-classification	CodeCode Available
Towards Accurate Post-training Quantization for Reparameterized Models	Feb 25, 2024	Quantization	CodeCode Available
GPTVQ: The Blessing of Dimensionality for LLM Quantization	Feb 23, 2024	CPUQuantization	—Unverified
Text me the data: Generating Ground Pressure Sequence from Textual Descriptions for HAR	Feb 22, 2024	Activity RecognitionHuman Activity Recognition	—Unverified
On the Arrow of Inference	Feb 22, 2024	counterfactualCounterfactual Reasoning	—Unverified
FinGPT-HPC: Efficient Pretraining and Finetuning Large Language Models for Financial Applications with High-Performance Computing	Feb 21, 2024	GPUModel Compression	—Unverified
APTQ: Attention-aware Post-Training Mixed-Precision Quantization for Large Language Models	Feb 21, 2024	Quantization	—Unverified
In-Distribution Consistency Regularization Improves the Generalization of Quantization-Aware Training	Feb 21, 2024	Knowledge DistillationQuantization	—Unverified
Tiny Reinforcement Learning for Quadruped Locomotion using Decision Transformers	Feb 20, 2024	Imitation LearningQuantization	CodeCode Available
Towards a tailored mixed-precision sub-8-bit quantization scheme for Gated Recurrent Units using Genetic Algorithms	Feb 19, 2024	Model CompressionQuantization	—Unverified
Is It a Free Lunch for Removing Outliers during Pretraining?	Feb 19, 2024	Quantization	—Unverified
WKVQuant: Quantizing Weight and Key/Value Cache for Large Language Models Gains More	Feb 19, 2024	QuantizationText Generation	—Unverified
DB-LLM: Accurate Dual-Binarization for Efficient LLMs	Feb 19, 2024	BinarizationComputational Efficiency	—Unverified
QDyLoRA: Quantized Dynamic Low-Rank Adaptation for Efficient Large Language Model Tuning	Feb 16, 2024	GPULanguage Modeling	—Unverified
One-Bit Quantization and Sparsification for Multiclass Linear Classification with Strong Regularization	Feb 16, 2024	ClassificationQuantization	—Unverified
Quantized Embedding Vectors for Controllable Diffusion Language Models	Feb 15, 2024	Language ModelingLanguage Modelling	—Unverified
Model Compression and Efficient Inference for Large Language Models: A Survey	Feb 15, 2024	Knowledge DistillationModel Compression	—Unverified
Multi-Excitation Projective Simulation with a Many-Body Physics Inspired Inductive Bias	Feb 15, 2024	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	CodeCode Available
Lightweight Deep Learning Based Channel Estimation for Extremely Large-Scale Massive MIMO Systems	Feb 14, 2024	Quantization	CodeCode Available
Towards Next-Level Post-Training Quantization of Hyper-Scale Transformers	Feb 14, 2024	Quantization	—Unverified
Rate-Splitting Multiple Access for Quantized ISAC LEO Satellite Systems: A Max-Min Fair Energy-Efficient Beam Design	Feb 14, 2024	FairnessISAC	—Unverified
BdSLW60: A Word-Level Bangla Sign Language Dataset	Feb 13, 2024	BenchmarkingGesture Recognition	CodeCode Available
TeMPO: Efficient Time-Multiplexed Dynamic Photonic Tensor Core for Edge AI with Compact Slow-Light Electro-Optic Modulator	Feb 12, 2024	Quantization	—Unverified
Outlier-Aware Training for Low-Bit Quantization of Structural Re-Parameterized Networks	Feb 11, 2024	Quantization	—Unverified
LiRank: Industrial Large Scale Ranking Models at LinkedIn	Feb 10, 2024	Click-Through Rate PredictionQuantization	—Unverified
On Leaky-Integrate-and Fire as Spike-Train-Quantization Operator on Dirac-Superimposed Continuous-Time Signals	Feb 10, 2024	Quantization	—Unverified
RQP-SGD: Differential Private Machine Learning through Noisy SGD and Randomized Quantization	Feb 9, 2024	Privacy PreservingQuantization	—Unverified
Sparse-VQ Transformer: An FFN-Free Framework with Vector Quantization for Enhanced Time Series Forecasting	Feb 8, 2024	Computational EfficiencyMultivariate Time Series Forecasting	—Unverified
RepQuant: Towards Accurate Post-Training Quantization of Large Transformer Models via Scale Reparameterization	Feb 8, 2024	Quantization	—Unverified
L4Q: Parameter Efficient Quantization-Aware Fine-Tuning on Large Language Models	Feb 7, 2024	Few-Shot LearningIn-Context Learning	—Unverified
Majority Kernels: An Approach to Leverage Big Model Dynamics for Efficient Small Model Training	Feb 7, 2024	Combinatorial OptimizationComputational Efficiency	—Unverified
Fed-CVLC: Compressing Federated Learning Communications with Variable-Length Codes	Feb 6, 2024	Federated LearningModel Compression	—Unverified
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap	Feb 6, 2024	Domain GeneralizationQuantization	CodeCode Available
A Survey on Transformer Compression	Feb 5, 2024	Knowledge DistillationMamba	—Unverified
Optimal and Near-Optimal Adaptive Vector Quantization	Feb 5, 2024	Quantization	—Unverified
Quantized Approximately Orthogonal Recurrent Neural Networks	Feb 5, 2024	QuantizationTime Series	—Unverified
FoldToken: Learning Protein Language via Vector Quantization and Beyond	Feb 4, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 44 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified