Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1501–1550 of 4925 papers

Title	Date	Tasks	Status
RILQ: Rank-Insensitive LoRA-based Quantization Error Compensation for Boosting 2-bit Large Language Model Accuracy	Dec 2, 2024	Computational EfficiencyLanguage Modeling	CodeCode Available
Quantization-Aware Imitation-Learning for Resource-Efficient Robotic Control	Dec 2, 2024	Autonomous DrivingDecision Making	—Unverified
Memory-Efficient Training for Deep Speaker Embedding Learning in Speaker Verification	Dec 2, 2024	GPUQuantization	—Unverified
Reducing Inference Energy Consumption Using Dual Complementary CNNs	Dec 2, 2024	Quantization	CodeCode Available
Optimizing Domain-Specific Image Retrieval: A Benchmark of FAISS and Annoy with Fine-Tuned Features	Dec 2, 2024	Image RetrievalQuantization	—Unverified
A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Series	Dec 1, 2024	ImputationQuantization	—Unverified
LAMBDA: Covering the Multimodal Critical Scenarios for Automated Driving Systems by Search Space Quantization	Nov 30, 2024	Quantization	—Unverified
CogACT: A Foundational Vision-Language-Action Model for Synergizing Cognition and Action in Robotic Manipulation	Nov 29, 2024	QuantizationVision-Language-Action	—Unverified
Quantized Delta Weight Is Safety Keeper	Nov 29, 2024	Quantization	—Unverified
Privacy-Preserving Orthogonal Aggregation for Guaranteeing Gender Fairness in Federated Recommendation	Nov 29, 2024	AttributeFairness	—Unverified
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding	Nov 29, 2024	Motion SynthesisQuantization	—Unverified
Orthus: Autoregressive Interleaved Image-Text Generation with Modality-Specific Heads	Nov 28, 2024	GPULanguage Modeling	—Unverified
On the effectiveness of discrete representations in sparse mixture of experts	Nov 28, 2024	Mixture-of-ExpertsQuantization	—Unverified
FAMES: Fast Approximate Multiplier Substitution for Mixed-Precision Quantized DNNs--Down to 2 Bits!	Nov 27, 2024	Quantization	—Unverified
SoftmAP: Software-Hardware Co-design for Integer-Only Softmax on Associative Processors	Nov 26, 2024	QuantizationSensitivity	—Unverified
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection	Nov 26, 2024	Quantization	—Unverified
Rapid Deployment of Domain-specific Hyperspectral Image Processors with Application to Autonomous Driving	Nov 26, 2024	Autonomous DrivingQuantization	—Unverified
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available
Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens	Nov 26, 2024	Quantization	—Unverified
Learning Optimal Lattice Vector Quantizers for End-to-end Neural Image Compression	Nov 25, 2024	Computational EfficiencyImage Compression	—Unverified
Factorized Visual Tokenization and Generation	Nov 25, 2024	DisentanglementImage Generation	—Unverified
Representation Collapsing Problems in Vector Quantization	Nov 25, 2024	Quantization	—Unverified
MixPE: Quantization and Hardware Co-design for Efficient LLM Inference	Nov 25, 2024	Quantization	—Unverified
SKQVC: One-Shot Voice Conversion by K-Means Quantization with Self-Supervised Speech Representations	Nov 25, 2024	QuantizationSelf-Supervised Learning	—Unverified
Lion Cub: Minimizing Communication Overhead in Distributed Lion	Nov 25, 2024	Quantization	—Unverified
Downlink MIMO Channel Estimation from Bits: Recoverability and Algorithm	Nov 25, 2024	Quantization	—Unverified
Beyond Task Vectors: Selective Task Arithmetic Based on Importance Metrics	Nov 25, 2024	Knowledge DistillationMulti-Task Learning	—Unverified
Rethinking Diffusion for Text-Driven Human Motion Generation	Nov 25, 2024	Motion GenerationQuantization	—Unverified
Curvature in the Looking-Glass: Optimal Methods to Exploit Curvature of Expectation in the Loss Landscape	Nov 25, 2024	Quantization	—Unverified
freePruner: A Training-free Approach for Large Multimodal Model Acceleration	Nov 23, 2024	QuantizationQuestion Answering	—Unverified
Efficient Online Inference of Vision Transformers by Training-Free Tokenization	Nov 23, 2024	Quantization	CodeCode Available
FLARE: FP-Less PTQ and Low-ENOB ADC Based AMS-PiM for Error-Resilient, Fast, and Efficient Transformer Acceleration	Nov 22, 2024	Quantization	—Unverified
TaQ-DiT: Time-aware Quantization for Diffusion Transformers	Nov 21, 2024	DenoisingModel Compression	—Unverified
AutoMixQ: Self-Adjusting Quantization for High Performance Memory-Efficient Fine-Tuning	Nov 21, 2024	Quantization	—Unverified
RTSR: A Real-Time Super-Resolution Model for AV1 Compressed Content	Nov 20, 2024	4kKnowledge Distillation	—Unverified
Disco Intelligent Omni-Surfaces: 360-degree Fully-Passive Jamming Attacks	Nov 20, 2024	Quantization	—Unverified
High-Throughput Blind Co-Channel Interference Cancellation for Edge Devices Using Depthwise Separable Convolutions, Quantization, and Pruning	Nov 19, 2024	blind source separationComputational Efficiency	—Unverified
Diffusion Product Quantization	Nov 19, 2024	Quantization	—Unverified
BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration	Nov 18, 2024	Quantization	CodeCode Available
EfQAT: An Efficient Framework for Quantization-Aware Training	Nov 17, 2024	Quantization	—Unverified
Towards Accurate and Efficient Sub-8-Bit Integer Training	Nov 17, 2024	CPUGPU	—Unverified
BlueLM-V-3B: Algorithm and System Co-Design for Multimodal Large Language Models on Mobile Devices	Nov 16, 2024	Quantization	—Unverified
An exploration of the effect of quantisation on energy consumption and inference time of StarCoder2	Nov 15, 2024	Model CompressionQuantization	CodeCode Available
Systolic Arrays and Structured Pruning Co-design for Efficient Transformers in Edge Systems	Nov 15, 2024	Machine TranslationQuantization	—Unverified
AMXFP4: Taming Activation Outliers with Asymmetric Microscaling Floating-Point for 4-bit LLM Inference	Nov 15, 2024	QuantizationQuestion Answering	—Unverified
Communication Compression for Tensor Parallel LLM Inference	Nov 14, 2024	Quantization	—Unverified
ASER: Activation Smoothing and Error Reconstruction for Large Language Model Quantization	Nov 12, 2024	Language ModelingLanguage Modelling	—Unverified
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified
Towards Low-bit Communication for Tensor Parallel LLM Inference	Nov 12, 2024	Language ModelingLanguage Modelling	—Unverified
HarmLevelBench: Evaluating Harm-Level Compliance and the Impact of Quantization on Model Alignment	Nov 11, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 31 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified