Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 4925 papers

Title	Date	Tasks	Status
Distributed Deep Reinforcement Learning Based Gradient Quantization for Federated Learning Enabled Vehicle Edge Computing	Jul 11, 2024	Deep Reinforcement LearningEdge-computing	—Unverified
Autoregressive Speech Synthesis without Vector Quantization	Jul 11, 2024	Audio CompressionDiversity	—Unverified
Applying generative neural networks for fast simulations of the ALICE (CERN) experiment	Jul 10, 2024	Quantization	CodeCode Available
ERQ: Error Reduction for Post-Training Quantization of Vision Transformers	Jul 9, 2024	Quantizationregression	—Unverified
Ternary Spike-based Neuromorphic Signal Processing System	Jul 7, 2024	Quantization	—Unverified
ZOBNN: Zero-Overhead Dependable Design of Binary Neural Networks with Deliberately Quantized Parameters	Jul 6, 2024	AttributeQuantization	—Unverified
Beyond Perplexity: Multi-dimensional Safety Evaluation of LLM Compression	Jul 6, 2024	Language ModelingLanguage Modelling	CodeCode Available
Integer-only Quantized Transformers for Embedded FPGA-based Time-series Forecasting in AIoT	Jul 6, 2024	QuantizationTime Series	—Unverified
Balance of Number of Embedding and their Dimensions in Vector Quantization	Jul 6, 2024	Quantization	—Unverified
Quantizing YOLOv7: A Comprehensive Study	Jul 6, 2024	Model Compressionobject-detection	—Unverified
Hybrid Receiver Design for Massive MIMO-OFDM with Low-Resolution ADCs and Oversampling	Jul 5, 2024	Quantization	—Unverified
The Impact of Quantization and Pruning on Deep Reinforcement Learning Models	Jul 5, 2024	Deep Reinforcement LearningModel Compression	—Unverified
Resource-Efficient Speech Quality Prediction through Quantization Aware Training and Binary Activation Maps	Jul 5, 2024	Quantization	CodeCode Available
Low-latency machine learning FPGA accelerator for multi-qubit-state discrimination	Jul 4, 2024	Quantization	—Unverified
Joint Beamforming Design and Bit Allocation in Massive MIMO with Resolution-Adaptive ADCs	Jul 4, 2024	Quantization	—Unverified
Timestep-Aware Correction for Quantized Diffusion Models	Jul 4, 2024	AttributeNoise Estimation	—Unverified
QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering	Jul 4, 2024	Computational EfficiencyEdge-computing	—Unverified
GPTQT: Quantize Large Language Models Twice to Push the Efficiency	Jul 3, 2024	Quantization	—Unverified
Fisher-aware Quantization for DETR Detectors with Critical-category Objectives	Jul 3, 2024	object-detectionObject Detection	—Unverified
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers	Jul 3, 2024	Attributeimage-classification	—Unverified
Codec-ASR: Training Performant Automatic Speech Recognition Systems with Discrete Speech Representations	Jul 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
SFC: Achieve Accurate Fast Convolution under Low-precision Arithmetic	Jul 3, 2024	Quantization	—Unverified
Unified Anomaly Detection methods on Edge Device using Knowledge Distillation and Quantization	Jul 3, 2024	Anomaly DetectionCPU	—Unverified
Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment	Jul 3, 2024	ChatbotComputational Efficiency	—Unverified
Edge AI-Enabled Chicken Health Detection Based on Enhanced FCOS-Lite and Knowledge Distillation	Jul 3, 2024	Knowledge DistillationQuantization	—Unverified
OSPC: Artificial VLM Features for Hateful Meme Detection	Jul 3, 2024	Computational EfficiencyFeature Engineering	—Unverified
How Does Quantization Affect Multilingual LLMs?	Jul 3, 2024	Mathematical ReasoningQuantization	—Unverified
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks	Jul 1, 2024	Quantization	CodeCode Available
Exploring FPGA designs for MX and beyond	Jul 1, 2024	Efficient Neural NetworkQuantization	—Unverified
Beyond Throughput and Compression Ratios: Towards High End-to-end Utility of Gradient Compression	Jul 1, 2024	Quantization	—Unverified
PQCache: Product Quantization-based KVCache for Long Context LLM Inference	Jul 1, 2024	GPUQuantization	—Unverified
Linear and Nonlinear MMSE Estimation in One-Bit Quantized Systems under a Gaussian Mixture Prior	Jul 1, 2024	Quantization	—Unverified
NeuroNAS: Enhancing Efficiency of Neuromorphic In-Memory Computing for Intelligent Mobile Agents through Hardware-Aware Spiking Neural Architecture Search	Jun 30, 2024	Neural Architecture SearchQuantization	—Unverified
Toward a Diffusion-Based Generalist for Dense Vision Tasks	Jun 29, 2024	Conditional Image GenerationImage Generation	—Unverified
Rateless Stochastic Coding for Delay-Constrained Semantic Communication	Jun 28, 2024	DecoderPerceptual Distance	—Unverified
Deep Fusion Model for Brain Tumor Classification Using Fine-Grained Gradient Preservation	Jun 28, 2024	Brain Tumor ClassificationClassification	—Unverified
Reliable edge machine learning hardware for scientific applications	Jun 27, 2024	Quantizationscientific discovery	—Unverified
Fronthaul Quantization-Aware MU-MIMO Precoding for Sum Rate Maximization	Jun 27, 2024	Quantization	—Unverified
Efficient course recommendations with T5-based ranking and summarization	Jun 27, 2024	In-Context LearningQuantization	CodeCode Available
MCNC: Manifold Constrained Network Compression	Jun 27, 2024	Model CompressionQuantization	—Unverified
OutlierTune: Efficient Channel-Wise Quantization for Large Language Models	Jun 27, 2024	Quantization	—Unverified
FedAQ: Communication-Efficient Federated Edge Learning via Joint Uplink and Downlink Adaptive Quantization	Jun 26, 2024	Federated LearningQuantization	—Unverified
A Quantization-based Technique for Privacy Preserving Distributed Learning	Jun 26, 2024	Privacy PreservingQuantization	—Unverified
Differential error feedback for communication-efficient decentralized learning	Jun 26, 2024	Quantization	—Unverified
CDQuant: Greedy Coordinate Descent for Accurate LLM Quantization	Jun 25, 2024	Quantization	—Unverified
Layer-Wise Quantization: A Pragmatic and Effective Method for Quantizing LLMs Beyond Integer Bit-Levels	Jun 25, 2024	Language ModellingLarge Language Model	CodeCode Available
Reducing the Memory Footprint of 3D Gaussian Splatting	Jun 24, 2024	Novel View SynthesisQuantization	—Unverified
Compensate Quantization Errors: Make Weights Hierarchical to Compensate Each Other	Jun 24, 2024	Quantization	—Unverified
Approximate DCT and Quantization Techniques for Energy-Constrained Image Sensors	Jun 24, 2024	Quantization	—Unverified
BitNet b1.58 Reloaded: State-of-the-art Performance Also on Smaller Networks	Jun 24, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 38 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified