Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1800 of 4925 papers

Title	Date	Tasks	Status
Federated Aggregation of Mallows Rankings: A Comparative Analysis of Borda and Lehmer Coding	Sep 1, 2024	Privacy PreservingQuantization	—Unverified
Enhancing Multi-Stream Beamforming Through CQIs For 5G NR FDD Massive MIMO Communications: A Tuning-Free Scheme	Sep 1, 2024	Quantization	—Unverified
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization	Aug 31, 2024	Image GenerationQuantization	—Unverified
VQ4DiT: Efficient Post-Training Vector Quantization for Diffusion Transformers	Aug 30, 2024	GPUImage Generation	—Unverified
Approximately Invertible Neural Network for Learned Image Compression	Aug 30, 2024	DenoisingImage Compression	—Unverified
Identifying and Clustering Counter Relationships of Team Compositions in PvP Games for Efficient Balance Analysis	Aug 30, 2024	Card GamesGame Design	CodeCode Available
Blending Low and High-Level Semantics of Time Series for Better Masked Time Series Generation	Aug 29, 2024	QuantizationSelf-Supervised Learning	—Unverified
On-device AI: Quantization-aware Training of Transformers in Time-Series	Aug 29, 2024	QuantizationTime Series	—Unverified
GIFT-SW: Gaussian noise Injected Fine-Tuning of Salient Weights for LLMs	Aug 27, 2024	parameter-efficient fine-tuningQuantization	CodeCode Available
The Uniqueness of LLaMA3-70B Series with Per-Channel Quantization	Aug 27, 2024	Quantization	—Unverified
Adaptive Resolution Inference (ARI): Energy-Efficient Machine Learning for Internet of Things	Aug 26, 2024	Quantization	—Unverified
Scalable Multivariate Fronthaul Quantization for Cell-Free Massive MIMO	Aug 26, 2024	Quantization	—Unverified
FusionSAM: Latent Space driven Segment Anything Model for Multimodal Fusion and Segmentation	Aug 26, 2024	Autonomous DrivingImage Segmentation	—Unverified
On-Device Language Models: A Comprehensive Review	Aug 26, 2024	Knowledge DistillationQuantization	CodeCode Available
Revisiting DNN Training for Intermittently-Powered Energy-Harvesting Micro-Computers	Aug 25, 2024	Quantization	—Unverified
Quantized neural network for complex hologram generation	Aug 25, 2024	Quantization	—Unverified
Vision-Language and Large Language Model Performance in Gastroenterology: GPT, Claude, Llama, Phi, Mistral, Gemma, and Quantized Models	Aug 25, 2024	Language ModelingLanguage Modelling	CodeCode Available
Variational autoencoder-based neural network model compression	Aug 25, 2024	Anomaly DetectionImage Generation	—Unverified
Infrared Domain Adaptation with Zero-Shot Quantization	Aug 25, 2024	Domain Adaptationobject-detection	—Unverified
A Safe Self-evolution Algorithm for Autonomous Driving Based on Data-Driven Risk Quantification Model	Aug 23, 2024	Autonomous DrivingEvolutionary Algorithms	—Unverified
Informational Embodiment: Computational role of information structure in codes and robots	Aug 23, 2024	Quantization	—Unverified
DeepHQ: Learned Hierarchical Quantizer for Progressive Deep Image Coding	Aug 22, 2024	Quantization	—Unverified
Matmul or No Matmal in the Era of 1-bit LLMs	Aug 21, 2024	Quantization	—Unverified
Disentangling segmental and prosodic factors to non-native speech comprehensibility	Aug 20, 2024	QuantizationVoice Similarity	—Unverified
Hyperstroke: A Novel High-quality Stroke Representation for Assistive Artistic Drawing	Aug 18, 2024	Quantization	—Unverified
Explore Cross-Codec Quality-Rate Convex Hulls Relation for Adaptive Streaming	Aug 16, 2024	QuantizationRelation	—Unverified
PQV-Mobile: A Combined Pruning and Quantization Toolkit to Optimize Vision Transformers for Mobile Applications	Aug 15, 2024	Quantization	CodeCode Available
JPEG-LM: LLMs as Image Generators with Canonical Codec Representations	Aug 15, 2024	Image GenerationQuantization	—Unverified
Analog Spiking Neuron in CMOS 28 nm Towards Large-Scale Neuromorphic Processors	Aug 14, 2024	Quantization	—Unverified
Prompt Tuning as User Inherent Profile Inference Machine	Aug 13, 2024	QuantizationRecommendation Systems	—Unverified
Low-Bitwidth Floating Point Quantization for Efficient High-Quality Diffusion Models	Aug 13, 2024	DenoisingQuantization	—Unverified
Line Spectral Estimation with Unlimited Sensing	Aug 13, 2024	Quantization	—Unverified
Computability of Classification and Deep Learning: From Theoretical Limits to Practical Feasibility through Quantization	Aug 12, 2024	Deep LearningQuantization	—Unverified
RTF-Q: Efficient Unsupervised Domain Adaptation with Retraining-free Quantization	Aug 11, 2024	Domain AdaptationQuantization	—Unverified
Quantum-secure multiparty deep learning	Aug 10, 2024	Cloud ComputingDeep Learning	—Unverified
Semantic-Enabled 6G Communication: A Task-oriented and Privacy-preserving Perspective	Aug 8, 2024	Privacy PreservingQuantization	—Unverified
FDC: Fast KV Dimensionality Compression for Efficient LLM Inference	Aug 7, 2024	Quantization	—Unverified
Inference Optimizations for Large Language Models: Effects, Challenges, and Practical Considerations	Aug 6, 2024	Knowledge DistillationNavigate	—Unverified
L3iTC at the FinLLM Challenge Task: Quantization for Financial Text Classification & Summarization	Aug 6, 2024	GPUQuantization	—Unverified
Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement	Aug 6, 2024	Quantization	CodeCode Available
Synaptic Modulation using Interspike Intervals Increases Energy Efficiency of Spiking Neural Networks	Aug 6, 2024	Quantization	—Unverified
Self-Supervised Learning for Multi-Channel Neural Transducer	Aug 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers	Aug 6, 2024	Model CompressionQuantization	—Unverified
HQOD: Harmonious Quantization for Object Detection	Aug 5, 2024	Objectobject-detection	CodeCode Available
An approach to optimize inference of the DIART speaker diarization pipeline	Aug 5, 2024	Inference OptimizationKnowledge Distillation	—Unverified
Nonlinear Perturbation-based Non-Convex Optimization over Time-Varying Networks	Aug 5, 2024	Quantization	—Unverified
Winning Amazon KDD Cup'24	Aug 5, 2024	Data AugmentationMultiple-choice	—Unverified
STBLLM: Breaking the 1-Bit Barrier with Structured Binary LLMs	Aug 3, 2024	BinarizationComputational Efficiency	—Unverified
HMDN: Hierarchical Multi-Distribution Network for Click-Through Rate Prediction	Aug 2, 2024	Click-Through Rate PredictionMixture-of-Experts	—Unverified
Reclaiming Residual Knowledge: A Novel Paradigm to Low-Bit Quantization	Aug 1, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 36 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified