Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1600 of 4925 papers

Title	Date	Tasks	Status
HarmLevelBench: Evaluating Harm-Level Compliance and the Impact of Quantization on Model Alignment	Nov 11, 2024	Quantization	—Unverified
HAFLQ: Heterogeneous Adaptive Federated LoRA Fine-tuned LLM with Quantization	Nov 10, 2024	Quantizationtext-classification	—Unverified
Expansion Quantization Network: An Efficient Micro-emotion Annotation and Detection Framework	Nov 9, 2024	Emotion Detection and ClassificationQuantization	CodeCode Available
An asymmetric heuristic for trained ternary quantization based on the statistics of the weights: an application to medical signal classification	Nov 9, 2024	Quantization	CodeCode Available
Optimizing Large Language Models through Quantization: A Comparative Analysis of PTQ and QAT Techniques	Nov 9, 2024	Quantization	—Unverified
Intelligent Fault Diagnosis of Type and Severity in Low-Frequency, Low Bit-Depth Signals	Nov 9, 2024	Fault DiagnosisQuantization	—Unverified
When are 1.58 bits enough? A Bottom-up Exploration of BitNet Quantization	Nov 8, 2024	DecoderQuantization	—Unverified
Rate-aware Compression for NeRF-based Volumetric Video	Nov 8, 2024	NeRFQuantization	—Unverified
QuanCrypt-FL: Quantized Homomorphic Encryption with Pruning for Secure Federated Learning	Nov 8, 2024	Computational EfficiencyFederated Learning	—Unverified
Aligned Vector Quantization for Edge-Cloud Collabrative Vision-Language Models	Nov 8, 2024	QuantizationQuestion Answering	—Unverified
Qwen2.5-32B: Leveraging Self-Consistent Tool-Integrated Reasoning for Bengali Mathematical Olympiad Problem Solving	Nov 8, 2024	Prompt EngineeringQuantization	—Unverified
Compressive Spectrum Sensing with 1-bit ADCs	Nov 7, 2024	compressed sensingQuantization	—Unverified
Saliency Assisted Quantization for Neural Networks	Nov 7, 2024	image-classificationImage Classification	—Unverified
Green My LLM: Studying the key factors affecting the energy consumption of code assistants	Nov 7, 2024	Quantization	—Unverified
Interactions Across Blocks in Post-Training Quantization of Large Language Models	Nov 6, 2024	Quantization	—Unverified
Multi-bit Distributed Detection of Sparse Stochastic Signals over Error-Prone Reporting Channels	Nov 6, 2024	Quantization	—Unverified
An Edge Computing-Based Solution for Real-Time Leaf Disease Classification using Thermal Imaging	Nov 6, 2024	Deep LearningEdge-computing	CodeCode Available
Stochastic Monkeys at Play: Random Augmentations Cheaply Break LLM Safety Alignment	Nov 5, 2024	QuantizationSafety Alignment	CodeCode Available
Hybrid Beamforming for Integrated Sensing and Communications With Low Resolution DACs	Nov 5, 2024	ISACQuantization	—Unverified
Sum Rate Maximization in the Constant Envelope MIMO Downlink with the RZF Precoder	Nov 5, 2024	Quantization	—Unverified
"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization	Nov 4, 2024	GPULarge Language Model	—Unverified
Transferable Sequential Recommendation via Vector Quantized Meta Learning	Nov 4, 2024	Meta-LearningQuantization	—Unverified
BF-IMNA: A Bit Fluid In-Memory Neural Architecture for Neural Network Acceleration	Nov 3, 2024	Quantization	—Unverified
Conformalized High-Density Quantile Regression via Dynamic Prototypes-based Probability Density Estimation	Nov 2, 2024	Density Estimationquantile regression	CodeCode Available
Optimizing Contextual Speech Recognition Using Vector Quantization for Efficient Retrieval	Nov 1, 2024	QuantizationRetrieval	—Unverified
Fundamental Trade-offs in Quantized Hybrid Radar Fusion: A CRB-Rate Perspective	Nov 1, 2024	Integrated sensing and communicationISAC	—Unverified
ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNs	Oct 31, 2024	Quantization	—Unverified
Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model	Oct 31, 2024	QuantizationSequential Recommendation	—Unverified
ALISE: Accelerating Large Language Model Serving with Speculative Scheduling	Oct 31, 2024	BlockingLanguage Modeling	—Unverified
GWQ: Gradient-Aware Weight Quantization for Large Language Models	Oct 30, 2024	Outlier DetectionQuantization	—Unverified
APCodec+: A Spectrum-Coding-Based High-Fidelity and High-Compression-Rate Neural Audio Codec with Staged Training Paradigm	Oct 30, 2024	DecoderQuantization	—Unverified
ELMGS: Enhancing memory and computation scaLability through coMpression for 3D Gaussian Splatting	Oct 30, 2024	Quantization	—Unverified
Accelerated AI Inference via Dynamic Execution Methods	Oct 30, 2024	Quantization	—Unverified
A Comprehensive Study on Quantization Techniques for Large Language Models	Oct 30, 2024	Quantization	—Unverified
HRPVT: High-Resolution Pyramid Vision Transformer for medium and small-scale human pose estimation	Oct 29, 2024	Pose EstimationQuantization	—Unverified
The Impact of Inference Acceleration Strategies on Bias of LLMs	Oct 29, 2024	Quantization	CodeCode Available
EoRA: Training-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation	Oct 28, 2024	ARCMath	—Unverified
Unsupervised Panoptic Interpretation of Latent Spaces in GANs Using Space-Filling Vector Quantization	Oct 27, 2024	Data AugmentationQuantization	CodeCode Available
Logarithmically Quantized Distributed Optimization over Dynamic Multi-Agent Networks	Oct 27, 2024	Distributed OptimizationQuantization	—Unverified
Unleashing Dynamic Range and Resolution in Unlimited Sensing Framework via Novel Hardware	Oct 26, 2024	Quantization	—Unverified
You Never Know: Quantization Induces Inconsistent Biases in Vision-Language Foundation Models	Oct 26, 2024	Quantization	—Unverified
DQRM: Deep Quantized Recommendation Models	Oct 26, 2024	Quantization	CodeCode Available
A Survey of Small Language Models	Oct 25, 2024	BenchmarkingModel Compression	—Unverified
Content-Aware Radiance Fields: Aligning Model Complexity with Scene Intricacy Through Learned Bitwidth Quantization	Oct 25, 2024	NeRFQuantization	CodeCode Available
Learning ID-free Item Representation with Token Crossing for Multimodal Recommendation	Oct 25, 2024	Multimodal RecommendationQuantization	—Unverified
TesseraQ: Ultra Low-Bit LLM Post-Training Quantization with Block Reconstruction	Oct 24, 2024	Quantization	—Unverified
The Nature of Mathematical Modeling and Probabilistic Optimization Engineering in Generative AI	Oct 24, 2024	Quantization	—Unverified
Sliding DFT-based Signal Recovery for Modulo ADC with 1-bit Folding Information	Oct 24, 2024	Quantization	—Unverified
A Counterexample in Cross-Correlation Template Matching	Oct 24, 2024	Image RegistrationQuantization	—Unverified
Adaptive Wireless Image Semantic Transmission: Design, Simulation, and Prototype Validation	Oct 23, 2024	Image ReconstructionQuantization	—Unverified

Show:10 25 50

← PrevPage 32 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified