Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 4925 papers

Title	Date	Tasks	Status
Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication	May 17, 2024	DecoderQuantization	—Unverified
Flattened one-bit stochastic gradient descent: compressed distributed optimization with controlled variance	May 17, 2024	Distributed OptimizationQuantization	—Unverified
Enhancing Perception Quality in Remote Sensing Image Compression via Invertible Neural Network	May 17, 2024	Image CompressionQuantization	—Unverified
The Effect of Quantization in Federated Learning: A Rényi Differential Privacy Perspective	May 16, 2024	Federated LearningPrivacy Preserving	—Unverified
Properties that allow or prohibit transferability of adversarial attacks among quantized networks	May 15, 2024	Quantization	CodeCode Available
Neural Speech Coding for Real-time Communications using Constant Bitrate Scalar Quantization	May 14, 2024	QuantizationScheduling	—Unverified
FDD Massive MIMO: How to Optimally Combine UL Pilot and Limited DL CSI Feedback?	May 14, 2024	Quantization	—Unverified
Goal-oriented compression for L_p-norm-type goal functions: Application to power consumption scheduling	May 13, 2024	Data CompressionQuantization	—Unverified
VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling	May 13, 2024	Quantization	—Unverified
Post Training Quantization of Large Language Models with Microscaling Formats	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Edge Intelligence Optimization for Large Language Model Inference with Batching and Quantization	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Selective Focus: Investigating Semantics Sensitivity in Post-training Quantization for Lane Detection	May 10, 2024	Autonomous DrivingGPU	—Unverified
Compression-Realized Deep Structural Network for Video Quality Enhancement	May 10, 2024	DenoisingMotion Estimation	—Unverified
Characterizing the Accuracy -- Efficiency Trade-off of Low-rank Decomposition in Language Models	May 10, 2024	AI AgentModel Compression	—Unverified
SKVQ: Sliding-window Key and Value Cache Quantization for Large Language Models	May 10, 2024	GPUQuantization	—Unverified
From Algorithm to Hardware: A Survey on Efficient and Safe Deployment of Deep Neural Networks	May 9, 2024	Knowledge DistillationModel Compression	—Unverified
Custom Gradient Estimators are Straight-Through Estimators in Disguise	May 8, 2024	Quantization	—Unverified
KV Cache is 1 Bit Per Channel: Efficient Large Language Model Inference with Coupled Quantization	May 7, 2024	GPULanguage Modeling	—Unverified
Trio-ViT: Post-Training Quantization and Acceleration for Softmax-Free Efficient Vision Transformer	May 6, 2024	Efficient ViTsModel Compression	CodeCode Available
Compression-based Privacy Preservation for Distributed Nash Equilibrium Seeking in Aggregative Games	May 6, 2024	Quantization	—Unverified
Quantifying the Capabilities of LLMs across Scale and Precision	May 6, 2024	HallucinationMisinformation	—Unverified
Enabling High-Sparsity Foundational Llama Models with Efficient Pretraining and Deployment	May 6, 2024	Arithmetic ReasoningCode Generation	—Unverified
DeltaKWS: A 65nm 36nJ/Decision Bio-inspired Temporal-Sparsity-Aware Digital Keyword Spotting IC with 0.6V Near-Threshold SRAM	May 6, 2024	channel selectionKeyword Spotting	—Unverified
Joint Discrete Precoding and RIS Optimization for RIS-Assisted MU-MIMO Communication Systems	May 5, 2024	Quantization	—Unverified
Efficient Text-driven Motion Generation via Latent Consistency Training	May 5, 2024	Motion GenerationQuantization	CodeCode Available
Exploring Extreme Quantization in Spiking Language Models	May 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Three Quantization Regimes for ReLU Networks	May 3, 2024	Quantization	—Unverified
Lightweight Change Detection in Heterogeneous Remote Sensing Images with Online All-Integer Pruning Training	May 3, 2024	AllChange Detection	—Unverified
Network reconstruction via the minimum description length principle	May 2, 2024	Bayesian InferenceQuantization	—Unverified
Efficient Compression of Multitask Multilingual Speech Models	May 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Joint Sequential Fronthaul Quantization and Hardware Complexity Reduction in Uplink Cell-Free Massive MIMO Networks	May 2, 2024	Quantization	—Unverified
Deep Learning Models in Speech Recognition: Measuring GPU Energy Consumption, Impact of Noise and Model Quantization for Edge Deployment	May 2, 2024	GPUNVIDIA Jetson Orin Nano	CodeCode Available
Wake Vision: A Tailored Dataset and Benchmark Suite for TinyML Computer Vision Applications	May 1, 2024	Human DetectionKnowledge Distillation	—Unverified
When Quantization Affects Confidence of Large Language Models?	May 1, 2024	Language ModelingLanguage Modelling	CodeCode Available
Self-supervised Pre-training of Text Recognizers	May 1, 2024	QuantizationTransfer Learning	CodeCode Available
Investigating Automatic Scoring and Feedback using Large Language Models	May 1, 2024	parameter-efficient fine-tuningQuantization	—Unverified
Transition Rate Scheduling for Quantization-Aware Training	Apr 30, 2024	QuantizationScheduling	—Unverified
Quantized Context Based LIF Neurons for Recurrent Spiking Neural Networks in 45nm	Apr 28, 2024	Quantization	—Unverified
Enhancing Channel Estimation in Quantized Systems with a Generative Prior	Apr 26, 2024	Quantization	—Unverified
sDAC -- Semantic Digital Analog Converter for Semantic Communications	Apr 26, 2024	QuantizationSemantic Communication	—Unverified
MMGRec: Multimodal Generative Recommendation with Transformer Model	Apr 25, 2024	modelMultimodal Recommendation	—Unverified
How to Parameterize Asymmetric Quantization Ranges for Quantization-Aware Training	Apr 25, 2024	Quantization	—Unverified
CoST: Contrastive Quantization based Semantic Tokenization for Generative Recommendation	Apr 23, 2024	DecoderLanguage Modelling	—Unverified
AdaQAT: Adaptive Bit-Width Quantization-Aware Training	Apr 22, 2024	Quantization	—Unverified
CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture	Apr 22, 2024	GPUQuantization	—Unverified
Latency-Distortion Tradeoffs in Communicating Classification Results over Noisy Channels	Apr 22, 2024	NavigateQuantization	—Unverified
FedMPQ: Secure and Communication-Efficient Federated Learning with Multi-codebook Product Quantization	Apr 21, 2024	Federated LearningQuantization	—Unverified
HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression	Apr 20, 2024	DecoderImage Compression	—Unverified
A SER-based Device Selection Mechanism in Multi-bits Quantization Federated Learning	Apr 20, 2024	Federated LearningQuantization	—Unverified
EdgeFusion: On-Device Text-to-Image Generation	Apr 18, 2024	Image GenerationKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 41 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified