Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3901–3950 of 4925 papers

Title	Date	Tasks	Status
Choose Your Model Size: Any Compression by a Single Gradient Descent	Feb 3, 2025	Quantization	—Unverified
CLaM-TTS: Improving Neural Codec Language Model for Zero-Shot Text-to-Speech	Apr 3, 2024	Language ModelingLanguage Modelling	—Unverified
CLAP-ART: Automated Audio Captioning with Semantic-rich Audio Representation Tokenizer	Jun 1, 2025	Audio captioningLanguage Modeling	—Unverified
Class-based Quantization for Neural Networks	Nov 27, 2022	Quantization	—Unverified
Classification Accuracy Improvement for Neuromorphic Computing Systems with One-level Precision Synapses	Jan 7, 2017	General Classificationimage-classification	—Unverified
Click-through Rate Prediction with Auto-Quantized Contrastive Learning	Sep 27, 2021	Click-Through Rate PredictionContrastive Learning	—Unverified
CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization	Jun 1, 2018	image-classificationImage Classification	—Unverified
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning	Mar 17, 2025	GPUModel Compression	—Unverified
Cluster-Based Cooperative Digital Over-the-Air Aggregation for Wireless Federated Edge Learning	Aug 3, 2020	DecoderDiversity	—Unverified
Clustering-Based Evolutionary Federated Multiobjective Optimization and Learning	Apr 29, 2025	ClusteringDiversity	—Unverified
Clustering with Bregman Divergences: an Asymptotic Analysis	Dec 1, 2016	ClusteringQuantization	—Unverified
Cluster-Promoting Quantization with Bit-Drop for Minimizing Network Quantization Loss	Sep 5, 2021	Quantization	—Unverified
Cluster Pruning: An Efficient Filter Pruning Method for Edge AI Vision Applications	Mar 5, 2020	CPUGPU	—Unverified
Towards Feature Distribution Alignment and Diversity Enhancement for Data-Free Quantization	Apr 30, 2022	Data Free QuantizationDiversity	—Unverified
Cluster Regularized Quantization for Deep Networks Compression	Feb 27, 2019	Quantization	—Unverified
CNN2Gate: Toward Designing a General Framework for Implementation of Convolutional Neural Networks on FPGA	Apr 6, 2020	QuantizationReinforcement Learning	—Unverified
CNN Acceleration by Low-rank Approximation with Quantized Factors	Jun 16, 2020	Quantization	—Unverified
CNN-based Analog CSI Feedback in FDD MIMO-OFDM Systems	Oct 23, 2019	DiversityQuantization	—Unverified
CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture	Apr 22, 2024	GPUQuantization	—Unverified
CNN inference acceleration using dictionary of centroids	Oct 19, 2018	QuantizationTensor Decomposition	—Unverified
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection	Nov 26, 2024	Quantization	—Unverified
CoAst: Validation-Free Contribution Assessment for Federated Learning based on Cross-Round Valuation	Sep 4, 2024	Contribution AssessmentFederated Learning	—Unverified
Cocktail: Chunk-Adaptive Mixed-Precision Quantization for Long-Context LLM Inference	Mar 30, 2025	GPUQuantization	—Unverified
Codage \'echelonnable \`a granularit\'e fine de la parole : Application au codeur G.729 (Fine granularity scalable speech coding: Application to the G.729 coder) [in French]	Jun 1, 2012	Quantization	—Unverified
Codebook based Audio Feature Representation for Music Information Retrieval	Dec 19, 2013	Information RetrievalManagement	—Unverified
CodeBrain: Impute Any Brain MRI via Instance-specific Scalar-quantized Codes	Jan 30, 2025	ImputationQuantization	—Unverified
Codec-ASR: Training Performant Automatic Speech Recognition Systems with Discrete Speech Representations	Jul 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Co-Designing Binarized Transformer and Hardware Accelerator for Efficient End-to-End Edge Deployment	Jul 16, 2024	QuantizationScheduling	—Unverified
Coding for Random Projections	Aug 9, 2013	Information RetrievalQuantization	—Unverified
Coding for Random Projections and Approximate Near Neighbor Search	Mar 31, 2014	Quantization	—Unverified
CogACT: A Foundational Vision-Language-Action Model for Synergizing Cognition and Action in Robotic Manipulation	Nov 29, 2024	QuantizationVision-Language-Action	—Unverified
Cognitive Coding of Speech	Oct 8, 2021	Dimensionality ReductionQuantization	—Unverified
Cognitive Non-Coherent Jamming Techniques for Frequency Selective Attacks	May 12, 2025	Quantization	—Unverified
Collaborative Automotive Radar Sensing via Mixed-Precision Distributed Array Completion	Mar 13, 2024	Matrix CompletionQuantization	—Unverified
Collaborative Edge AI Inference over Cloud-RAN	Apr 9, 2024	Quantization	—Unverified
Collaborative Filtering with Smooth Reconstruction of the Preference Function	Jan 1, 2021	Collaborative FilteringQuantization	—Unverified
Collaborative Multi-Teacher Knowledge Distillation for Learning Low Bit-width Deep Neural Networks	Oct 27, 2022	Knowledge DistillationQuantization	—Unverified
Collaborative Quantization Embeddings for Intra-Subject Prostate MR Image Registration	Jul 13, 2022	Image RegistrationQuantization	—Unverified
Collaborative Quantization for Cross-Modal Similarity Search	Feb 2, 2019	Quantization	—Unverified
Combining Compressions for Multiplicative Size Scaling on Natural Language Tasks	Aug 20, 2022	Knowledge DistillationNeural Network Compression	—Unverified
Post Training Quantization of Large Language Models with Microscaling Formats	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
COMET: Towards Partical W4A4KV4 LLMs Serving	Oct 16, 2024	QuantizationScheduling	—Unverified
Communication and Energy Efficient Federated Learning using Zero-Order Optimization Technique	Sep 24, 2024	Federated LearningQuantization	—Unverified
Communication Compression for Tensor Parallel LLM Inference	Nov 14, 2024	Quantization	—Unverified
Communication-Efficient Decentralized Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control	Aug 4, 2023	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
Communication Efficient Distributed Learning with Censored, Quantized, and Generalized Group ADMM	Sep 14, 2020	Quantization	—Unverified
Communication-Efficient Federated Distillation	Dec 1, 2020	Federated Learningimage-classification	—Unverified
Communication Efficient Federated Learning over Multiple Access Channels	Jan 23, 2020	Federated LearningInformativeness	—Unverified
Communication-Efficient Federated Learning via Optimal Client Sampling	Jul 30, 2020	Federated LearningLanguage Modeling	—Unverified
Communication-Efficient Federated Learning via Quantized Compressed Sensing	Nov 30, 2021	compressed sensingFederated Learning	—Unverified

Show:10 25 50

← PrevPage 79 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified