Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 4925 papers

Title	Date	Tasks	Status
Collaborative Filtering with Smooth Reconstruction of the Preference Function	Jan 1, 2021	Collaborative FilteringQuantization	—Unverified
Collaborative Edge AI Inference over Cloud-RAN	Apr 9, 2024	Quantization	—Unverified
AdaQAT: Adaptive Bit-Width Quantization-Aware Training	Apr 22, 2024	Quantization	—Unverified
Collaborative Automotive Radar Sensing via Mixed-Precision Distributed Array Completion	Mar 13, 2024	Matrix CompletionQuantization	—Unverified
Cognitive Non-Coherent Jamming Techniques for Frequency Selective Attacks	May 12, 2025	Quantization	—Unverified
Self-Supervised Learning for Multi-Channel Neural Transducer	Aug 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
EDAS: Efficient and Differentiable Architecture Search	Dec 3, 2019	GPUNeural Architecture Search	—Unverified
Edge AI-Enabled Chicken Health Detection Based on Enhanced FCOS-Lite and Knowledge Distillation	Jul 3, 2024	Knowledge DistillationQuantization	—Unverified
Edge Intelligence Optimization for Large Language Model Inference with Batching and Quantization	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Effective and Fast: A Novel Sequential Single Path Search for Mixed-Precision Quantization	Mar 4, 2021	Quantization	—Unverified
Cognitive Coding of Speech	Oct 8, 2021	Dimensionality ReductionQuantization	—Unverified
CogACT: A Foundational Vision-Language-Action Model for Synergizing Cognition and Action in Robotic Manipulation	Nov 29, 2024	QuantizationVision-Language-Action	—Unverified
A Probabilistic Reformulation Technique for Discrete RIS Optimization in Wireless Systems	Mar 1, 2023	Quantization	—Unverified
A Privacy Preserving System for Movie Recommendations Using Federated Learning	Mar 7, 2023	Federated LearningPrivacy Preserving	—Unverified
Coding for Random Projections and Approximate Near Neighbor Search	Mar 31, 2014	Quantization	—Unverified
AdaptivFloat: A Floating-point based Data Type for Resilient Deep Learning Inference	Sep 29, 2019	Quantization	—Unverified
Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization	Jun 16, 2022	Language ModelingLanguage Modelling	—Unverified
Coding for Random Projections	Aug 9, 2013	Information RetrievalQuantization	—Unverified
Co-Designing Binarized Transformer and Hardware Accelerator for Efficient End-to-End Edge Deployment	Jul 16, 2024	QuantizationScheduling	—Unverified
A Principled Hierarchical Deep Learning Approach to Joint Image Compression and Classification	Oct 30, 2023	Decoderimage-classification	—Unverified
Codec-ASR: Training Performant Automatic Speech Recognition Systems with Discrete Speech Representations	Jul 3, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Precision-Scalable RISC-V DNN Processor with On-Device Learning Capability at the Extreme Edge	Sep 15, 2023	Quantization	—Unverified
Adaptive Wireless Image Semantic Transmission: Design, Simulation, and Prototype Validation	Oct 23, 2024	Image ReconstructionQuantization	—Unverified
Unsupervised automatic classification of Scanning Electron Microscopy (SEM) images of CD4+ cells with varying extent of HIV virion infection	Apr 30, 2019	General ClassificationQuantization	—Unverified
CodeBrain: Impute Any Brain MRI via Instance-specific Scalar-quantized Codes	Jan 30, 2025	ImputationQuantization	—Unverified
A Practical Mixed Precision Algorithm for Post-Training Quantization	Feb 10, 2023	Quantization	—Unverified
Codebook based Audio Feature Representation for Music Information Retrieval	Dec 19, 2013	Information RetrievalManagement	—Unverified
Codage \'echelonnable \`a granularit\'e fine de la parole : Application au codeur G.729 (Fine granularity scalable speech coding: Application to the G.729 coder) [in French]	Jun 1, 2012	Quantization	—Unverified
Adaptive Wireless Image Semantic Transmission and Over-The-Air Testing	May 22, 2024	Intelligent Communicationobject-detection	—Unverified
Cocktail: Chunk-Adaptive Mixed-Precision Quantization for Long-Context LLM Inference	Mar 30, 2025	GPUQuantization	—Unverified
Approximation speed of quantized vs. unquantized ReLU neural networks and beyond	May 24, 2022	Quantization	—Unverified
CoAst: Validation-Free Contribution Assessment for Federated Learning based on Cross-Round Valuation	Sep 4, 2024	Contribution AssessmentFederated Learning	—Unverified
Approximation of functions with one-bit neural networks	Dec 16, 2021	Quantization	—Unverified
Adaptive Transmission for Distributed Detection in Energy Harvesting Wireless Sensor Networks	Mar 3, 2021	Quantization	—Unverified
2-in-1 Accelerator: Enabling Random Precision Switch for Winning Both Adversarial Robustness and Efficiency	Sep 11, 2021	Adversarial RobustnessQuantization	—Unverified
E^2BoWs: An End-to-End Bag-of-Words Model via Deep Convolutional Neural Network	Sep 18, 2017	Image RetrievalQuantization	—Unverified
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection	Nov 26, 2024	Quantization	—Unverified
CNN inference acceleration using dictionary of centroids	Oct 19, 2018	QuantizationTensor Decomposition	—Unverified
Accelerating Energy-Efficient Federated Learning in Cell-Free Networks with Adaptive Quantization	Dec 30, 2024	Federated LearningQuantization	—Unverified
CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture	Apr 22, 2024	GPUQuantization	—Unverified
Adaptive Training of Random Mapping for Data Quantization	Jun 28, 2016	Quantization	—Unverified
Reconstruction of Privacy-Sensitive Data from Protected Templates	May 8, 2019	Privacy PreservingQuantization	—Unverified
CNN-based Analog CSI Feedback in FDD MIMO-OFDM Systems	Oct 23, 2019	DiversityQuantization	—Unverified
CNN Acceleration by Low-rank Approximation with Quantized Factors	Jun 16, 2020	Quantization	—Unverified
Approximate search with quantized sparse representations	Aug 10, 2016	Quantization	—Unverified
CNN2Gate: Toward Designing a General Framework for Implementation of Convolutional Neural Networks on FPGA	Apr 6, 2020	QuantizationReinforcement Learning	—Unverified
Cluster Regularized Quantization for Deep Networks Compression	Feb 27, 2019	Quantization	—Unverified
Approximate Probabilistic Neural Networks with Gated Threshold Logic	Aug 2, 2018	General ClassificationQuantization	—Unverified
Adaptive Sample-space & Adaptive Probability coding: a neural-network based approach for compression	May 1, 2019	Data CompressionEfficient Neural Network	—Unverified
DynaQuant: Compressing Deep Learning Training Checkpoints via Dynamic Quantization	Jun 20, 2023	Deep LearningModel Compression	—Unverified

Show:10 25 50

← PrevPage 25 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified