Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2401–2450 of 4925 papers

Title	Date	Tasks	Status
QuATON: Quantization Aware Training of Optical Neurons	Oct 4, 2023	Quantization	—Unverified
Soft Convex Quantization: Revisiting Vector Quantization with Convex Optimization	Oct 4, 2023	Image ReconstructionQuantization	—Unverified
Discrete, compositional, and symbolic representations through attractor dynamics	Oct 3, 2023	Quantization	CodeCode Available
Mixture of Quantized Experts (MoQE): Complementary Effect of Low-bit Quantization and Robustness	Oct 3, 2023	GPUMachine Translation	—Unverified
Generating 3D Brain Tumor Regions in MRI using Vector-Quantization Generative Adversarial Networks	Oct 2, 2023	Brain Tumor ClassificationBrain Tumor Segmentation	—Unverified
MobileNVC: Real-time 1080p Neural Video Compression on a Mobile Device	Oct 2, 2023	DecoderGPU	—Unverified
Quantization of Deep Neural Networks to facilitate self-correction of weights on Phase Change Memory-based analog hardware	Sep 30, 2023	Edge-computingQuantization	—Unverified
DiskANN++: Efficient Page-based Search over Isomorphic Mapped Graph Index using Query-sensitivity Entry Vertex	Sep 30, 2023	QuantizationSensitivity	—Unverified
On Uniform Scalar Quantization for Learned Image Compression	Sep 29, 2023	Image CompressionQuantization	—Unverified
Revolutionizing Mobile Interaction: Enabling a 3 Billion Parameter GPT LLM on Mobile	Sep 29, 2023	Quantization	—Unverified
Network Memory Footprint Compression Through Jointly Learnable Codebooks and Mappings	Sep 29, 2023	Quantization	—Unverified
Diffusion Models as Stochastic Quantization in Lattice Field Theory	Sep 29, 2023	Quantization	CodeCode Available
One-Bit Channel Estimation for IRS-aided Millimeter-Wave Massive MU-MISO System	Sep 29, 2023	Quantization	—Unverified
MixQuant: Mixed Precision Quantization with a Bit-width Optimization Search	Sep 29, 2023	Quantization	—Unverified
Pushing Large Language Models to the 6G Edge: Vision, Challenges, and Opportunities	Sep 28, 2023	Edge-computingparameter-efficient fine-tuning	—Unverified
Quantum Block-Matching Algorithm using Dissimilarity Measure	Sep 27, 2023	ClusteringImage Clustering	—Unverified
Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models	Sep 27, 2023	HumanEvalLanguage Modeling	CodeCode Available
Low Latency of object detection for spikng neural network	Sep 27, 2023	Objectobject-detection	—Unverified
Highly Efficient SNNs for High-speed Object Detection	Sep 27, 2023	GPUObject	—Unverified
SHACIRA: Scalable HAsh-grid Compression for Implicit Neural Representations	Sep 27, 2023	Quantization	—Unverified
Constrained Deep Reinforcement Learning for Fronthaul Compression Optimization	Sep 26, 2023	Deep Reinforcement LearningQuantization	—Unverified
LORD: Low Rank Decomposition Of Monolingual Code LLMs For One-Shot Compression	Sep 25, 2023	Code GenerationHumanEval	—Unverified
On the Impact of Quantization and Pruning of Self-Supervised Speech Models for Downstream Speech Recognition Tasks "In-the-Wild''	Sep 25, 2023	Data AugmentationModel Compression	—Unverified
On Calibration of Modern Quantized Efficient Neural Networks	Sep 25, 2023	Quantization	—Unverified
IBVC: Interpolation-driven B-frame Video Compression	Sep 25, 2023	DecoderMotion Compensation	CodeCode Available
Data Upcycling Knowledge Distillation for Image Super-Resolution	Sep 25, 2023	Image Super-ResolutionKnowledge Distillation	CodeCode Available
GHN-QAT: Training Graph Hypernetworks to Predict Quantization-Robust Parameters of Unseen Limited Precision Neural Networks	Sep 24, 2023	Quantization	—Unverified
Probabilistic Weight Fixing: Large-scale training of neural network weight uncertainties for quantization	Sep 24, 2023	PositionQuantization	CodeCode Available
Causal-DFQ: Causality Guided Data-free Network Quantization	Sep 24, 2023	Data Free QuantizationNeural Network Compression	CodeCode Available
From Text to Source: Results in Detecting Large Language Model-Generated Content	Sep 23, 2023	AttributeLanguage Modeling	—Unverified
Poster: Self-Supervised Quantization-Aware Knowledge Distillation	Sep 22, 2023	Knowledge DistillationQuantization	—Unverified
Activation Compression of Graph Neural Networks using Block-wise Quantization with Improved Variance Minimization	Sep 21, 2023	GPUQuantization	CodeCode Available
Benchmarking quantized LLaMa-based models on the Brazilian Secondary School Exam	Sep 21, 2023	BenchmarkingComputational Efficiency	—Unverified
BELT:Bootstrapping Electroencephalography-to-Language Decoding and Zero-Shot Sentiment Classification by Natural Language Supervision	Sep 21, 2023	Brain DecodingContrastive Learning	—Unverified
Autoregressive Sign Language Production: A Gloss-Free Approach with Discrete Representations	Sep 21, 2023	QuantizationSign Language Production	—Unverified
SPFQ: A Stochastic Algorithm and Its Error Analysis for Neural Network Quantization	Sep 20, 2023	Quantization	—Unverified
Towards Real-Time Neural Video Codec for Cross-Platform Application Using Calibration Information	Sep 20, 2023	GPUQuantization	—Unverified
Discrete Audio Representation as an Alternative to Mel-Spectrograms for Speaker and Speech Recognition	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified
DeepliteRT: Computer Vision at the Edge	Sep 19, 2023	Quantization	—Unverified
Deep Learning based Fast and Accurate Beamforming for Millimeter-Wave Systems	Sep 19, 2023	Quantization	—Unverified
Semantic Text Compression for Classification	Sep 19, 2023	ClassificationDecoder	—Unverified
RIS-Assisted Energy Harvesting Gains for Bistatic Backscatter Networks: Performance Analysis and RIS Phase Optimization	Sep 18, 2023	QuantizationTAG	—Unverified
A Precision-Scalable RISC-V DNN Processor with On-Device Learning Capability at the Extreme Edge	Sep 15, 2023	Quantization	—Unverified
Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-training and Multi-modal Tokens	Sep 15, 2023	Image ComprehensionLanguage Modeling	—Unverified
Communication Efficient Private Federated Learning Using Dithering	Sep 14, 2023	Federated LearningQuantization	CodeCode Available
Comparing Iterative and Least-Squares Based Phase Noise Tracking in Receivers with 1-bit Quantization and Oversampling	Sep 12, 2023	Quantization	—Unverified
Understanding the Impact of Post-Training Quantization on Large Language Models	Sep 11, 2023	Quantization	—Unverified
Quantized Fourier and Polynomial Features for more Expressive Tensor Network Models	Sep 11, 2023	Quantization	CodeCode Available
One-Bit-Aided Modulo Sampling for DOA Estimation	Sep 10, 2023	DecoderQuantization	—Unverified
Leveraging Pretrained Image-text Models for Improving Audio-Visual Learning	Sep 8, 2023	audio-visual learningQuantization	—Unverified

Show:10 25 50

← PrevPage 49 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified