Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2051–2100 of 4925 papers

Title	Date	Tasks	Status
EdgeFusion: On-Device Text-to-Image Generation	Apr 18, 2024	Image GenerationKnowledge Distillation	—Unverified
LongVQ: Long Sequence Modeling with Vector Quantization on Structured Memory	Apr 17, 2024	Computational EfficiencyLanguage Modeling	—Unverified
QGen: On the Ability to Generalize in Quantization Aware Training	Apr 17, 2024	Quantization	—Unverified
Neural Network Approach for Non-Markovian Dissipative Dynamics of Many-Body Open Quantum Systems	Apr 17, 2024	BenchmarkingQuantization	—Unverified
Variational quantization for state space models	Apr 17, 2024	QuantizationState Space Models	CodeCode Available
Comprehensive Survey of Model Compression and Speed up for Vision Transformers	Apr 16, 2024	Computational EfficiencyEdge-computing	—Unverified
Quantization of Large Language Models with an Overdetermined Basis	Apr 15, 2024	Data CompressionQuantization	—Unverified
Efficient and accurate neural field reconstruction using resistive memory	Apr 15, 2024	CPUNovel View Synthesis	—Unverified
TMPQ-DM: Joint Timestep Reduction and Quantization Precision Selection for Efficient Diffusion Models	Apr 15, 2024	DenoisingModel Optimization	—Unverified
SNN4Agents: A Framework for Developing Energy-Efficient Embodied Spiking Neural Networks for Autonomous Agents	Apr 14, 2024	Quantization	CodeCode Available
Bullion: A Column Store for Machine Learning	Apr 13, 2024	QuantizationRecommendation Systems	—Unverified
Full-Duplex Beyond Self-Interference: The Unlimited Sensing Way	Apr 12, 2024	Quantization	—Unverified
Lossy Image Compression with Foundation Diffusion Models	Apr 12, 2024	DenoisingImage Compression	—Unverified
1-bit Quantized On-chip Hybrid Diffraction Neural Network Enabled by Authentic All-optical Fully-connected Architecture	Apr 11, 2024	AllLesion Detection	—Unverified
Frame Quantization of Neural Networks	Apr 11, 2024	Quantization	—Unverified
Edge-Efficient Deep Learning Models for Automatic Modulation Classification: A Performance Analysis	Apr 11, 2024	Knowledge DistillationModel Optimization	—Unverified
CQIL: Inference Latency Optimization with Concurrent Computation of Quasi-Independent Layers	Apr 10, 2024	Quantization	CodeCode Available
Differentiable Search for Finding Optimal Quantization Strategy	Apr 10, 2024	image-classificationImage Classification	—Unverified
Collaborative Edge AI Inference over Cloud-RAN	Apr 9, 2024	Quantization	—Unverified
Encoder-Quantization-Motion-based Video Quality Metrics	Apr 9, 2024	QuantizationVideo Compression	—Unverified
Physics of Language Models: Part 3.3, Knowledge Capacity Scaling Laws	Apr 8, 2024	Quantization	—Unverified
Investigating the Impact of Quantization on Adversarial Robustness	Apr 8, 2024	Adversarial RobustnessQuantization	—Unverified
Exploring Quantization and Mapping Synergy in Hardware-Aware Deep Neural Network Accelerators	Apr 8, 2024	QuantizationScheduling	CodeCode Available
David and Goliath: An Empirical Evaluation of Attacks and Defenses for QNNs at the Deep Edge	Apr 8, 2024	Edge-computingQuantization	CodeCode Available
Gull: A Generative Multifunctional Audio Codec	Apr 7, 2024	Audio CompressionAudio Source Separation	—Unverified
Weakly Supervised Deep Hyperspherical Quantization for Image Retrieval	Apr 7, 2024	Image RetrievalQuantization	CodeCode Available
Nanometer Scanning with Micrometer Sensing: Beating Quantization Constraints in Lissajous Trajectory Tracking	Apr 7, 2024	Quantization	—Unverified
What Happens When Small Is Made Smaller? Exploring the Impact of Compression on Small Data Pretrained Language Models	Apr 6, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Fine-Tuning, Quantization, and LLMs: Navigating Unintended Outcomes	Apr 5, 2024	Quantization	—Unverified
TinyVQA: Compact Multimodal Deep Neural Network for Visual Question Answering on Resource-Constrained Devices	Apr 4, 2024	QuantizationQuestion Answering	—Unverified
Mitigating the Impact of Outlier Channels for Language Model Quantization with Activation Regularization	Apr 4, 2024	GPULanguage Modeling	CodeCode Available
DI-Retinex: Digital-Imaging Retinex Theory for Low-Light Image Enhancement	Apr 4, 2024	Image EnhancementLow-Light Image Enhancement	—Unverified
CLaM-TTS: Improving Neural Codec Language Model for Zero-Shot Text-to-Speech	Apr 3, 2024	Language ModelingLanguage Modelling	—Unverified
Cherry on Top: Parameter Heterogeneity and Quantization in Large Language Models	Apr 3, 2024	Quantization	—Unverified
DNN Memory Footprint Reduction via Post-Training Intra-Layer Multi-Precision Quantization	Apr 3, 2024	Edge-computingQuantization	—Unverified
NeRFCodec: Neural Feature Compression Meets Neural Radiance Fields for Memory-Efficient Scene Representation	Apr 2, 2024	DecoderFeature Compression	—Unverified
Minimize Quantization Output Error with Bias Compensation	Apr 2, 2024	Quantization	CodeCode Available
On the Effect of Quantization on Dynamic Mode Decomposition	Apr 2, 2024	Quantization	—Unverified
RefQSR: Reference-based Quantization for Image Super-Resolution Networks	Apr 2, 2024	Image Super-ResolutionQuantization	—Unverified
A Novel Audio Representation for Music Genre Identification in MIR	Apr 1, 2024	Information RetrievalMusic Information Retrieval	—Unverified
Instance-Aware Group Quantization for Vision Transformers	Apr 1, 2024	image-classificationImage Classification	—Unverified
Towards Variable and Coordinated Holistic Co-Speech Motion Generation	Mar 30, 2024	Motion GenerationQuantization	—Unverified
Accurate Block Quantization in LLMs with Outliers	Mar 29, 2024	Quantization	—Unverified
Transformer-Lite: High-efficiency Deployment of Large Language Models on Mobile Phone GPUs	Mar 29, 2024	CPUGPU	—Unverified
QNCD: Quantization Noise Correction for Diffusion Models	Mar 28, 2024	DenoisingImage Generation	CodeCode Available
Meta-Heuristic Fronthaul Bit Allocation for Cell-free Massive MIMO Systems	Mar 28, 2024	CPUFairness	—Unverified
Uncertainty-Aware Deep Video Compression with Ensembles	Mar 28, 2024	DiversityMotion Estimation	—Unverified
Within the Dynamic Context: Inertia-aware 3D Human Modeling with Pose Sequence	Mar 28, 2024	Neural RenderingQuantization	—Unverified
Oh! We Freeze: Improving Quantized Knowledge Distillation via Signal Propagation Analysis for Large Language Models	Mar 26, 2024	Knowledge DistillationQuantization	—Unverified
Order of Compression: A Systematic and Optimal Sequence to Combinationally Compress CNN	Mar 26, 2024	Knowledge DistillationModel Compression	—Unverified

Show:10 25 50

← PrevPage 42 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified