Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1526–1550 of 4925 papers

Title	Date	Tasks	Status
Downlink MIMO Channel Estimation from Bits: Recoverability and Algorithm	Nov 25, 2024	Quantization	—Unverified
Beyond Task Vectors: Selective Task Arithmetic Based on Importance Metrics	Nov 25, 2024	Knowledge DistillationMulti-Task Learning	—Unverified
Rethinking Diffusion for Text-Driven Human Motion Generation	Nov 25, 2024	Motion GenerationQuantization	—Unverified
Curvature in the Looking-Glass: Optimal Methods to Exploit Curvature of Expectation in the Loss Landscape	Nov 25, 2024	Quantization	—Unverified
freePruner: A Training-free Approach for Large Multimodal Model Acceleration	Nov 23, 2024	QuantizationQuestion Answering	—Unverified
Efficient Online Inference of Vision Transformers by Training-Free Tokenization	Nov 23, 2024	Quantization	CodeCode Available
FLARE: FP-Less PTQ and Low-ENOB ADC Based AMS-PiM for Error-Resilient, Fast, and Efficient Transformer Acceleration	Nov 22, 2024	Quantization	—Unverified
TaQ-DiT: Time-aware Quantization for Diffusion Transformers	Nov 21, 2024	DenoisingModel Compression	—Unverified
AutoMixQ: Self-Adjusting Quantization for High Performance Memory-Efficient Fine-Tuning	Nov 21, 2024	Quantization	—Unverified
RTSR: A Real-Time Super-Resolution Model for AV1 Compressed Content	Nov 20, 2024	4kKnowledge Distillation	—Unverified
Disco Intelligent Omni-Surfaces: 360-degree Fully-Passive Jamming Attacks	Nov 20, 2024	Quantization	—Unverified
High-Throughput Blind Co-Channel Interference Cancellation for Edge Devices Using Depthwise Separable Convolutions, Quantization, and Pruning	Nov 19, 2024	blind source separationComputational Efficiency	—Unverified
Diffusion Product Quantization	Nov 19, 2024	Quantization	—Unverified
BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration	Nov 18, 2024	Quantization	CodeCode Available
EfQAT: An Efficient Framework for Quantization-Aware Training	Nov 17, 2024	Quantization	—Unverified
Towards Accurate and Efficient Sub-8-Bit Integer Training	Nov 17, 2024	CPUGPU	—Unverified
BlueLM-V-3B: Algorithm and System Co-Design for Multimodal Large Language Models on Mobile Devices	Nov 16, 2024	Quantization	—Unverified
An exploration of the effect of quantisation on energy consumption and inference time of StarCoder2	Nov 15, 2024	Model CompressionQuantization	CodeCode Available
Systolic Arrays and Structured Pruning Co-design for Efficient Transformers in Edge Systems	Nov 15, 2024	Machine TranslationQuantization	—Unverified
AMXFP4: Taming Activation Outliers with Asymmetric Microscaling Floating-Point for 4-bit LLM Inference	Nov 15, 2024	QuantizationQuestion Answering	—Unverified
Communication Compression for Tensor Parallel LLM Inference	Nov 14, 2024	Quantization	—Unverified
ASER: Activation Smoothing and Error Reconstruction for Large Language Model Quantization	Nov 12, 2024	Language ModelingLanguage Modelling	—Unverified
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified
Towards Low-bit Communication for Tensor Parallel LLM Inference	Nov 12, 2024	Language ModelingLanguage Modelling	—Unverified
HarmLevelBench: Evaluating Harm-Level Compliance and the Impact of Quantization on Model Alignment	Nov 11, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 62 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified