Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1625 of 4925 papers

Title	Date	Tasks	Status
Pyramid Vector Quantization for LLMs	Oct 22, 2024	Quantization	—Unverified
Can General-Purpose Large Language Models Generalize to English-Thai Machine Translation ?	Oct 22, 2024	Machine TranslationQuantization	—Unverified
Self-calibration for Language Model Quantization and Pruning	Oct 22, 2024	Language ModelingLanguage Modelling	—Unverified
Continuous Speech Synthesis using per-token Latent Diffusion	Oct 21, 2024	Image GenerationQuantization	—Unverified
Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces	Oct 21, 2024	Continual LearningLifelong learning	—Unverified
Large Deviation Upper Bounds and Improved MSE Rates of Nonlinear SGD: Heavy-tailed Noise and Power of Symmetry	Oct 21, 2024	Quantization	—Unverified
LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec	Oct 21, 2024	DisentanglementLanguage Modeling	—Unverified
SDP4Bit: Toward 4-bit Communication Quantization in Sharded Data Parallelism for LLM Training	Oct 20, 2024	Quantization	—Unverified
Lossless KV Cache Compression to 2%	Oct 20, 2024	Dimensionality ReductionQuantization	—Unverified
Understanding the Difficulty of Low-Precision Post-Training Quantization for LLMs	Oct 18, 2024	Quantization	—Unverified
Evaluating Quantized Large Language Models for Code Generation on Low-Resource Language Benchmarks	Oct 18, 2024	Code GenerationGPU	CodeCode Available
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations	Oct 17, 2024	DecoderQuantization	—Unverified
Progressive Mixed-Precision Decoding for Efficient LLM Inference	Oct 17, 2024	Quantization	—Unverified
Nonlinear Stochastic Gradient Descent and Heavy-tailed Noise: A Unified Framework and High-probability Guarantees	Oct 17, 2024	Quantization	—Unverified
Optimal Quantization for Matrix Multiplication	Oct 17, 2024	Quantization	CodeCode Available
Harnessing Your DRAM and SSD for Sustainable and Accessible LLM Inference with Mixed-Precision and Multi-level Caching	Oct 17, 2024	GPUQuantization	—Unverified
A Unified View of Delta Parameter Editing in Post-Trained Large-Scale Models	Oct 17, 2024	Quantization	—Unverified
DART: Disentanglement of Accent and Speaker Representation in Multispeaker Text-to-Speech	Oct 17, 2024	DisentanglementQuantization	—Unverified
COMET: Towards Partical W4A4KV4 LLMs Serving	Oct 16, 2024	QuantizationScheduling	—Unverified
ERVQ: Enhanced Residual Vector Quantization with Intra-and-Inter-Codebook Optimization for Neural Audio Codecs	Oct 16, 2024	DiversityOnline Clustering	—Unverified
Channel-Wise Mixed-Precision Quantization for Large Language Models	Oct 16, 2024	Quantization	—Unverified
FairGLVQ: Fairness in Partition-Based Classification	Oct 16, 2024	ClassificationFairness	CodeCode Available
DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMs	Oct 16, 2024	Quantization	CodeCode Available
QSpec: Speculative Decoding with Complementary Quantization Schemes	Oct 15, 2024	Quantization	—Unverified
Efficiera Residual Networks: Hardware-Friendly Fully Binary Weight with 2-bit Activation Model Achieves Practical ImageNet Accuracy	Oct 15, 2024	BinarizationClassification with Binary Weight Network	CodeCode Available

Show:10 25 50

← PrevPage 65 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified