Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1650 of 4925 papers

Title	Date	Tasks	Status
Pyramid Vector Quantization for LLMs	Oct 22, 2024	Quantization	—Unverified
Self-calibration for Language Model Quantization and Pruning	Oct 22, 2024	Language ModelingLanguage Modelling	—Unverified
Can General-Purpose Large Language Models Generalize to English-Thai Machine Translation ?	Oct 22, 2024	Machine TranslationQuantization	—Unverified
Continuous Speech Synthesis using per-token Latent Diffusion	Oct 21, 2024	Image GenerationQuantization	—Unverified
Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces	Oct 21, 2024	Continual LearningLifelong learning	—Unverified
LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec	Oct 21, 2024	DisentanglementLanguage Modeling	—Unverified
Large Deviation Upper Bounds and Improved MSE Rates of Nonlinear SGD: Heavy-tailed Noise and Power of Symmetry	Oct 21, 2024	Quantization	—Unverified
SDP4Bit: Toward 4-bit Communication Quantization in Sharded Data Parallelism for LLM Training	Oct 20, 2024	Quantization	—Unverified
Lossless KV Cache Compression to 2%	Oct 20, 2024	Dimensionality ReductionQuantization	—Unverified
Understanding the Difficulty of Low-Precision Post-Training Quantization for LLMs	Oct 18, 2024	Quantization	—Unverified
Evaluating Quantized Large Language Models for Code Generation on Low-Resource Language Benchmarks	Oct 18, 2024	Code GenerationGPU	CodeCode Available
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations	Oct 17, 2024	DecoderQuantization	—Unverified
Nonlinear Stochastic Gradient Descent and Heavy-tailed Noise: A Unified Framework and High-probability Guarantees	Oct 17, 2024	Quantization	—Unverified
Harnessing Your DRAM and SSD for Sustainable and Accessible LLM Inference with Mixed-Precision and Multi-level Caching	Oct 17, 2024	GPUQuantization	—Unverified
Progressive Mixed-Precision Decoding for Efficient LLM Inference	Oct 17, 2024	Quantization	—Unverified
A Unified View of Delta Parameter Editing in Post-Trained Large-Scale Models	Oct 17, 2024	Quantization	—Unverified
Optimal Quantization for Matrix Multiplication	Oct 17, 2024	Quantization	CodeCode Available
DART: Disentanglement of Accent and Speaker Representation in Multispeaker Text-to-Speech	Oct 17, 2024	DisentanglementQuantization	—Unverified
COMET: Towards Partical W4A4KV4 LLMs Serving	Oct 16, 2024	QuantizationScheduling	—Unverified
ERVQ: Enhanced Residual Vector Quantization with Intra-and-Inter-Codebook Optimization for Neural Audio Codecs	Oct 16, 2024	DiversityOnline Clustering	—Unverified
Channel-Wise Mixed-Precision Quantization for Large Language Models	Oct 16, 2024	Quantization	—Unverified
FairGLVQ: Fairness in Partition-Based Classification	Oct 16, 2024	ClassificationFairness	CodeCode Available
DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMs	Oct 16, 2024	Quantization	CodeCode Available
QSpec: Speculative Decoding with Complementary Quantization Schemes	Oct 15, 2024	Quantization	—Unverified
Efficiera Residual Networks: Hardware-Friendly Fully Binary Weight with 2-bit Activation Model Achieves Practical ImageNet Accuracy	Oct 15, 2024	BinarizationClassification with Binary Weight Network	CodeCode Available
Scaling Laws for Post Training Quantized Large Language Models	Oct 15, 2024	Quantization	—Unverified
Real-Time Stress Detection via Photoplethysmogram Signals: Implementation of a Combined Continuous Wavelet Transform and Convolutional Neural Network on Resource-Constrained Microcontrollers	Oct 14, 2024	Quantization	—Unverified
SLaNC: Static LayerNorm Calibration	Oct 14, 2024	Quantization	—Unverified
Gaussian Mixture Vector Quantization with Aggregated Categorical Posterior	Oct 14, 2024	Quantization	—Unverified
GALA: Geometry-Aware Local Adaptive Grids for Detailed 3D Generation	Oct 13, 2024	3D GenerationQuantization	—Unverified
Gradient-Free Neural Network Training on the Edge	Oct 13, 2024	Quantization	—Unverified
PrivQuant: Communication-Efficient Private Inference with Quantized Network/Protocol Co-Optimization	Oct 12, 2024	Quantization	—Unverified
ZipVL: Efficient Large Vision-Language Models with Dynamic Token Sparsification	Oct 11, 2024	MMEQuantization	—Unverified
QEFT: Quantization for Efficient Fine-Tuning of LLMs	Oct 11, 2024	parameter-efficient fine-tuningQuantization	CodeCode Available
DeltaDQ: Ultra-High Delta Compression for Fine-Tuned LLMs via Group-wise Dropout and Separate Quantization	Oct 11, 2024	DiversityQuantization	—Unverified
Scalable Representation Learning for Multimodal Tabular Transactions	Oct 10, 2024	DecoderQuantization	—Unverified
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning	Oct 10, 2024	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available
M^2-ViT: Accelerating Hybrid Vision Transformers with Two-Level Mixed Quantization	Oct 10, 2024	Efficient ViTsQuantization	—Unverified
MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion	Oct 10, 2024	Denoisingparameter-efficient fine-tuning	CodeCode Available
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation	Oct 10, 2024	DenoisingImage Generation	—Unverified
CrossQuant: A Post-Training Quantization Method with Smaller Quantization Kernel for Precise Large Language Model Compression	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
Perceptual Quality Assessment of Trisoup-Lifting Encoded 3D Point Clouds	Oct 9, 2024	Point Cloud Quality AssessmentQuantization	CodeCode Available
QuAILoRA: Quantization-Aware Initialization for LoRA	Oct 9, 2024	Causal Language ModelingGPU	—Unverified
Scaling Laws for Mixed quantization in Large Language Models	Oct 9, 2024	Quantization	—Unverified
JPEG Inspired Deep Learning	Oct 9, 2024	Deep LearningFine-Grained Image Classification	CodeCode Available
Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression	Oct 8, 2024	Quantizationregression	—Unverified
Gesture2Text: A Generalizable Decoder for Word-Gesture Keyboards in XR Through Trajectory Coarse Discretization and Pre-training	Oct 8, 2024	DecoderQuantization	—Unverified
Accelerating Error Correction Code Transformers	Oct 8, 2024	Quantization	CodeCode Available
QERA: an Analytical Framework for Quantization Error Reconstruction	Oct 8, 2024	parameter-efficient fine-tuningQuantization	—Unverified
Variable Bitrate Residual Vector Quantization for Audio Coding	Oct 8, 2024	Audio CompressionQuantization	—Unverified

Show:10 25 50

← PrevPage 33 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified