Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 4925 papers

Title	Date	Tasks	Status	Hype
Bridging the Modality Gap: Softly Discretizing Audio Representation for LLM-based Automatic Speech Recognition	Jun 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
EdgeProfiler: A Fast Profiling Framework for Lightweight LLMs on Edge Using Analytical Model	Jun 6, 2025	Natural Language UnderstandingQuantization	CodeCode Available	0
RecGPT: A Foundation Model for Sequential Recommendation	Jun 6, 2025	Decodermodel	CodeCode Available	2
BEAST: Efficient Tokenization of B-Splines Encoded Action Sequences for Imitation Learning	Jun 6, 2025	continuous-controlContinuous Control	—Unverified	0
PCDVQ: Enhancing Vector Quantization for Large Language Models via Polar Coordinate Decoupling	Jun 5, 2025	ClusteringQuantization	—Unverified	0
Massive MIMO with 1-Bit DACs: Data Detection for Quantized Linear Precoding with Dithering	Jun 5, 2025	Quantization	—Unverified	0
Kernel k-Medoids as General Vector Quantization	Jun 5, 2025	Data CompressionDensity Estimation	—Unverified	0
FPTQuant: Function-Preserving Transforms for LLM Quantization	Jun 5, 2025	Quantization	—Unverified	0
TaDA: Training-free recipe for Decoding with Adaptive KV Cache Compression and Mean-centering	Jun 5, 2025	Quantization	—Unverified	0
FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion	Jun 5, 2025	DenoisingQuantization	—Unverified	0
Nonlinear Sparse Bayesian Learning Methods with Application to Massive MIMO Channel Estimation with Hardware Impairments	Jun 4, 2025	Quantization	—Unverified	0
BitTTS: Highly Compact Text-to-Speech Using 1.58-bit Quantization and Weight Indexing	Jun 4, 2025	Quantizationtext-to-speech	—Unverified	0
STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization	Jun 4, 2025	Action GenerationQuantization	CodeCode Available	0
MUC-G4: Minimal Unsat Core-Guided Incremental Verification for Deep Neural Network Compression	Jun 3, 2025	Neural Network CompressionQuantization	—Unverified	0
Quantized Dissipative Uncertain Model for Fractional T_S Fuzzy systems with Time_Varying Delays Under Networked Control System	Jun 3, 2025	Quantization	—Unverified	0
Enhancing Convergence, Privacy and Fairness for Wireless Personalized Federated Learning: Quantization-Assisted Min-Max Fair Scheduling	Jun 3, 2025	FairnessFederated Learning	—Unverified	0
Flexible Mixed Precision Quantization for Learned Image Compression	Jun 2, 2025	Image CompressionQuantization	CodeCode Available	0
Structured Pruning and Quantization for Learned Image Compression	Jun 2, 2025	image-classificationImage Classification	CodeCode Available	0
Quantitative Error Feedback for Quantization Noise Reduction of Filtering over Graphs	Jun 2, 2025	Quantization	—Unverified	0
Parameter Efficient Fine Tuning Llama 3.1 for Answering Arabic Legal Questions: A Case Study on Jordanian Laws	Jun 2, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Enhancing Speech Emotion Recognition with Graph-Based Multimodal Fusion and Prosodic Features for the Speech Emotion Recognition in Naturalistic Conditions Challenge at Interspeech 2025	Jun 2, 2025	Audio TaggingEmotion Recognition	—Unverified	0
CLAP-ART: Automated Audio Captioning with Semantic-rich Audio Representation Tokenizer	Jun 1, 2025	Audio captioningLanguage Modeling	—Unverified	0
Quantization-based Bounds on the Wasserstein Metric	Jun 1, 2025	Computational EfficiencyDomain Adaptation	—Unverified	0
Power-of-Two (PoT) Weights in Large Language Models (LLMs)	May 31, 2025	Quantization	—Unverified	0
LittleBit: Ultra Low-Bit Quantization via Latent Factorization	May 30, 2025	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 4 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified