Image Classification

Image Classification is a fundamental task in vision recognition that aims to understand and categorize an image as a whole under a specific label. Unlike object detection, which involves classification and location of multiple objects within an image, image classification typically pertains to single-object images. When the classification becomes highly detailed or reaches instance-level, it is often referred to as image retrieval, which also involves finding similar images in a large database.

Source: Metamorphic Testing for Object Detection Systems

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 10419 papers

Title	Date	Tasks	Status	Hype
VSSD: Vision Mamba with Non-Causal State Space Duality	Jul 26, 2024	image-classificationImage Classification	CodeCode Available	2
LoRA-Pro: Are Low-Rank Adapters Properly Optimized?	Jul 25, 2024	Code GenerationComputational Efficiency	CodeCode Available	2
GroupMamba: Efficient Group-Based Visual State Space Model	Jul 18, 2024	image-classificationImage Classification	CodeCode Available	2
DataDream: Few-shot Guided Dataset Generation	Jul 15, 2024	ClassificationDataset Generation	CodeCode Available	2
AWT: Transferring Vision-Language Models via Augmentation, Weighting, and Transportation	Jul 5, 2024	Action RecognitionFew-Shot Image Classification	CodeCode Available	2
DGR-MIL: Exploring Diverse Global Representation in Multiple Instance Learning for Whole Slide Image Classification	Jul 4, 2024	DescriptiveDiversity	CodeCode Available	2
GalLoP: Learning Global and Local Prompts for Vision-Language Models	Jul 1, 2024	DiversityDomain Generalization	CodeCode Available	2
PathGen-1.6M: 1.6 Million Pathology Image-text Pairs Generation through Multi-agent Collaboration	Jun 28, 2024	image-classificationImage Classification	CodeCode Available	2
Mitigate the Gap: Investigating Approaches for Improving Cross-Modal Alignment in CLIP	Jun 25, 2024	cross-modal alignmentImage Classification	CodeCode Available	2
TorchSpatial: A Location Encoding Framework and Benchmark for Spatial Representation Learning	Jun 21, 2024	FairnessGeographic Question Answering	CodeCode Available	2
WATT: Weight Average Test-Time Adaptation of CLIP	Jun 19, 2024	image-classificationImage Classification	CodeCode Available	2
AEM: Attention Entropy Maximization for Multiple Instance Learning based Whole Slide Image Classification	Jun 18, 2024	Diversityimage-classification	CodeCode Available	2
Scaling the Codebook Size of VQGAN to 100,000 with a Utilization Rate of 99%	Jun 17, 2024	image-classificationImage Classification	CodeCode Available	2
Unveiling the Power of Wavelets: A Wavelet-based Kolmogorov-Arnold Network for Hyperspectral Image Classification	Jun 12, 2024	Hyperspectral Image Classificationimage-classification	CodeCode Available	2
Parameter-Inverted Image Pyramid Networks	Jun 6, 2024	Computational Efficiencyimage-classification	CodeCode Available	2
GrootVL: Tree Topology is All You Need in State Space Model	Jun 4, 2024	Allimage-classification	CodeCode Available	2
Why are Visually-Grounded Language Models Bad at Image Classification?	May 28, 2024	Classificationimage-classification	CodeCode Available	2
AdaFisher: Adaptive Second Order Optimization via Fisher Information	May 26, 2024	Computational Efficiencyimage-classification	CodeCode Available	2
Accelerating Transformers with Spectrum-Preserving Token Merging	May 25, 2024	image-classificationImage Classification	CodeCode Available	2
Advancing Spiking Neural Networks for Sequential Modeling with Central Pattern Generators	May 23, 2024	image-classificationImage Classification	CodeCode Available	2
EMR-Merging: Tuning-Free High-Performance Model Merging	May 23, 2024	Image ClassificationImage Retrieval	CodeCode Available	2
Mamba-in-Mamba: Centralized Mamba-Cross-Scan in Tokenized Mamba Model for Hyperspectral Image Classification	May 20, 2024	Hyperspectral Image Classificationimage-classification	CodeCode Available	2
SLAB: Efficient Transformers with Simplified Linear Attention and Progressive Re-parameterized Batch Normalization	May 19, 2024	image-classificationImage Classification	CodeCode Available	2
Many-Shot In-Context Learning in Multimodal Foundation Models	May 16, 2024	image-classificationImage Classification	CodeCode Available	2
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs	May 10, 2024	graph constructionimage-classification	CodeCode Available	2

Show:10 25 50

← PrevPage 6 of 417Next →

All datasets ImageNet CIFAR-10 CIFAR-100 STL-10 ObjectNet MNIST SVHN iNaturalist 2018 ImageNet ReaL Flowers-102 Clothing1M mini WebVision 1.0

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CoCa (finetuned)	Top 1 Accuracy	91	—	Unverified
2	Model soups (BASIC-L)	Top 1 Accuracy	90.98	—	Unverified
3	Model soups (ViT-G/14)	Top 1 Accuracy	90.94	—	Unverified
4	DaViT-G	Top 1 Accuracy	90.4	—	Unverified
5	Meta Pseudo Labels (EfficientNet-L2)	Top 1 Accuracy	90.2	—	Unverified
6	DaViT-H	Top 1 Accuracy	90.2	—	Unverified
7	SwinV2-G	Top 1 Accuracy	90.17	—	Unverified
8	MAWS (ViT-6.5B)	Top 1 Accuracy	90.1	—	Unverified
9	Florence-CoSwin-H	Top 1 Accuracy	90.05	—	Unverified
10	RevCol-H	Top 1 Accuracy	90	—	Unverified