Image Classification

Image Classification is a fundamental task in vision recognition that aims to understand and categorize an image as a whole under a specific label. Unlike object detection, which involves classification and location of multiple objects within an image, image classification typically pertains to single-object images. When the classification becomes highly detailed or reaches instance-level, it is often referred to as image retrieval, which also involves finding similar images in a large database.

Source: Metamorphic Testing for Object Detection Systems

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 10419 papers

Title	Date	Tasks	Status	Hype
Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion	Feb 6, 2025	image-classificationImage Classification	CodeCode Available	2
LWGANet: A Lightweight Group Attention Backbone for Remote Sensing Visual Tasks	Jan 17, 2025	Change DetectionImage Classification	CodeCode Available	2
Practical Continual Forgetting for Pre-trained Vision Models	Jan 16, 2025	Continual ForgettingFace Recognition	CodeCode Available	2
Parameter-Inverted Image Pyramid Networks for Visual Perception and Multimodal Understanding	Jan 14, 2025	image-classificationImage Classification	CodeCode Available	2
TakuNet: an Energy-Efficient CNN for Real-Time Inference on Embedded UAV systems in Emergency Response Scenarios	Jan 10, 2025	Aerial Scene ClassificationCPU	CodeCode Available	2
MambaHSI: Spatial-Spectral Mamba for Hyperspectral Image Classification	Jan 9, 2025	ClassificationHyperspectral Image Classification	CodeCode Available	2
FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning	Dec 16, 2024	DeepFake Detectiondiffusion-generated faces detection	CodeCode Available	2
Wasserstein Distance Rivals Kullback-Leibler Divergence for Knowledge Distillation	Dec 11, 2024	image-classificationImage Classification	CodeCode Available	2
2DMamba: Efficient State Space Model for Image Representation with Applications on Giga-Pixel Whole Slide Image Classification	Dec 1, 2024	Computational Efficiencyimage-classification	CodeCode Available	2
Task Singular Vectors: Reducing Task Interference in Model Merging	Nov 26, 2024	ClassificationImage Classification	CodeCode Available	2
TinyViM: Frequency Decoupling for Tiny Hybrid Vision Mamba	Nov 26, 2024	image-classificationImage Classification	CodeCode Available	2
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality	Nov 22, 2024	Efficient Neural NetworkImage Classification	CodeCode Available	2
BiomedCoOp: Learning to Prompt for Biomedical Vision-Language Models	Nov 21, 2024	image-classificationImage Classification	CodeCode Available	2
ScaleKD: Strong Vision Transformers Could Be Excellent Teachers	Nov 11, 2024	image-classificationImage Classification	CodeCode Available	2
Frontiers in Intelligent Colonoscopy	Oct 22, 2024	Image Captioning	CodeCode Available	2
Spatial-Mamba: Effective Visual State Space Models via Structure-Aware State Fusion	Oct 19, 2024	image-classificationImage Classification	CodeCode Available	2
CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling	Sep 28, 2024	image-classificationImage Classification	CodeCode Available	2
One missing piece in Vision and Language: A Survey on Comics Understanding	Sep 14, 2024	document understandingimage-classification	CodeCode Available	2
A Survey on Mixup Augmentations and Beyond	Sep 8, 2024	Image ClassificationSelf-Supervised Learning	CodeCode Available	2
PlantSeg: A Large-Scale In-the-wild Dataset for Plant Disease Segmentation	Sep 6, 2024	Benchmarkingimage-classification	CodeCode Available	2
The AdEMAMix Optimizer: Better, Faster, Older	Sep 5, 2024	image-classificationImage Classification	CodeCode Available	2
3D-RCNet: Learning from Transformer to Build a 3D Relational ConvNet for Hyperspectral Image Classification	Aug 25, 2024	Computational EfficiencyHyperspectral Image Classification	CodeCode Available	2
HAIR: Hypernetworks-based All-in-One Image Restoration	Aug 15, 2024	5-Degradation Blind All-in-One Image RestorationAll	CodeCode Available	2
SLCA++: Unleash the Power of Sequential Fine-tuning for Continual Learning with Pre-training	Aug 15, 2024	Continual Learningimage-classification	CodeCode Available	2
CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications	Aug 7, 2024	image-classificationImage Classification	CodeCode Available	2

Show:10 25 50

← PrevPage 5 of 417Next →

All datasets ImageNet CIFAR-10 CIFAR-100 STL-10 ObjectNet MNIST SVHN iNaturalist 2018 ImageNet ReaL Flowers-102 Clothing1M mini WebVision 1.0

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CoCa (finetuned)	Top 1 Accuracy	91	—	Unverified
2	Model soups (BASIC-L)	Top 1 Accuracy	90.98	—	Unverified
3	Model soups (ViT-G/14)	Top 1 Accuracy	90.94	—	Unverified
4	DaViT-G	Top 1 Accuracy	90.4	—	Unverified
5	DaViT-H	Top 1 Accuracy	90.2	—	Unverified
6	Meta Pseudo Labels (EfficientNet-L2)	Top 1 Accuracy	90.2	—	Unverified
7	SwinV2-G	Top 1 Accuracy	90.17	—	Unverified
8	MAWS (ViT-6.5B)	Top 1 Accuracy	90.1	—	Unverified
9	Florence-CoSwin-H	Top 1 Accuracy	90.05	—	Unverified
10	Meta Pseudo Labels (EfficientNet-B6-Wide)	Top 1 Accuracy	90	—	Unverified