Image Classification

Image Classification is a fundamental task in vision recognition that aims to understand and categorize an image as a whole under a specific label. Unlike object detection, which involves classification and location of multiple objects within an image, image classification typically pertains to single-object images. When the classification becomes highly detailed or reaches instance-level, it is often referred to as image retrieval, which also involves finding similar images in a large database.

Source: Metamorphic Testing for Object Detection Systems

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 10419 papers

Title	Date	Tasks	Status	Hype
Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion	Feb 6, 2025	image-classificationImage Classification	CodeCode Available	2
LWGANet: A Lightweight Group Attention Backbone for Remote Sensing Visual Tasks	Jan 17, 2025	Change DetectionImage Classification	CodeCode Available	2
Practical Continual Forgetting for Pre-trained Vision Models	Jan 16, 2025	Continual ForgettingFace Recognition	CodeCode Available	2
Parameter-Inverted Image Pyramid Networks for Visual Perception and Multimodal Understanding	Jan 14, 2025	image-classificationImage Classification	CodeCode Available	2
TakuNet: an Energy-Efficient CNN for Real-Time Inference on Embedded UAV systems in Emergency Response Scenarios	Jan 10, 2025	Aerial Scene ClassificationCPU	CodeCode Available	2
MambaHSI: Spatial-Spectral Mamba for Hyperspectral Image Classification	Jan 9, 2025	ClassificationHyperspectral Image Classification	CodeCode Available	2
FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning	Dec 16, 2024	DeepFake Detectiondiffusion-generated faces detection	CodeCode Available	2
Wasserstein Distance Rivals Kullback-Leibler Divergence for Knowledge Distillation	Dec 11, 2024	image-classificationImage Classification	CodeCode Available	2
2DMamba: Efficient State Space Model for Image Representation with Applications on Giga-Pixel Whole Slide Image Classification	Dec 1, 2024	Computational Efficiencyimage-classification	CodeCode Available	2
TinyViM: Frequency Decoupling for Tiny Hybrid Vision Mamba	Nov 26, 2024	image-classificationImage Classification	CodeCode Available	2
Task Singular Vectors: Reducing Task Interference in Model Merging	Nov 26, 2024	ClassificationImage Classification	CodeCode Available	2
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality	Nov 22, 2024	Efficient Neural NetworkImage Classification	CodeCode Available	2
BiomedCoOp: Learning to Prompt for Biomedical Vision-Language Models	Nov 21, 2024	image-classificationImage Classification	CodeCode Available	2
ScaleKD: Strong Vision Transformers Could Be Excellent Teachers	Nov 11, 2024	image-classificationImage Classification	CodeCode Available	2
Frontiers in Intelligent Colonoscopy	Oct 22, 2024	Image Captioning	CodeCode Available	2
Spatial-Mamba: Effective Visual State Space Models via Structure-Aware State Fusion	Oct 19, 2024	image-classificationImage Classification	CodeCode Available	2
CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling	Sep 28, 2024	image-classificationImage Classification	CodeCode Available	2
One missing piece in Vision and Language: A Survey on Comics Understanding	Sep 14, 2024	document understandingimage-classification	CodeCode Available	2
A Survey on Mixup Augmentations and Beyond	Sep 8, 2024	Image ClassificationSelf-Supervised Learning	CodeCode Available	2
PlantSeg: A Large-Scale In-the-wild Dataset for Plant Disease Segmentation	Sep 6, 2024	Benchmarkingimage-classification	CodeCode Available	2
The AdEMAMix Optimizer: Better, Faster, Older	Sep 5, 2024	image-classificationImage Classification	CodeCode Available	2
3D-RCNet: Learning from Transformer to Build a 3D Relational ConvNet for Hyperspectral Image Classification	Aug 25, 2024	Computational EfficiencyHyperspectral Image Classification	CodeCode Available	2
HAIR: Hypernetworks-based All-in-One Image Restoration	Aug 15, 2024	5-Degradation Blind All-in-One Image RestorationAll	CodeCode Available	2
SLCA++: Unleash the Power of Sequential Fine-tuning for Continual Learning with Pre-training	Aug 15, 2024	Continual Learningimage-classification	CodeCode Available	2
CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications	Aug 7, 2024	image-classificationImage Classification	CodeCode Available	2
VSSD: Vision Mamba with Non-Causal State Space Duality	Jul 26, 2024	image-classificationImage Classification	CodeCode Available	2
LoRA-Pro: Are Low-Rank Adapters Properly Optimized?	Jul 25, 2024	Code GenerationComputational Efficiency	CodeCode Available	2
GroupMamba: Efficient Group-Based Visual State Space Model	Jul 18, 2024	image-classificationImage Classification	CodeCode Available	2
DataDream: Few-shot Guided Dataset Generation	Jul 15, 2024	ClassificationDataset Generation	CodeCode Available	2
AWT: Transferring Vision-Language Models via Augmentation, Weighting, and Transportation	Jul 5, 2024	Action RecognitionFew-Shot Image Classification	CodeCode Available	2
DGR-MIL: Exploring Diverse Global Representation in Multiple Instance Learning for Whole Slide Image Classification	Jul 4, 2024	DescriptiveDiversity	CodeCode Available	2
GalLoP: Learning Global and Local Prompts for Vision-Language Models	Jul 1, 2024	DiversityDomain Generalization	CodeCode Available	2
PathGen-1.6M: 1.6 Million Pathology Image-text Pairs Generation through Multi-agent Collaboration	Jun 28, 2024	image-classificationImage Classification	CodeCode Available	2
Mitigate the Gap: Investigating Approaches for Improving Cross-Modal Alignment in CLIP	Jun 25, 2024	cross-modal alignmentImage Classification	CodeCode Available	2
TorchSpatial: A Location Encoding Framework and Benchmark for Spatial Representation Learning	Jun 21, 2024	FairnessGeographic Question Answering	CodeCode Available	2
WATT: Weight Average Test-Time Adaptation of CLIP	Jun 19, 2024	image-classificationImage Classification	CodeCode Available	2
AEM: Attention Entropy Maximization for Multiple Instance Learning based Whole Slide Image Classification	Jun 18, 2024	Diversityimage-classification	CodeCode Available	2
Scaling the Codebook Size of VQGAN to 100,000 with a Utilization Rate of 99%	Jun 17, 2024	image-classificationImage Classification	CodeCode Available	2
Unveiling the Power of Wavelets: A Wavelet-based Kolmogorov-Arnold Network for Hyperspectral Image Classification	Jun 12, 2024	Hyperspectral Image Classificationimage-classification	CodeCode Available	2
Parameter-Inverted Image Pyramid Networks	Jun 6, 2024	Computational Efficiencyimage-classification	CodeCode Available	2
GrootVL: Tree Topology is All You Need in State Space Model	Jun 4, 2024	Allimage-classification	CodeCode Available	2
Why are Visually-Grounded Language Models Bad at Image Classification?	May 28, 2024	Classificationimage-classification	CodeCode Available	2
AdaFisher: Adaptive Second Order Optimization via Fisher Information	May 26, 2024	Computational Efficiencyimage-classification	CodeCode Available	2
Accelerating Transformers with Spectrum-Preserving Token Merging	May 25, 2024	image-classificationImage Classification	CodeCode Available	2
Advancing Spiking Neural Networks for Sequential Modeling with Central Pattern Generators	May 23, 2024	image-classificationImage Classification	CodeCode Available	2
EMR-Merging: Tuning-Free High-Performance Model Merging	May 23, 2024	Image ClassificationImage Retrieval	CodeCode Available	2
Mamba-in-Mamba: Centralized Mamba-Cross-Scan in Tokenized Mamba Model for Hyperspectral Image Classification	May 20, 2024	Hyperspectral Image Classificationimage-classification	CodeCode Available	2
SLAB: Efficient Transformers with Simplified Linear Attention and Progressive Re-parameterized Batch Normalization	May 19, 2024	image-classificationImage Classification	CodeCode Available	2
Many-Shot In-Context Learning in Multimodal Foundation Models	May 16, 2024	image-classificationImage Classification	CodeCode Available	2
GreedyViG: Dynamic Axial Graph Construction for Efficient Vision GNNs	May 10, 2024	graph constructionimage-classification	CodeCode Available	2

Show:10 25 50

← PrevPage 3 of 209Next →

All datasets ImageNet CIFAR-10 CIFAR-100 STL-10 ObjectNet MNIST SVHN iNaturalist 2018 ImageNet ReaL Flowers-102 Clothing1M mini WebVision 1.0

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CoCa (finetuned)	Top 1 Accuracy	91	—	Unverified
2	Model soups (BASIC-L)	Top 1 Accuracy	90.98	—	Unverified
3	Model soups (ViT-G/14)	Top 1 Accuracy	90.94	—	Unverified
4	DaViT-G	Top 1 Accuracy	90.4	—	Unverified
5	DaViT-H	Top 1 Accuracy	90.2	—	Unverified
6	Meta Pseudo Labels (EfficientNet-L2)	Top 1 Accuracy	90.2	—	Unverified
7	SwinV2-G	Top 1 Accuracy	90.17	—	Unverified
8	MAWS (ViT-6.5B)	Top 1 Accuracy	90.1	—	Unverified
9	Florence-CoSwin-H	Top 1 Accuracy	90.05	—	Unverified
10	Meta Pseudo Labels (EfficientNet-B6-Wide)	Top 1 Accuracy	90	—	Unverified