Image Classification

Image Classification is a fundamental task in vision recognition that aims to understand and categorize an image as a whole under a specific label. Unlike object detection, which involves classification and location of multiple objects within an image, image classification typically pertains to single-object images. When the classification becomes highly detailed or reaches instance-level, it is often referred to as image retrieval, which also involves finding similar images in a large database.

Source: Metamorphic Testing for Object Detection Systems

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 10419 papers

Title	Date	Tasks	Status	Hype
Effective Data Augmentation With Diffusion Models	Feb 7, 2023	Data AugmentationDiversity	CodeCode Available	2
Medical Image Classification with KAN-Integrated Transformers and Dilated Neighborhood Attention	Feb 19, 2025	image-classificationImage Classification	CodeCode Available	2
MedViT: A Robust Vision Transformer for Generalized Medical Image Classification	Feb 19, 2023	image-classificationImage Classification	CodeCode Available	2
Attention Mechanisms in Computer Vision: A Survey	Nov 15, 2021	image-classificationImage Classification	CodeCode Available	2
MetaFormer: A Unified Meta Framework for Fine-Grained Recognition	Mar 5, 2022	AttributeFine-Grained Image Classification	CodeCode Available	2
MogaNet: Multi-order Gated Aggregation Network	Nov 7, 2022	3D Human Pose EstimationImage Classification	CodeCode Available	2
Agent Attention: On the Integration of Softmax and Linear Attention	Dec 14, 2023	Computational Efficiencyimage-classification	CodeCode Available	2
Accelerating Transformers with Spectrum-Preserving Token Merging	May 25, 2024	image-classificationImage Classification	CodeCode Available	2
ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks	Oct 8, 2019	Dimensionality Reductionimage-classification	CodeCode Available	2
Dilated Neighborhood Attention Transformer	Sep 29, 2022	Image ClassificationInstance Segmentation	CodeCode Available	2
ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer	Mar 8, 2022	Image Classificationobject-detection	CodeCode Available	2
Efficient Multi-Scale Attention Module with Cross-Spatial Learning	May 23, 2023	Dimensionality Reductionimage-classification	CodeCode Available	2
DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs	Mar 28, 2024	Fine-Grained Image ClassificationImage Classification	CodeCode Available	2
Med-MoE: Mixture of Domain-Specific Experts for Lightweight Medical Vision-Language Models	Apr 16, 2024	image-classificationImage Classification	CodeCode Available	2
DEYO: DETR with YOLO for End-to-End Object Detection	Feb 26, 2024	DecoderGPU	CodeCode Available	2
Class-Incremental Learning: A Survey	Feb 7, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	2
Decoupled Knowledge Distillation	Mar 16, 2022	image-classificationImage Classification	CodeCode Available	2
AutoFormer: Searching Transformers for Visual Recognition	Jul 1, 2021	AutoMLFine-Grained Image Classification	CodeCode Available	2
Multi-Representation Adaptation Network for Cross-domain Image Classification	Jan 4, 2022	ClassificationDomain Adaptation	CodeCode Available	2
Neighborhood Attention Transformer	Apr 14, 2022	image-classificationImage Classification	CodeCode Available	2
Next-ViT: Next Generation Vision Transformer for Efficient Deployment in Realistic Industrial Scenarios	Jul 12, 2022	Image Classification	CodeCode Available	2
NodeFormer: A Scalable Graph Structure Learning Transformer for Node Classification	Jun 14, 2023	Graph structure learningimage-classification	CodeCode Available	2
Deep PCB To COCO Convertor	May 1, 2022	ClassificationData Augmentation	CodeCode Available	2
DAT++: Spatially Dynamic Vision Transformer with Deformable Attention	Sep 4, 2023	Image ClassificationInstance Segmentation	CodeCode Available	2
AWT: Transferring Vision-Language Models via Augmentation, Weighting, and Transportation	Jul 5, 2024	Action RecognitionFew-Shot Image Classification	CodeCode Available	2
Aligning Domain-specific Distribution and Classifier for Cross-domain Classification from Multiple Sources	Jan 4, 2022	Domain Adaptationdomain classification	CodeCode Available	2
Parameter-Efficient Fine-Tuning with Discrete Fourier Transform	May 5, 2024	image-classificationImage Classification	CodeCode Available	2
Parameter-Inverted Image Pyramid Networks	Jun 6, 2024	Computational Efficiencyimage-classification	CodeCode Available	2
DaViT: Dual Attention Vision Transformers	Apr 7, 2022	Computational EfficiencyImage Classification	CodeCode Available	2
DGR-MIL: Exploring Diverse Global Representation in Multiple Instance Learning for Whole Slide Image Classification	Jul 4, 2024	DescriptiveDiversity	CodeCode Available	2
BatchFormerV2: Exploring Sample Relationships for Dense Representation Learning	Apr 4, 2022	image-classificationImage Classification	CodeCode Available	2
PlantSeg: A Large-Scale In-the-wild Dataset for Plant Disease Segmentation	Sep 6, 2024	Benchmarkingimage-classification	CodeCode Available	2
Practical Continual Forgetting for Pre-trained Vision Models	Jan 16, 2025	Continual ForgettingFace Recognition	CodeCode Available	2
Prompt Pre-Training with Twenty-Thousand Classes for Open-Vocabulary Visual Recognition	Apr 10, 2023	image-classificationImage Classification	CodeCode Available	2
Current Trends in Deep Learning for Earth Observation: An Open-source Benchmark Arena for Image Classification	Jul 14, 2022	ClassificationEarth Observation	CodeCode Available	2
RandAugment: Practical automated data augmentation with a reduced search space	Sep 30, 2019	Data AugmentationDomain Generalization	CodeCode Available	2
CrypTen: Secure Multi-Party Computation Meets Machine Learning	Sep 2, 2021	BIG-bench Machine LearningGPU	CodeCode Available	2
RemoteCLIP: A Vision Language Foundation Model for Remote Sensing	Jun 19, 2023	ClassificationCross-Modal Retrieval	CodeCode Available	2
CrossFormer++: A Versatile Vision Transformer Hinging on Cross-scale Attention	Mar 13, 2023	image-classificationImage Classification	CodeCode Available	2
Revisiting Unreasonable Effectiveness of Data in Deep Learning Era	Jul 10, 2017	Deep Learningimage-classification	CodeCode Available	2
Advancing Spiking Neural Networks for Sequential Modeling with Central Pattern Generators	May 23, 2024	image-classificationImage Classification	CodeCode Available	2
Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion	Feb 6, 2025	image-classificationImage Classification	CodeCode Available	2
Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks	May 5, 2021	image-classificationImage Classification	CodeCode Available	2
ScaleKD: Strong Vision Transformers Could Be Excellent Teachers	Nov 11, 2024	image-classificationImage Classification	CodeCode Available	2
Beyond Image Super-Resolution for Image Recognition with Task-Driven Perceptual Loss	Apr 2, 2024	image-classificationImage Classification	CodeCode Available	2
DAMamba: Vision State Space Model with Dynamic Adaptive Scan	Feb 18, 2025	image-classificationImage Classification	CodeCode Available	2
Contrastive Learning Rivals Masked Image Modeling in Fine-tuning via Feature Distillation	May 27, 2022	Contrastive Learningimage-classification	CodeCode Available	2
ConvMAE: Masked Convolution Meets Masked Autoencoders	May 8, 2022	Computational Efficiencyimage-classification	CodeCode Available	2
Continual Forgetting for Pre-trained Vision Models	Mar 18, 2024	Continual ForgettingFace Recognition	CodeCode Available	2
AEM: Attention Entropy Maximization for Multiple Instance Learning based Whole Slide Image Classification	Jun 18, 2024	Diversityimage-classification	CodeCode Available	2

Show:10 25 50

← PrevPage 5 of 209Next →

All datasets ImageNet CIFAR-10 CIFAR-100 STL-10 ObjectNet MNIST SVHN iNaturalist 2018 ImageNet ReaL Flowers-102 Clothing1M mini WebVision 1.0

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CoCa (finetuned)	Top 1 Accuracy	91	—	Unverified
2	Model soups (BASIC-L)	Top 1 Accuracy	90.98	—	Unverified
3	Model soups (ViT-G/14)	Top 1 Accuracy	90.94	—	Unverified
4	DaViT-G	Top 1 Accuracy	90.4	—	Unverified
5	Meta Pseudo Labels (EfficientNet-L2)	Top 1 Accuracy	90.2	—	Unverified
6	DaViT-H	Top 1 Accuracy	90.2	—	Unverified
7	SwinV2-G	Top 1 Accuracy	90.17	—	Unverified
8	MAWS (ViT-6.5B)	Top 1 Accuracy	90.1	—	Unverified
9	Florence-CoSwin-H	Top 1 Accuracy	90.05	—	Unverified
10	RevCol-H	Top 1 Accuracy	90	—	Unverified