Image Classification

Image Classification is a fundamental task in vision recognition that aims to understand and categorize an image as a whole under a specific label. Unlike object detection, which involves classification and location of multiple objects within an image, image classification typically pertains to single-object images. When the classification becomes highly detailed or reaches instance-level, it is often referred to as image retrieval, which also involves finding similar images in a large database.

Source: Metamorphic Testing for Object Detection Systems

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 10419 papers

Title	Date	Tasks	Status	Hype
MogaNet: Multi-order Gated Aggregation Network	Nov 7, 2022	3D Human Pose EstimationImage Classification	CodeCode Available	2
WITT: A Wireless Image Transmission Transformer for Semantic Communications	Nov 2, 2022	image-classificationImage Classification	CodeCode Available	2
CroCo: Self-Supervised Pre-training for 3D Vision Tasks by Cross-View Completion	Oct 19, 2022	Camera Pose EstimationDepth Estimation	CodeCode Available	2
The Equalization Losses: Gradient-Driven Training for Long-tailed Object Recognition	Oct 11, 2022	image-classificationImage Classification	CodeCode Available	2
MobileViTv3: Mobile-Friendly Vision Transformer with Simple and Effective Fusion of Local, Global and Input Features	Sep 30, 2022	Image Classification	CodeCode Available	2
Spikformer: When Spiking Neural Network Meets Transformer	Sep 29, 2022	image-classificationImage Classification	CodeCode Available	2
Dilated Neighborhood Attention Transformer	Sep 29, 2022	Image ClassificationInstance Segmentation	CodeCode Available	2
Generalized Parametric Contrastive Learning	Sep 26, 2022	Contrastive LearningDomain Generalization	CodeCode Available	2
Mega: Moving Average Equipped Gated Attention	Sep 21, 2022	Image ClassificationInductive Bias	CodeCode Available	2
HiFuse: Hierarchical Multi-Scale Feature Fusion Network for Medical Image Classification	Sep 21, 2022	Classificationimage-classification	CodeCode Available	2
Test-Time Prompt Tuning for Zero-Shot Generalization in Vision-Language Models	Sep 15, 2022	image-classificationImage Classification	CodeCode Available	2
What does a platypus look like? Generating customized prompts for zero-shot image classification	Sep 7, 2022	Descriptiveimage-classification	CodeCode Available	2
No More Strided Convolutions or Pooling: A New CNN Building Block for Low-Resolution Images and Small Objects	Aug 7, 2022	image-classificationImage Classification	CodeCode Available	2
HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions	Jul 28, 2022	Image ClassificationObject Detection	CodeCode Available	2
ALBench: A Framework for Evaluating Active Learning in Object Detection	Jul 27, 2022	Active Learningimage-classification	CodeCode Available	2
Current Trends in Deep Learning for Earth Observation: An Open-source Benchmark Arena for Image Classification	Jul 14, 2022	ClassificationEarth Observation	CodeCode Available	2
Next-ViT: Next Generation Vision Transformer for Efficient Deployment in Realistic Industrial Scenarios	Jul 12, 2022	Image Classification	CodeCode Available	2
Wave-ViT: Unifying Wavelet and Transformers for Visual Representation Learning	Jul 11, 2022	Image ClassificationInstance Segmentation	CodeCode Available	2
Shifts 2.0: Extending The Dataset of Real Distributional Shifts	Jun 30, 2022	Autonomous Drivingimage-classification	CodeCode Available	2
EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for Mobile Vision Applications	Jun 21, 2022	Image ClassificationObject Detection	CodeCode Available	2
Global Context Vision Transformers	Jun 20, 2022	image-classificationImage Classification	CodeCode Available	2
Neural Prompt Search	Jun 9, 2022	Few-Shot LearningImage Classification	CodeCode Available	2
Uni-Perceiver-MoE: Learning Sparse Generalist Models with Conditional MoEs	Jun 9, 2022	Image CaptioningImage Classification	CodeCode Available	2
MobileOne: An Improved One millisecond Mobile Backbone	Jun 8, 2022	Efficient Neural NetworkGaze Estimation	CodeCode Available	2
GIT: A Generative Image-to-text Transformer for Vision and Language	May 27, 2022	DecoderImage Captioning	CodeCode Available	2
Contrastive Learning Rivals Masked Image Modeling in Fine-tuning via Feature Distillation	May 27, 2022	Contrastive Learningimage-classification	CodeCode Available	2
Matryoshka Representation Learning	May 26, 2022	4kImage Classification	CodeCode Available	2
Fast Vision Transformers with HiLo Attention	May 26, 2022	BenchmarkingEfficient ViTs	CodeCode Available	2
Inception Transformer	May 25, 2022	image-classificationImage Classification	CodeCode Available	2
ConvMAE: Masked Convolution Meets Masked Autoencoders	May 8, 2022	Computational Efficiencyimage-classification	CodeCode Available	2
Masked Generative Distillation	May 3, 2022	image-classificationImage Classification	CodeCode Available	2
Deep PCB To COCO Convertor	May 1, 2022	ClassificationData Augmentation	CodeCode Available	2
CLIP-Art: Contrastive Pre-training for Fine-Grained Art Classification	Apr 29, 2022	AttributeClassification	CodeCode Available	2
Understanding The Robustness in Vision Transformers	Apr 26, 2022	Domain GeneralizationImage Classification	CodeCode Available	2
K-LITE: Learning Transferable Visual Models with External Knowledge	Apr 20, 2022	BenchmarkingDescriptive	CodeCode Available	2
Neighborhood Attention Transformer	Apr 14, 2022	image-classificationImage Classification	CodeCode Available	2
Masked Siamese Networks for Label-Efficient Learning	Apr 14, 2022	image-classificationImage Classification	CodeCode Available	2
DaViT: Dual Attention Vision Transformers	Apr 7, 2022	Computational EfficiencyImage Classification	CodeCode Available	2
Solving ImageNet: a Unified Scheme for Training any Backbone to Top Results	Apr 7, 2022	Image ClassificationKnowledge Distillation	CodeCode Available	2
Unified Contrastive Learning in Image-Text-Label Space	Apr 7, 2022	Contrastive Learningimage-classification	CodeCode Available	2
Rethinking Visual Geo-localization for Large-Scale Applications	Apr 5, 2022	Contrastive Learninggeo-localization	CodeCode Available	2
BatchFormerV2: Exploring Sample Relationships for Dense Representation Learning	Apr 4, 2022	image-classificationImage Classification	CodeCode Available	2
MultiMAE: Multi-modal Multi-task Masked Autoencoders	Apr 4, 2022	Depth Estimationimage-classification	CodeCode Available	2
Contrastive learning of Class-agnostic Activation Map for Weakly Supervised Object Localization and Semantic Segmentation	Mar 25, 2022	Contrastive Learningimage-classification	CodeCode Available	2
Focal Modulation Networks	Mar 22, 2022	image-classificationImage Classification	CodeCode Available	2
Decoupled Knowledge Distillation	Mar 16, 2022	image-classificationImage Classification	CodeCode Available	2
Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs	Mar 13, 2022	Image Classification	CodeCode Available	2
QDrop: Randomly Dropping Quantization for Extremely Low-bit Post-Training Quantization	Mar 11, 2022	image-classificationImage Classification	CodeCode Available	2
Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time	Mar 10, 2022	Domain Generalization	CodeCode Available	2
ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer	Mar 8, 2022	Image Classificationobject-detection	CodeCode Available	2

Show:10 25 50

← PrevPage 5 of 209Next →

All datasets ImageNet CIFAR-10 CIFAR-100 STL-10 ObjectNet MNIST SVHN iNaturalist 2018 ImageNet ReaL Flowers-102 Clothing1M mini WebVision 1.0

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CoCa (finetuned)	Top 1 Accuracy	91	—	Unverified
2	Model soups (BASIC-L)	Top 1 Accuracy	90.98	—	Unverified
3	Model soups (ViT-G/14)	Top 1 Accuracy	90.94	—	Unverified
4	DaViT-G	Top 1 Accuracy	90.4	—	Unverified
5	Meta Pseudo Labels (EfficientNet-L2)	Top 1 Accuracy	90.2	—	Unverified
6	DaViT-H	Top 1 Accuracy	90.2	—	Unverified
7	SwinV2-G	Top 1 Accuracy	90.17	—	Unverified
8	MAWS (ViT-6.5B)	Top 1 Accuracy	90.1	—	Unverified
9	Florence-CoSwin-H	Top 1 Accuracy	90.05	—	Unverified
10	RevCol-H	Top 1 Accuracy	90	—	Unverified