Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–225 of 2042 papers

Title	Date	Tasks	Status	Hype	Score
Learning what and where to attend	May 22, 2018	DiagnosticImage Categorization	CodeCode Available	1	5
Source Data-absent Unsupervised Domain Adaptation through Hypothesis Transfer and Labeling Transfer	Dec 14, 2020	ClassificationDomain Adaptation	CodeCode Available	1	5
AdaNorm: Adaptive Gradient Norm Correction based Optimizer for CNNs	Oct 12, 2022	Object Recognition	CodeCode Available	1	5
Doubly Right Object Recognition: A Why Prompt for Visual Rationales	Dec 12, 2022	Object Recognition	CodeCode Available	1	5
Harmonizing the object recognition strategies of deep neural networks with humans	Nov 8, 2022	ObjectObject Recognition	CodeCode Available	1	5
E2PNet: Event to Point Cloud Registration with Spatio-Temporal Representation Learning	Nov 30, 2023	Image ReconstructionObject Recognition	CodeCode Available	1	5
Benchmarking Multimodal Mathematical Reasoning with Explicit Visual Dependency	Apr 24, 2025	BenchmarkingMath	CodeCode Available	1	5
Empirical Upper Bound, Error Diagnosis and Invariance Analysis of Modern Object Detectors	Apr 5, 2020	Objectobject-detection	CodeCode Available	1	5
EventRPG: Event Data Augmentation with Relevance Propagation Guidance	Mar 14, 2024	Action RecognitionData Augmentation	CodeCode Available	1	5
Implicit Feature Refinement for Instance Segmentation	Dec 9, 2021	Instance SegmentationObject Recognition	CodeCode Available	1	5
Learning Counterfactually Invariant Predictors	Jul 20, 2022	counterfactualObject Recognition	CodeCode Available	1	5
EventCLIP: Adapting CLIP for Event-based Object Recognition	Jun 10, 2023	Few-Shot LearningObject	CodeCode Available	1	5
Equalization Loss for Long-Tailed Object Recognition	Mar 11, 2020	Long-tail LearningObject	CodeCode Available	1	5
EvDistill: Asynchronous Events to End-task Learning via Bidirectional Reconstruction-guided Cross-modal Knowledge Distillation	Nov 24, 2021	Event-based Object SegmentationKnowledge Distillation	CodeCode Available	1	5
Adapting Self-Supervised Vision Transformers by Probing Attention-Conditioned Masking Consistency	Jun 16, 2022	Domain AdaptationObject Recognition	CodeCode Available	1	5
Evolving Deep Neural Networks	Mar 1, 2017	Deep LearningImage Captioning	CodeCode Available	1	5
Expanding Event Modality Applications through a Robust CLIP-Based Encoder	Dec 4, 2024	Few-Shot LearningObject Recognition	CodeCode Available	1	5
Efficient Attention: Attention with Linear Complexities	Dec 4, 2018	Depth EstimationExtractive Text Summarization	CodeCode Available	1	5
Explainability-Aware One Point Attack for Point Cloud Neural Networks	Oct 8, 2021	3D Object RecognitionAdversarial Robustness	CodeCode Available	1	5
A Study of Face Obfuscation in ImageNet	Mar 10, 2021	AttributeObject	CodeCode Available	1	5
MomentumSMoE: Integrating Momentum into Sparse Mixture of Experts	Oct 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
GAANet: Ghost Auto Anchor Network for Detecting Varying Size Drones in Dark	May 5, 2023	Objectobject-detection	CodeCode Available	0	5
A Dataset for Crucial Object Recognition in Blind and Low-Vision Individuals' Navigation	Jul 23, 2024	Object Recognition	CodeCode Available	0	5
A Multi-viewpoint Outdoor Dataset for Human Action Recognition	Oct 7, 2021	Action RecognitionFace Recognition	CodeCode Available	0	5
Generalisation in humans and deep neural networks	Aug 27, 2018	Object Recognition	CodeCode Available	0	5

Show:10 25 50

← PrevPage 9 of 82Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified