Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 2042 papers

Title	Date	Tasks	Status	Hype	Score
FAIR1M: A Benchmark Dataset for Fine-grained Object Recognition in High-Resolution Remote Sensing Imagery	Mar 9, 2021	Deep LearningObject	CodeCode Available	1	5
Computing the Testing Error without a Testing Set	May 1, 2020	Object RecognitionSemantic Segmentation	CodeCode Available	1	5
Comparison of semi-supervised deep learning algorithms for audio classification	Feb 16, 2021	Audio ClassificationAudio Tagging	CodeCode Available	1	5
Improving neural networks by preventing co-adaptation of feature detectors	Jul 3, 2012	Image ClassificationObject Recognition	CodeCode Available	1	5
F-SIOL-310: A Robotic Dataset and Benchmark for Few-Shot Incremental Object Learning	Mar 23, 2021	Incremental LearningObject	CodeCode Available	1	5
Comprehensive Multi-Modal Prototypes are Simple and Effective Classifiers for Vast-Vocabulary Object Detection	Dec 23, 2024	object-detectionObject Detection	CodeCode Available	1	5
Intriguing properties of generative classifiers	Sep 28, 2023	Object Recognition	CodeCode Available	1	5
A Study of Face Obfuscation in ImageNet	Mar 10, 2021	AttributeObject	CodeCode Available	1	5
Ev-TTA: Test-Time Adaptation for Event-Based Object Recognition	Mar 23, 2022	Event-based visionObject Recognition	CodeCode Available	1	5
EventRPG: Event Data Augmentation with Relevance Propagation Guidance	Mar 14, 2024	Action RecognitionData Augmentation	CodeCode Available	1	5
Learning Efficient Coding of Natural Images with Maximum Manifold Capacity Representations	Mar 6, 2023	Contrastive LearningObject Recognition	CodeCode Available	1	5
Learning Iterative Reasoning through Energy Minimization	Jun 30, 2022	image-classificationImage Classification	CodeCode Available	1	5
Evolving Deep Neural Networks	Mar 1, 2017	Deep LearningImage Captioning	CodeCode Available	1	5
Convolutional Neural Networks with Gated Recurrent Connections	Jun 5, 2021	object-detectionObject Detection	CodeCode Available	1	5
CREST: An Efficient Conjointly-trained Spike-driven Framework for Event-based Object Detection Exploiting Spatiotemporal Dynamics	Dec 17, 2024	Objectobject-detection	CodeCode Available	1	5
COTR: Compact Occupancy TRansformer for Vision-based 3D Occupancy Prediction	Dec 4, 2023	3D geometryAutonomous Driving	CodeCode Available	1	5
Expanding Event Modality Applications through a Robust CLIP-Based Encoder	Dec 4, 2024	Few-Shot LearningObject Recognition	CodeCode Available	1	5
Are Convolutional Neural Networks or Transformers more like human vision?	May 15, 2021	BIG-bench Machine LearningObject Recognition	CodeCode Available	1	5
DaWin: Training-free Dynamic Weight Interpolation for Robust Adaptation	Oct 3, 2024	Multi-Task LearningObject Recognition	CodeCode Available	1	5
EvDistill: Asynchronous Events to End-task Learning via Bidirectional Reconstruction-guided Cross-modal Knowledge Distillation	Nov 24, 2021	Event-based Object SegmentationKnowledge Distillation	CodeCode Available	1	5
Look-into-Object: Self-supervised Structure Modeling for Object Recognition	Mar 31, 2020	Fine-Grained Image ClassificationImage Recognition	CodeCode Available	1	5
LRSAA: Large-scale Remote Sensing Image Target Recognition and Automatic Annotation	Nov 24, 2024	Ensemble LearningObject	CodeCode Available	1	5
Event-based Asynchronous Sparse Convolutional Networks	Mar 20, 2020	object-detectionObject Detection	CodeCode Available	1	5
Matching the Neuronal Representations of V1 is Necessary to Improve Robustness in CNNs with V1-like Front-ends	Oct 16, 2023	Object Recognition	CodeCode Available	1	5
Enriching ImageNet with Human Similarity Judgments and Psychological Embeddings	Nov 22, 2020	Bayesian InferenceObject Recognition	CodeCode Available	1	5

Show:10 25 50

← PrevPage 7 of 82Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified