Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 2042 papers

Title	Date	Tasks	Status	Hype
Benchmarking Multimodal Mathematical Reasoning with Explicit Visual Dependency	Apr 24, 2025	BenchmarkingMath	CodeCode Available	1
Generalizable Data-free Objective for Crafting Universal Adversarial Perturbations	Jan 24, 2018	Adversarial AttackDepth Estimation	CodeCode Available	1
Large-scale Remote Sensing Image Target Recognition and Automatic Annotation	Nov 12, 2024	Ensemble LearningObject	CodeCode Available	1
Going Deeper with Convolutions	Sep 17, 2014	General ClassificationImage Classification	CodeCode Available	1
IconQA: A New Benchmark for Abstract Diagram Understanding and Visual Language Reasoning	Oct 25, 2021	Arithmetic ReasoningMathematical Question Answering	CodeCode Available	1
ImageNet Large Scale Visual Recognition Challenge	Sep 1, 2014	General Classificationimage-classification	CodeCode Available	1
Implicit Feature Refinement for Instance Segmentation	Dec 9, 2021	Instance SegmentationObject Recognition	CodeCode Available	1
Comparison of semi-supervised deep learning algorithms for audio classification	Feb 16, 2021	Audio ClassificationAudio Tagging	CodeCode Available	1
Ev-TTA: Test-Time Adaptation for Event-Based Object Recognition	Mar 23, 2022	Event-based visionObject Recognition	CodeCode Available	1
EventCLIP: Adapting CLIP for Event-based Object Recognition	Jun 10, 2023	Few-Shot LearningObject	CodeCode Available	1
Expanding Event Modality Applications through a Robust CLIP-Based Encoder	Dec 4, 2024	Few-Shot LearningObject Recognition	CodeCode Available	1
Intriguing properties of generative classifiers	Sep 28, 2023	Object Recognition	CodeCode Available	1
Enriching ImageNet with Human Similarity Judgments and Psychological Embeddings	Nov 22, 2020	Bayesian InferenceObject Recognition	CodeCode Available	1
E2PNet: Event to Point Cloud Registration with Spatio-Temporal Representation Learning	Nov 30, 2023	Image ReconstructionObject Recognition	CodeCode Available	1
Equalization Loss for Long-Tailed Object Recognition	Mar 11, 2020	Long-tail LearningObject	CodeCode Available	1
Explainability-Aware One Point Attack for Point Cloud Neural Networks	Oct 8, 2021	3D Object RecognitionAdversarial Robustness	CodeCode Available	1
DOCTOR: A Simple Method for Detecting Misclassification Errors	Jun 4, 2021	Object RecognitionSentiment Analysis	CodeCode Available	1
Distributed Deep Neural Networks over the Cloud, the Edge and End Devices	Sep 6, 2017	Distributed ComputingObject Recognition	CodeCode Available	1
Domain Generalization for Object Recognition with Multi-task Autoencoders	Aug 31, 2015	DenoisingDomain Generalization	CodeCode Available	1
Describing Textures in the Wild	Nov 14, 2013	Material RecognitionObject Recognition	CodeCode Available	1
Deep Predictive Coding Networks for Video Prediction and Unsupervised Learning	May 25, 2016	Object RecognitionVideo Prediction	CodeCode Available	1
Deep Subdomain Adaptation Network for Image Classification	Jun 17, 2021	ClassificationDomain Adaptation	CodeCode Available	1
Doubly Right Object Recognition: A Why Prompt for Visual Rationales	Dec 12, 2022	Object Recognition	CodeCode Available	1
Explainable GeoAI: Can saliency maps help interpret artificial intelligence's learning process? An empirical study on natural feature detection	Mar 16, 2023	Deep LearningObject Recognition	CodeCode Available	1
DaWin: Training-free Dynamic Weight Interpolation for Robust Adaptation	Oct 3, 2024	Multi-Task LearningObject Recognition	CodeCode Available	1
Debiased Self-Training for Semi-Supervised Learning	Feb 15, 2022	Object RecognitionScene Classification	CodeCode Available	1
CSIM: A Copula-based similarity index sensitive to local changes for Image quality assessment	Oct 2, 2024	AstronomyImage Quality Assessment	CodeCode Available	1
CREST: An Efficient Conjointly-trained Spike-driven Framework for Event-based Object Detection Exploiting Spatiotemporal Dynamics	Dec 17, 2024	Objectobject-detection	CodeCode Available	1
Decoding Natural Images from EEG for Object Recognition	Aug 25, 2023	Contrastive LearningEEG	CodeCode Available	1
DeepScores -- A Dataset for Segmentation, Detection and Classification of Tiny Objects	Mar 27, 2018	General ClassificationObject	CodeCode Available	1
Densely Connected Convolutional Networks	Aug 25, 2016	Breast Tumour ClassificationClassification	CodeCode Available	1
DesCo: Learning Object Recognition with Rich Language Descriptions	Jun 24, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
DetMatch: Two Teachers are Better Than One for Joint 2D and 3D Semi-Supervised Object Detection	Mar 17, 2022	object-detectionObject Detection	CodeCode Available	1
Discover and Cure: Concept-aware Mitigation of Spurious Correlation	May 1, 2023	Lesion ClassificationObject Recognition	CodeCode Available	1
Divergences in Color Perception between Deep Neural Networks and Humans	Sep 11, 2023	image-classificationImage Classification	CodeCode Available	1
Do Adversarially Robust ImageNet Models Transfer Better?	Jul 16, 2020	Object RecognitionTransfer Learning	CodeCode Available	1
Dual-Hybrid Attention Network for Specular Highlight Removal	Jul 17, 2024	highlight removalObject Recognition	CodeCode Available	1
Dynamic Few-Shot Visual Learning without Forgetting	Apr 25, 2018	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	1
Egoshots, an ego-vision life-logging dataset and semantic fidelity metric to evaluate diversity in image captioning models	Mar 26, 2020	DiversityImage Captioning	CodeCode Available	1
Empirical Upper Bound, Error Diagnosis and Invariance Analysis of Modern Object Detectors	Apr 5, 2020	Objectobject-detection	CodeCode Available	1
EvDistill: Asynchronous Events to End-task Learning via Bidirectional Reconstruction-guided Cross-modal Knowledge Distillation	Nov 24, 2021	Event-based Object SegmentationKnowledge Distillation	CodeCode Available	1
Event-based Asynchronous Sparse Convolutional Networks	Mar 20, 2020	object-detectionObject Detection	CodeCode Available	1
EventRPG: Event Data Augmentation with Relevance Propagation Guidance	Mar 14, 2024	Action RecognitionData Augmentation	CodeCode Available	1
Evolving Deep Neural Networks	Mar 1, 2017	Deep LearningImage Captioning	CodeCode Available	1
Contributions of Shape, Texture, and Color in Visual Recognition	Jul 19, 2022	AttributeGeneral Classification	CodeCode Available	1
Contemplating real-world object classification	Mar 8, 2021	ClassificationData Augmentation	CodeCode Available	1
Rehearsal-Free Continual Learning over Small Non-I.I.D. Batches	Jul 8, 2019	class-incremental learningClass Incremental Learning	CodeCode Available	1
Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance Segmentation	Aug 13, 2020	ClassificationFew-Shot Object Detection	CodeCode Available	1
3D ShapeNets: A Deep Representation for Volumetric Shapes	Jun 22, 2014	3D Point Cloud Classification3D Shape Representation	CodeCode Available	1
Convolutional Neural Networks with Gated Recurrent Connections	Jun 5, 2021	object-detectionObject Detection	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified