Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2042 of 2042 papers

Title	Date	Tasks	Status
Teaching CNNs to mimic Human Visual Cognitive Process & regularise Texture-Shape bias	Jun 25, 2020	Object Recognition	CodeCode Available
OrthographicNet: A Deep Transfer Learning Approach for 3D Object Recognition in Open-Ended Domains	Feb 8, 2019	3D Object RecognitionObject	CodeCode Available
Dynamic Rectification Knowledge Distillation	Jan 27, 2022	Edge-computingKnowledge Distillation	CodeCode Available
A Survey on Bayesian Deep Learning	Apr 6, 2016	Deep LearningObject Recognition	CodeCode Available
Probing Human Visual Robustness with Neurally-Guided Deep Neural Networks	May 4, 2024	Decision MakingNavigate	CodeCode Available
Do Pre-trained Vision-Language Models Encode Object States?	Sep 16, 2024	Language ModelingLanguage Modelling	CodeCode Available
Lifelong 3D Object Recognition and Grasp Synthesis Using Dual Memory Recurrent Self-Organization Networks	Sep 23, 2021	3D Object RecognitionContinual Learning	CodeCode Available
Robust Graph Learning from Noisy Data	Dec 17, 2018	ClusteringGeneral Classification	CodeCode Available
Lifelong Learning of Spatiotemporal Representations with Dual-Memory Recurrent Self-Organization	May 28, 2018	Active LearningContinuous Object Recognition	CodeCode Available
Don't Judge by the Look: Towards Motion Coherent Video Representation	Mar 14, 2024	Data AugmentationObject Recognition	CodeCode Available
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition	Jun 18, 2014	General Classificationimage-classification	CodeCode Available
Wiring Up Vision: Minimizing Supervised Synaptic Updates Needed to Produce a Primate Ventral Stream	Jan 1, 2021	Developmental LearningObject Recognition	CodeCode Available
Robustness of Object Recognition under Extreme Occlusion in Humans and Computational Models	May 11, 2019	ObjectObject Recognition	CodeCode Available
DeepID3: Face Recognition with Very Deep Neural Networks	Feb 3, 2015	Face IdentificationFace Recognition	CodeCode Available
Dominant Set Clustering and Pooling for Multi-View 3D Object Recognition	Jun 4, 2019	3D Object RecognitionClustering	CodeCode Available
Light Weight Residual Dense Attention Net for Spectral Reconstruction from RGB Images	Apr 15, 2020	Object RecognitionSpectral Reconstruction	CodeCode Available
Domain Generalization via Model-Agnostic Learning of Semantic Features	Oct 29, 2019	Domain GeneralizationGeneral Knowledge	CodeCode Available
Deep Feature Collaboration for Challenging 3D Finger Knuckle Identification	Oct 9, 2020	Object Recognition	CodeCode Available
Line-Circle-Square (LCS): A Multilayered Geometric Filter for Edge-Based Detection	Aug 21, 2020	Edge Detectionobject-detection	CodeCode Available
The developmental trajectory of object recognition robustness: children are like small adults but unlike big deep neural networks	May 20, 2022	ObjectObject Recognition	CodeCode Available
Domain Generalization In Robust Invariant Representation	Apr 7, 2023	Domain GeneralizationObject Recognition	CodeCode Available
Robust Sensible Adversarial Learning of Deep Neural Networks for Image Classification	May 20, 2022	image-classificationImage Classification	CodeCode Available
Local Aggregation for Unsupervised Learning of Visual Embeddings	Mar 29, 2019	ClusteringContrastive Learning	CodeCode Available
Domain Generalization by Solving Jigsaw Puzzles	Jun 1, 2019	Domain GeneralizationObject Recognition	CodeCode Available
Deep Discrete Hashing with Self-supervised Pairwise Labels	Jul 7, 2017	Deep HashingGeneral Classification	CodeCode Available
Visually Interpretable Subtask Reasoning for Visual Question Answering	May 12, 2025	AttributeObject Recognition	CodeCode Available
Robust Unsupervised Domain Adaptation for Neural Networks via Moment Alignment	Nov 16, 2017	Domain AdaptationObject Recognition	CodeCode Available
The Cooperative Network Architecture: Learning Structured Networks as Representation of Sensory Patterns	Jul 8, 2024	object-detectionObject Detection	CodeCode Available
PANDA: Pose Aligned Networks for Deep Attribute Modeling	Nov 21, 2013	AttributeFacial Attribute Classification	CodeCode Available
Robust Visual Tracking via Hierarchical Convolutional Features	Jul 12, 2017	Object RecognitionVisual Tracking	CodeCode Available
Looking Fast and Slow: Memory-Guided Mobile Video Object Detection	Mar 25, 2019	object-detectionObject Detection	CodeCode Available
Domain Generalization by Solving Jigsaw Puzzles	Mar 16, 2019	Domain GeneralizationImage Classification	CodeCode Available
Algorithms for Semantic Segmentation of Multispectral Remote Sensing Imagery using Deep Learning	Mar 19, 2017	object-detectionObject Detection	CodeCode Available
Look Twice: A Generalist Computational Model Predicts Return Fixations across Tasks and Species	Jan 5, 2021	Object Recognition	CodeCode Available
Lost in Context: The Influence of Context on Feature Attribution Methods for Object Recognition	Nov 5, 2024	ObjectObject Recognition	CodeCode Available
Spectral Illumination Correction: Achieving Relative Color Constancy Under the Spectral Domain	Dec 6, 2018	Camera CalibrationColor Constancy	CodeCode Available
Understanding and Visualizing Deep Visual Saliency Models	Mar 6, 2019	Object RecognitionSaliency Prediction	CodeCode Available
Low-Shot Learning for the Semantic Segmentation of Remote Sensing Imagery	Mar 26, 2018	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available
Domain-aware Triplet loss in Domain Generalization	Mar 1, 2023	ClusteringDomain Generalization	CodeCode Available
AGA: Attribute-Guided Augmentation	Jul 1, 2017	AttributeData Augmentation	CodeCode Available
LVLM-COUNT: Enhancing the Counting Ability of Large Vision-Language Models	Dec 1, 2024	Object Recognition	CodeCode Available
Visual Probing and Correction of Object Recognition Models with Interactive user feedback	Dec 29, 2020	Autonomous DrivingObject	CodeCode Available

Show:10 25 50

← PrevPage 41 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified