Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 2042 papers

Title	Date	Tasks	Status	Score
Enhancing Fine-Grained 3D Object Recognition using Hybrid Multi-Modal Vision Transformer-CNN Models	Oct 3, 2022	3D Object RecognitionFine-Grained Image Classification	CodeCode Available	5
Context-Aware Zero-Shot Recognition	Apr 19, 2019	Object RecognitionZero-Shot Learning	CodeCode Available	5
COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images	Jan 26, 2016	DiversityGeneral Classification	CodeCode Available	5
How much human-like visual experience do current self-supervised learning algorithms need in order to achieve human-level object recognition?	Sep 23, 2021	Object RecognitionRepresentation Learning	CodeCode Available	5
Characterizing and evaluating adversarial examples for Offline Handwritten Signature Verification	Jan 10, 2019	BIG-bench Machine LearningObject Recognition	CodeCode Available	5
Human Pose Estimation for Real-World Crowded Scenarios	Jul 16, 2019	Data AugmentationObject Recognition	CodeCode Available	5
Finding Tiny Faces	Dec 13, 2016	Face DetectionObject Recognition	CodeCode Available	5
Collaboratively Weighting Deep and Classic Representation via L2 Regularization for Image Classification	Feb 21, 2018	ClassificationGeneral Classification	CodeCode Available	5
Fine-grained Attention and Feature-sharing Generative Adversarial Networks for Single Image Super-Resolution	Nov 25, 2019	Generative Adversarial NetworkImage Super-Resolution	CodeCode Available	5
ImageNet Classification with Deep Convolutional Neural Networks	Dec 1, 2012	General ClassificationGPU	CodeCode Available	5
Generalizing to unseen domains via distribution matching	Nov 3, 2019	Domain GeneralizationLEMMA	CodeCode Available	5
Image Privacy Prediction Using Deep Neural Networks	Mar 8, 2019	Object RecognitionPrediction	CodeCode Available	5
Central Moment Discrepancy (CMD) for Domain-Invariant Representation Learning	Feb 28, 2017	Domain AdaptationObject Recognition	CodeCode Available	5
FewSOL: A Dataset for Few-Shot Object Learning in Robotic Environments	Jul 6, 2022	AttributeClassification	CodeCode Available	5
Foveated Instance Segmentation	Mar 27, 2025	Instance SegmentationObject Recognition	CodeCode Available	5
Fast Feature Fool: A data independent approach to universal adversarial perturbations	Jul 18, 2017	Object Recognition	CodeCode Available	5
CBM: Curriculum by Masking	Jul 6, 2024	Object RecognitionTransfer Learning	CodeCode Available	5
Feature Learning by Multidimensional Scaling and its Applications in Object Recognition	Jun 14, 2013	Object Recognition	CodeCode Available	5
Faster gaze prediction with dense networks and Fisher pruning	Jan 17, 2018	Gaze EstimationGaze Prediction	CodeCode Available	5
Comparative evaluation of CNN architectures for Image Caption Generation	Feb 23, 2021	Caption GenerationObject Recognition	CodeCode Available	5
Feature Learning for Accelerometer based Gait Recognition	Jul 31, 2020	Gait RecognitionObject Recognition	CodeCode Available	5
A Framework of Transfer Learning in Object Detection for Embedded Systems	Nov 12, 2018	Hyperparameter OptimizationObject	CodeCode Available	5
Causal importance of orientation selectivity for generalization in image recognition	May 1, 2019	image-classificationImage Classification	CodeCode Available	5
Interpreting Adversarially Trained Convolutional Neural Networks	May 23, 2019	Object Recognition	CodeCode Available	5
Facial Expression Recognition Research Based on Deep Learning	Apr 22, 2019	Deep LearningFacial Expression Recognition	CodeCode Available	5
Exploring Novel Object Recognition and Spontaneous Location Recognition Machine Learning Analysis Techniques in Alzheimer's Mice	Dec 12, 2023	Object RecognitionPose Estimation	CodeCode Available	5
A Comparative Analysis on Bangla Handwritten Digit Recognition with Data Augmentation and Non-Augmentation Process	Jun 26, 2020	Data AugmentationHandwritten Digit Recognition	CodeCode Available	5
Investigating the Nature of 3D Generalization in Deep Neural Networks	Apr 19, 2023	Object Recognition	CodeCode Available	5
Feature Pyramid Grids	Apr 7, 2020	Neural Architecture Searchobject-detection	CodeCode Available	5
Foveation in the Era of Deep Learning	Dec 3, 2023	Deep LearningFoveation	CodeCode Available	5
Kernel Manifold Alignment	Apr 9, 2015	Computational EfficiencyDomain Adaptation	CodeCode Available	5
Knowledge-driven Active Learning	Oct 15, 2021	Active LearningMulti-Label Classification	CodeCode Available	5
Hidden in Plain Sight: Evaluating Abstract Shape Recognition in Vision-Language Models	Nov 9, 2024	Object Recognition	CodeCode Available	5
MetaCOG: A Hierarchical Probabilistic Model for Learning Meta-Cognitive Visual Representations	Oct 6, 2021	Bayesian InferenceObject	CodeCode Available	5
EXOT: Exit-aware Object Tracker for Safe Robotic Manipulation of Moving Object	Jun 8, 2023	ObjectObject Recognition	CodeCode Available	5
Cartesian K-Means	Jun 1, 2013	ClusteringObject Recognition	CodeCode Available	5
Captioning Images with Diverse Objects	Jun 24, 2016	ObjectObject Recognition	CodeCode Available	5
Canonical Saliency Maps: Decoding Deep Face Models	May 4, 2021	Face ModelObject Recognition	CodeCode Available	5
Ensemble learning in CNN augmented with fully connected subnetworks	Mar 19, 2020	Ensemble LearningImage Classification	CodeCode Available	5
Experiments with mmWave Automotive Radar Test-bed	Dec 29, 2019	Object Recognition	CodeCode Available	5
Can Large Language Models Grasp Event Signals? Exploring Pure Zero-Shot Event-based Recognition	Sep 15, 2024	Object RecognitionZero-Shot Learning	CodeCode Available	5
Enabling My Robot To Play Pictionary : Recurrent Neural Networks For Sketch Recognition	Aug 11, 2016	ObjectObject Recognition	CodeCode Available	5
Are Vision Transformers More Data Hungry Than Newborn Visual Systems?	Dec 5, 2023	ObjectObject Recognition	CodeCode Available	5
Efficient Event Stream Super-Resolution with Recursive Multi-Branch Fusion	Jun 28, 2024	Object RecognitionSuper-Resolution	CodeCode Available	5
EBPC: Extended Bit-Plane Compression for Deep Neural Network Inference and Training Accelerators	Aug 30, 2019	image-classificationImage Classification	CodeCode Available	5
Learning Where to Edit Vision Transformers	Nov 4, 2024	Meta-LearningModel Editing	CodeCode Available	5
Probing Human Visual Robustness with Neurally-Guided Deep Neural Networks	May 4, 2024	Decision MakingNavigate	CodeCode Available	5
End-to-End Learning of Representations for Asynchronous Event-Based Data	Apr 17, 2019	ClassificationObject Recognition	CodeCode Available	5
Dynamic Rectification Knowledge Distillation	Jan 27, 2022	Edge-computingKnowledge Distillation	CodeCode Available	5
BViT: Broad Attention based Vision Transformer	Feb 13, 2022	image-classificationImage Classification	CodeCode Available	5

Show:10 25 50

← PrevPage 8 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified