Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 2042 papers

Title	Date	Tasks	Status	Hype	Score
Dual-Hybrid Attention Network for Specular Highlight Removal	Jul 17, 2024	highlight removalObject Recognition	CodeCode Available	1	5
Doubly Right Object Recognition: A Why Prompt for Visual Rationales	Dec 12, 2022	Object Recognition	CodeCode Available	1	5
Bilateral Event Mining and Complementary for Event Stream Super-Resolution	May 16, 2024	Object RecognitionSuper-Resolution	CodeCode Available	1	5
Egoshots, an ego-vision life-logging dataset and semantic fidelity metric to evaluate diversity in image captioning models	Mar 26, 2020	DiversityImage Captioning	CodeCode Available	1	5
E2PNet: Event to Point Cloud Registration with Spatio-Temporal Representation Learning	Nov 30, 2023	Image ReconstructionObject Recognition	CodeCode Available	1	5
TactileSGNet: A Spiking Graph Neural Network for Event-based Tactile Object Recognition	Aug 1, 2020	Graph Neural NetworkObject Recognition	CodeCode Available	1	5
ImageNet Large Scale Visual Recognition Challenge	Sep 1, 2014	General Classificationimage-classification	CodeCode Available	1	5
Equalization Loss for Long-Tailed Object Recognition	Mar 11, 2020	Long-tail LearningObject	CodeCode Available	1	5
Enriching ImageNet with Human Similarity Judgments and Psychological Embeddings	Nov 22, 2020	Bayesian InferenceObject Recognition	CodeCode Available	1	5
Improving neural networks by preventing co-adaptation of feature detectors	Jul 3, 2012	Image ClassificationObject Recognition	CodeCode Available	1	5
Leveraging MLLM Embeddings and Attribute Smoothing for Compositional Zero-Shot Learning	Nov 18, 2024	AttributeCompositional Zero-Shot Learning	CodeCode Available	1	5
EvDistill: Asynchronous Events to End-task Learning via Bidirectional Reconstruction-guided Cross-modal Knowledge Distillation	Nov 24, 2021	Event-based Object SegmentationKnowledge Distillation	CodeCode Available	1	5
Event-based Asynchronous Sparse Convolutional Networks	Mar 20, 2020	object-detectionObject Detection	CodeCode Available	1	5
EventCLIP: Adapting CLIP for Event-based Object Recognition	Jun 10, 2023	Few-Shot LearningObject	CodeCode Available	1	5
Adapting Self-Supervised Vision Transformers by Probing Attention-Conditioned Masking Consistency	Jun 16, 2022	Domain AdaptationObject Recognition	CodeCode Available	1	5
Expanding Event Modality Applications through a Robust CLIP-Based Encoder	Dec 4, 2024	Few-Shot LearningObject Recognition	CodeCode Available	1	5
Explainability-Aware One Point Attack for Point Cloud Neural Networks	Oct 8, 2021	3D Object RecognitionAdversarial Robustness	CodeCode Available	1	5
The Norm Must Go On: Dynamic Unsupervised Domain Adaptation by Normalization	Dec 1, 2021	Autonomous DrivingDomain Adaptation	CodeCode Available	1	5
Noise or Signal: The Role of Image Backgrounds in Object Recognition	Jun 17, 2020	BIG-bench Machine LearningObject Recognition	CodeCode Available	1	5
A Study of Face Obfuscation in ImageNet	Mar 10, 2021	AttributeObject	CodeCode Available	1	5
Exploring the Transferability of Visual Prompting for Multimodal Large Language Models	Apr 17, 2024	HallucinationMultimodal Reasoning	CodeCode Available	1	5
Human Eyes Inspired Recurrent Neural Networks are More Robust Against Adversarial Noises	Jun 15, 2022	Adversarial RobustnessFoveation	CodeCode Available	0	5
A Dataset for Crucial Object Recognition in Blind and Low-Vision Individuals' Navigation	Jul 23, 2024	Object Recognition	CodeCode Available	0	5
Human-like Clustering with Deep Convolutional Neural Networks	Jun 15, 2017	ClusteringObject Recognition	CodeCode Available	0	5
A Multi-viewpoint Outdoor Dataset for Human Action Recognition	Oct 7, 2021	Action RecognitionFace Recognition	CodeCode Available	0	5
Hierarchical Superpixel Segmentation via Structural Information Theory	Jan 13, 2025	graph constructiongraph partitioning	CodeCode Available	0	5
How much human-like visual experience do current self-supervised learning algorithms need in order to achieve human-level object recognition?	Sep 23, 2021	Object RecognitionRepresentation Learning	CodeCode Available	0	5
Human Pose Estimation for Real-World Crowded Scenarios	Jul 16, 2019	Data AugmentationObject Recognition	CodeCode Available	0	5
Handwritten Bangla Character Recognition Using The State-of-Art Deep Convolutional Neural Networks	Dec 28, 2017	Object RecognitionTranslation	CodeCode Available	0	5
Grid-augmented vision: A simple yet effective approach for enhanced spatial understanding in multi-modal agents	Nov 27, 2024	Autonomous NavigationObject Recognition	CodeCode Available	0	5
Grid Cell Path Integration For Movement-Based Visual Object Recognition	Feb 17, 2021	Few-Shot LearningNavigate	CodeCode Available	0	5
Global Second-order Pooling Convolutional Networks	Nov 29, 2018	Object Recognition	CodeCode Available	0	5
Geometry-Based Region Proposals for Real-Time Robot Detection of Tabletop Objects	Mar 14, 2017	Novel Object DetectionObject	CodeCode Available	0	5
Grasp Pre-shape Selection by Synthetic Training: Eye-in-hand Shared Control on the Hannes Prosthesis	Mar 18, 2022	BenchmarkingObject Recognition	CodeCode Available	0	5
HD-CNN: Hierarchical Deep Convolutional Neural Network for Large Scale Visual Recognition	Oct 3, 2014	image-classificationImage Classification	CodeCode Available	0	5
A comparison between humans and AI at recognizing objects in unusual poses	Feb 6, 2024	Object Recognition	CodeCode Available	0	5
Generalisation in humans and deep neural networks	Aug 27, 2018	Object Recognition	CodeCode Available	0	5
Ambient Sound Provides Supervision for Visual Learning	Aug 25, 2016	Object Recognition	CodeCode Available	0	5
Optimizing Spatio-Temporal Information Processing in Spiking Neural Networks via Unconstrained Leaky Integrate-and-Fire Neurons and Hybrid Coding	Aug 22, 2024	object-detectionObject Detection	CodeCode Available	0	5
Geometric and Textural Augmentation for Domain Gap Reduction	Jan 1, 2022	ObjectObject Recognition	CodeCode Available	0	5
GAANet: Ghost Auto Anchor Network for Detecting Varying Size Drones in Dark	May 5, 2023	Objectobject-detection	CodeCode Available	0	5
Generalized Relevance Learning Grassmann Quantization	Mar 14, 2024	Activity RecognitionFace Recognition	CodeCode Available	0	5
Foveation in the Era of Deep Learning	Dec 3, 2023	Deep LearningFoveation	CodeCode Available	0	5
Foveated Instance Segmentation	Mar 27, 2025	Instance SegmentationObject Recognition	CodeCode Available	0	5
Grounded Human-Object Interaction Hotspots from Video	Dec 11, 2018	Human-Object Interaction DetectionObject	CodeCode Available	0	5
FPNN: Field Probing Neural Networks for 3D Data	May 20, 2016	3D geometry3D Object Recognition	CodeCode Available	0	5
Generate To Adapt: Aligning Domains using Generative Adversarial Networks	Apr 6, 2017	Domain AdaptationGenerative Adversarial Network	CodeCode Available	0	5
Hidden in Plain Sight: Evaluating Abstract Shape Recognition in Vision-Language Models	Nov 9, 2024	Object Recognition	CodeCode Available	0	5
Improving Out-of-Distribution Detection with Disentangled Foreground and Background Features	Mar 15, 2023	DisentanglementObject Recognition	CodeCode Available	0	5
Attention Based Pruning for Shift Networks	May 29, 2019	Object Recognition	CodeCode Available	0	5

Show:10 25 50

← PrevPage 5 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified