Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 2042 papers

Title	Date	Tasks	Status
Proactive Adversarial Defense: Harnessing Prompt Tuning in Vision-Language Models to Detect Unseen Backdoored Images	Dec 11, 2024	Adversarial Defensebackdoor defense	—Unverified
CogNav: Cognitive Process Modeling for Object Goal Navigation with LLMs	Dec 11, 2024	Large Language ModelObject	—Unverified
Enhancing 3D Object Detection in Autonomous Vehicles Based on Synthetic Virtual Environment Analysis	Dec 10, 2024	2D Object Detection3D Object Detection	—Unverified
Can foundation models actively gather information in interactive environments to test hypotheses?	Dec 9, 2024	Object Recognition	—Unverified
Optimized CNNs for Rapid 3D Point Cloud Object Recognition	Dec 3, 2024	Computational Efficiencyobject-detection	—Unverified
LVLM-COUNT: Enhancing the Counting Ability of Large Vision-Language Models	Dec 1, 2024	Object Recognition	CodeCode Available
Textured As-Is BIM via GIS-informed Point Cloud Segmentation	Nov 28, 2024	Object RecognitionPoint Cloud Segmentation	—Unverified
Verbalized Representation Learning for Interpretable Few-Shot Generalization	Nov 27, 2024	Language ModelingLanguage Modelling	CodeCode Available
Grid-augmented vision: A simple yet effective approach for enhanced spatial understanding in multi-modal agents	Nov 27, 2024	Autonomous NavigationObject Recognition	CodeCode Available
NEMO: Can Multimodal LLMs Identify Attribute-Modified Objects?	Nov 26, 2024	AttributeMultiple-choice	—Unverified
Comparing Photorealism in Game Engines for Synthetic Maritime Computer Vision Datasets	Nov 25, 2024	DiversityObject Recognition	—Unverified
Fine-Grained Open-Vocabulary Object Recognition via User-Guided Segmentation	Nov 23, 2024	Objectobject-detection	—Unverified
ViSTa Dataset: Do vision-language models understand sequential tasks?	Nov 20, 2024	MinecraftObject Recognition	CodeCode Available
Value-Spectrum: Quantifying Preferences of Vision-Language Models via Value Decomposition in Social Media Contexts	Nov 18, 2024	BenchmarkingMultimodal Large Language Model	CodeCode Available
LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection	Nov 18, 2024	Deep LearningObject Recognition	—Unverified
Multiscale Dubuc: A New Similarity Measure for Time Series	Nov 15, 2024	Dynamic Time WarpingObject Recognition	CodeCode Available
Long-Tailed Object Detection Pre-training: Dynamic Rebalancing Contrastive Learning with Dual Reconstruction	Nov 14, 2024	Contrastive LearningLong-tailed Object Detection	—Unverified
DipMe: Haptic Recognition of Granular Media for Tangible Interactive Applications	Nov 13, 2024	Object Recognition	—Unverified
Hidden in Plain Sight: Evaluating Abstract Shape Recognition in Vision-Language Models	Nov 9, 2024	Object Recognition	CodeCode Available
Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream	Nov 8, 2024	Brain DecodingInductive Bias	CodeCode Available
Object Recognition in Human Computer Interaction:- A Comparative Analysis	Nov 6, 2024	Gesture RecognitionObject Recognition	—Unverified
Lost in Context: The Influence of Context on Feature Attribution Methods for Object Recognition	Nov 5, 2024	ObjectObject Recognition	CodeCode Available
Active Gaze Behavior Boosts Self-Supervised Object Learning	Nov 4, 2024	ObjectObject Recognition	—Unverified
Learning Where to Edit Vision Transformers	Nov 4, 2024	Meta-LearningModel Editing	CodeCode Available
Investigating the Gestalt Principle of Closure in Deep Convolutional Neural Networks	Nov 1, 2024	Object Recognition	CodeCode Available

Show:10 25 50

← PrevPage 13 of 82Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified