Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 2042 papers

Title	Date	Tasks	Status	Hype
Limited but consistent gains in adversarial robustness by co-training object recognition models with human EEG	Sep 5, 2024	Adversarial RobustnessEEG	—Unverified	0
UAV (Unmanned Aerial Vehicles): Diverse Applications of UAV Datasets in Segmentation, Classification, Detection, and Tracking	Sep 5, 2024	Gesture RecognitionObject Recognition	—Unverified	0
Low-Resolution Object Recognition with Cross-Resolution Relational Contrastive Distillation	Sep 4, 2024	Face RecognitionKnowledge Distillation	—Unverified	0
Discriminative Spatial-Semantic VOS Solution: 1st Place Solution for 6th LSVOS	Aug 29, 2024	ObjectObject Recognition	CodeCode Available	0
OpenNav: Efficient Open Vocabulary 3D Object Detection for Smart Wheelchair Navigation	Aug 25, 2024	3D Object DetectionNavigate	CodeCode Available	0
Optimizing Spatio-Temporal Information Processing in Spiking Neural Networks via Unconstrained Leaky Integrate-and-Fire Neurons and Hybrid Coding	Aug 22, 2024	object-detectionObject Detection	CodeCode Available	0
Finding Closure: A Closer Look at the Gestalt Law of Closure in Convolutional Neural Networks	Aug 22, 2024	Object Recognition	—Unverified	0
How Small is Big Enough? Open Labeled Datasets and the Development of Deep Learning	Aug 19, 2024	Deep LearningObject Recognition	—Unverified	0
Category-Prompt Refined Feature Learning for Long-Tailed Multi-Label Image Classification	Aug 15, 2024	image-classificationImage Classification	CodeCode Available	1
Robust Domain Generalization for Multi-modal Object Recognition	Aug 11, 2024	Domain GeneralizationMulti-Label Classification	—Unverified	0
On the Element-Wise Representation and Reasoning in Zero-Shot Image Recognition: A Systematic Survey	Aug 9, 2024	Object Recognition	CodeCode Available	1
UniBench: Visual Reasoning Requires Rethinking Vision-Language Beyond Scaling	Aug 9, 2024	GPULanguage Modeling	CodeCode Available	3
ArtVLM: Attribute Recognition Through Vision-Based Prefix Language Modeling	Aug 7, 2024	AttributeLanguage Modeling	CodeCode Available	0
Understanding How Blind Users Handle Object Recognition Errors: Strategies and Challenges	Aug 6, 2024	ObjectObject Recognition	—Unverified	0
Source-Free Domain-Invariant Performance Prediction	Aug 5, 2024	Object RecognitionPrediction	—Unverified	0
A General Ambiguity Model for Binary Edge Images with Edge Tracing and its Implementation	Aug 3, 2024	Object Recognition	—Unverified	0
THOR2: Topological Analysis for 3D Shape and Color-Based Human-Inspired Object Recognition in Unseen Environments	Aug 2, 2024	ObjectObject Recognition	CodeCode Available	0
EZSR: Event-based Zero-Shot Recognition	Jul 31, 2024	ObjectObject Recognition	—Unverified	0
MarvelOVD: Marrying Object Recognition and Vision-Language Models for Robust Open-Vocabulary Object Detection	Jul 31, 2024	Language ModellingObject	CodeCode Available	1
Combined CNN and ViT features off-the-shelf: Another astounding baseline for recognition	Jul 28, 2024	Object Recognition	—Unverified	0
AI-based Density Recognition	Jul 24, 2024	ObjectObject Recognition	—Unverified	0
A Dataset for Crucial Object Recognition in Blind and Low-Vision Individuals' Navigation	Jul 23, 2024	Object Recognition	CodeCode Available	0
Affordance Labeling and Exploration: A Manifold-Based Approach	Jul 22, 2024	ClassificationClustering	—Unverified	0
EmoCAM: Toward Understanding What Drives CNN-based Emotion Recognition	Jul 19, 2024	Emotion Recognitionimage-classification	—Unverified	0
OCTrack: Benchmarking the Open-Corpus Multi-Object Tracking	Jul 19, 2024	BenchmarkingMulti-Object Tracking	—Unverified	0
SUSTechGAN: Image Generation for Object Detection in Adverse Conditions of Autonomous Driving	Jul 18, 2024	Autonomous DrivingImage Generation	CodeCode Available	0
Real-Time 3D Occupancy Prediction via Geometric-Semantic Disentanglement	Jul 18, 2024	3D geometryAutonomous Driving	—Unverified	0
Data-driven Verification of DNNs for Object Recognition	Jul 17, 2024	Image SegmentationObject	—Unverified	0
Dual-Hybrid Attention Network for Specular Highlight Removal	Jul 17, 2024	highlight removalObject Recognition	CodeCode Available	1
PartImageNet++ Dataset: Scaling up Part-based Models for Robust Recognition	Jul 15, 2024	Adversarial RobustnessInductive Bias	CodeCode Available	1
Teaching CORnet Human fMRI Representations for Enhanced Model-Brain Alignment	Jul 15, 2024	EEGObject Recognition	—Unverified	0
Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset	Jul 12, 2024	Autonomous NavigationImage Segmentation	—Unverified	0
CEIA: CLIP-Based Event-Image Alignment for Open-World Event-Based Understanding	Jul 9, 2024	Contrastive LearningDomain Adaptation	—Unverified	0
Enhanced Model Robustness to Input Corruptions by Per-corruption Adaptation of Normalization Statistics	Jul 8, 2024	Data AugmentationObject Recognition	—Unverified	0
The Cooperative Network Architecture: Learning Structured Networks as Representation of Sensory Patterns	Jul 8, 2024	object-detectionObject Detection	CodeCode Available	0
Interpreting the Residual Stream of ResNet18	Jul 7, 2024	Object Recognition	—Unverified	0
CBM: Curriculum by Masking	Jul 6, 2024	Object RecognitionTransfer Learning	CodeCode Available	0
Object recognition in primates: What can early visual areas contribute?	Jul 5, 2024	FoveationObject	—Unverified	0
Beyond Viewpoint: Robust 3D Object Recognition under Arbitrary Views through Joint Multi-Part Representation	Jul 4, 2024	3D Object RecognitionObject	—Unverified	0
Comics Datasets Framework: Mix of Comics datasets for detection benchmarking	Jul 3, 2024	BenchmarkingObject	CodeCode Available	1
EIT-1M: One Million EEG-Image-Text Pairs for Human Visual-textual Recognition and More	Jul 2, 2024	EEGObject Recognition	—Unverified	0
Efficient Event Stream Super-Resolution with Recursive Multi-Branch Fusion	Jun 28, 2024	Object RecognitionSuper-Resolution	CodeCode Available	0
MG-LLaVA: Towards Multi-Granularity Visual Instruction Tuning	Jun 25, 2024	ObjectObject Recognition	CodeCode Available	2
Putting GPT-4o to the Sword: A Comprehensive Evaluation of Language, Vision, Speech, and Multimodal Proficiency	Jun 19, 2024	Few-Shot Learningimage-classification	—Unverified	0
3D Instance Segmentation Using Deep Learning on RGB-D Indoor Data	Jun 19, 2024	3D Instance Segmentation3D Object Recognition	—Unverified	0
StableSemantics: A Synthetic Language-Vision Dataset of Semantic Representations in Naturalistic Images	Jun 19, 2024	Object RecognitionScene Understanding	CodeCode Available	2
Benchmarking Out-of-Distribution Generalization Capabilities of DNN-based Encoding Models for the Ventral Visual Cortex	Jun 16, 2024	BenchmarkingObject Recognition	—Unverified	0
The BabyView dataset: High-resolution egocentric videos of infants' and young children's everyday experiences	Jun 14, 2024	Depth EstimationImage Segmentation	—Unverified	0
I-MPN: Inductive Message Passing Network for Efficient Human-in-the-Loop Annotation of Mobile Eye Tracking Data	Jun 10, 2024	NavigateObject	—Unverified	0
A Comparative Survey of Vision Transformers for Feature Extraction in Texture Analysis	Jun 10, 2024	AttributeObject Recognition	—Unverified	0

Show:10 25 50

← PrevPage 4 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified