Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 2042 papers

Title	Date	Tasks	Status	Hype
Comparing Photorealism in Game Engines for Synthetic Maritime Computer Vision Datasets	Nov 25, 2024	DiversityObject Recognition	—Unverified	0
LRSAA: Large-scale Remote Sensing Image Target Recognition and Automatic Annotation	Nov 24, 2024	Ensemble LearningObject	CodeCode Available	1
Fine-Grained Open-Vocabulary Object Recognition via User-Guided Segmentation	Nov 23, 2024	Objectobject-detection	—Unverified	0
ViSTa Dataset: Do vision-language models understand sequential tasks?	Nov 20, 2024	MinecraftObject Recognition	CodeCode Available	0
Interactive Medical Image Segmentation: A Benchmark Dataset and Baseline	Nov 19, 2024	Image SegmentationInteractive Segmentation	CodeCode Available	3
Leveraging MLLM Embeddings and Attribute Smoothing for Compositional Zero-Shot Learning	Nov 18, 2024	AttributeCompositional Zero-Shot Learning	CodeCode Available	1
LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection	Nov 18, 2024	Deep LearningObject Recognition	—Unverified	0
Value-Spectrum: Quantifying Preferences of Vision-Language Models via Value Decomposition in Social Media Contexts	Nov 18, 2024	BenchmarkingMultimodal Large Language Model	CodeCode Available	0
Multiscale Dubuc: A New Similarity Measure for Time Series	Nov 15, 2024	Dynamic Time WarpingObject Recognition	CodeCode Available	0
Long-Tailed Object Detection Pre-training: Dynamic Rebalancing Contrastive Learning with Dual Reconstruction	Nov 14, 2024	Contrastive LearningLong-tailed Object Detection	—Unverified	0
DipMe: Haptic Recognition of Granular Media for Tangible Interactive Applications	Nov 13, 2024	Object Recognition	—Unverified	0
Large-scale Remote Sensing Image Target Recognition and Automatic Annotation	Nov 12, 2024	Ensemble LearningObject	CodeCode Available	1
Hidden in Plain Sight: Evaluating Abstract Shape Recognition in Vision-Language Models	Nov 9, 2024	Object Recognition	CodeCode Available	0
Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream	Nov 8, 2024	Brain DecodingInductive Bias	CodeCode Available	0
Object Recognition in Human Computer Interaction:- A Comparative Analysis	Nov 6, 2024	Gesture RecognitionObject Recognition	—Unverified	0
Lost in Context: The Influence of Context on Feature Attribution Methods for Object Recognition	Nov 5, 2024	ObjectObject Recognition	CodeCode Available	0
Learning Where to Edit Vision Transformers	Nov 4, 2024	Meta-LearningModel Editing	CodeCode Available	0
Active Gaze Behavior Boosts Self-Supervised Object Learning	Nov 4, 2024	ObjectObject Recognition	—Unverified	0
Investigating the Gestalt Principle of Closure in Deep Convolutional Neural Networks	Nov 1, 2024	Object Recognition	CodeCode Available	0
Unsupervised Object Discovery: A Comprehensive Survey and Unified Taxonomy	Oct 30, 2024	NavigateObject	—Unverified	0
Training the Untrainable: Introducing Inductive Bias via Representational Alignment	Oct 26, 2024	Inductive BiasObject Recognition	—Unverified	0
Few-shot target-driven instance detection based on open-vocabulary object detection models	Oct 21, 2024	Image AugmentationObject	—Unverified	0
MomentumSMoE: Integrating Momentum into Sparse Mixture of Experts	Oct 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Development of Image Collection Method Using YOLO and Siamese Network	Oct 16, 2024	Image RetrievalObject Recognition	—Unverified	0
big.LITTLE Vision Transformer for Efficient Visual Recognition	Oct 14, 2024	image-classificationImage Classification	—Unverified	0
ChartKG: A Knowledge-Graph-Based Representation for Chart Images	Oct 13, 2024	Chart Question AnsweringKnowledge Graph Completion	—Unverified	0
Training-Free Open-Ended Object Detection and Segmentation via Attention as Prompts	Oct 8, 2024	Instance SegmentationObject	—Unverified	0
DAAL: Density-Aware Adaptive Line Margin Loss for Multi-Modal Deep Metric Learning	Oct 7, 2024	Face VerificationMetric Learning	CodeCode Available	0
MVP-Bench: Can Large Vision--Language Models Conduct Multi-level Visual Perception Like Humans?	Oct 6, 2024	Object Recognition	CodeCode Available	0
Fast Object Detection with a Machine Learning Edge Device	Oct 5, 2024	Autonomous NavigationCPU	—Unverified	0
DaWin: Training-free Dynamic Weight Interpolation for Robust Adaptation	Oct 3, 2024	Multi-Task LearningObject Recognition	CodeCode Available	1
CSIM: A Copula-based similarity index sensitive to local changes for Image quality assessment	Oct 2, 2024	AstronomyImage Quality Assessment	CodeCode Available	1
Perceptual Piercing: Human Visual Cue-based Object Detection in Low Visibility Conditions	Oct 2, 2024	Autonomous DrivingComputational Efficiency	CodeCode Available	0
Can We Remove the Ground? Obstacle-aware Point Cloud Compression for Remote Object Detection	Oct 1, 2024	3D Object DetectionObject	—Unverified	0
Semantic Segmentation of Unmanned Aerial Vehicle Remote Sensing Images using SegFormer	Oct 1, 2024	Object RecognitionSegmentation	—Unverified	0
You Only Speak Once to See	Sep 27, 2024	Contrastive LearningObject	—Unverified	0
Enhancing Crime Scene Investigations through Virtual Reality and Deep Learning Techniques	Sep 27, 2024	Object Recognition	—Unverified	0
AI-Powered Augmented Reality for Satellite Assembly, Integration and Test	Sep 26, 2024	6D Pose EstimationObject Recognition	—Unverified	0
SeqNet: Sequential Networks for One-Shot Traffic Sign Recognition With Transfer Learning	Sep 23, 2024	Image RetrievalMetric Learning	CodeCode Available	0
Formula-Supervised Visual-Geometric Pre-training	Sep 20, 2024	3D Object Classification3D Object Recognition	—Unverified	0
EventDance++: Language-guided Unsupervised Source-free Cross-modal Adaptation for Event-based Object Recognition	Sep 19, 2024	Object Recognition	—Unverified	0
A dynamic vision sensor object recognition model based on trainable event-driven convolution and spiking attention mechanism	Sep 19, 2024	Object Recognition	—Unverified	0
Benchmarking VLMs' Reasoning About Persuasive Atypical Images	Sep 16, 2024	BenchmarkingObject Recognition	—Unverified	0
Do Pre-trained Vision-Language Models Encode Object States?	Sep 16, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Can Large Language Models Grasp Event Signals? Exploring Pure Zero-Shot Event-based Recognition	Sep 15, 2024	Object RecognitionZero-Shot Learning	CodeCode Available	0
Label Convergence: Defining an Upper Performance Bound in Object Recognition through Contradictory Annotations	Sep 14, 2024	Instance Segmentationobject-detection	CodeCode Available	0
Generalization Boosted Adapter for Open-Vocabulary Segmentation	Sep 13, 2024	Object RecognitionSegmentation	—Unverified	0
Performance Assessment of Feature Detection Methods for 2-D FS Sonar Imagery	Sep 11, 2024	Object Recognition	—Unverified	0
A Bayesian Framework for Active Tactile Object Recognition, Pose Estimation and Shape Transfer Learning	Sep 10, 2024	Active LearningObject	—Unverified	0
Fast Deep Predictive Coding Networks for Videos Feature Extraction without Labels	Sep 8, 2024	ClusteringObject Recognition	—Unverified	0

Show:10 25 50

← PrevPage 3 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified