Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 2042 papers

Title	Date	Tasks	Status
CogNav: Cognitive Process Modeling for Object Goal Navigation with LLMs	Dec 11, 2024	Large Language ModelObject	—Unverified
Proactive Adversarial Defense: Harnessing Prompt Tuning in Vision-Language Models to Detect Unseen Backdoored Images	Dec 11, 2024	Adversarial Defensebackdoor defense	—Unverified
Enhancing 3D Object Detection in Autonomous Vehicles Based on Synthetic Virtual Environment Analysis	Dec 10, 2024	2D Object Detection3D Object Detection	—Unverified
Can foundation models actively gather information in interactive environments to test hypotheses?	Dec 9, 2024	Object Recognition	—Unverified
Optimized CNNs for Rapid 3D Point Cloud Object Recognition	Dec 3, 2024	Computational Efficiencyobject-detection	—Unverified
LVLM-COUNT: Enhancing the Counting Ability of Large Vision-Language Models	Dec 1, 2024	Object Recognition	CodeCode Available
Textured As-Is BIM via GIS-informed Point Cloud Segmentation	Nov 28, 2024	Object RecognitionPoint Cloud Segmentation	—Unverified
Verbalized Representation Learning for Interpretable Few-Shot Generalization	Nov 27, 2024	Language ModelingLanguage Modelling	CodeCode Available
Grid-augmented vision: A simple yet effective approach for enhanced spatial understanding in multi-modal agents	Nov 27, 2024	Autonomous NavigationObject Recognition	CodeCode Available
NEMO: Can Multimodal LLMs Identify Attribute-Modified Objects?	Nov 26, 2024	AttributeMultiple-choice	—Unverified
Comparing Photorealism in Game Engines for Synthetic Maritime Computer Vision Datasets	Nov 25, 2024	DiversityObject Recognition	—Unverified
Fine-Grained Open-Vocabulary Object Recognition via User-Guided Segmentation	Nov 23, 2024	Objectobject-detection	—Unverified
ViSTa Dataset: Do vision-language models understand sequential tasks?	Nov 20, 2024	MinecraftObject Recognition	CodeCode Available
Value-Spectrum: Quantifying Preferences of Vision-Language Models via Value Decomposition in Social Media Contexts	Nov 18, 2024	BenchmarkingMultimodal Large Language Model	CodeCode Available
LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection	Nov 18, 2024	Deep LearningObject Recognition	—Unverified
Multiscale Dubuc: A New Similarity Measure for Time Series	Nov 15, 2024	Dynamic Time WarpingObject Recognition	CodeCode Available
Long-Tailed Object Detection Pre-training: Dynamic Rebalancing Contrastive Learning with Dual Reconstruction	Nov 14, 2024	Contrastive LearningLong-tailed Object Detection	—Unverified
DipMe: Haptic Recognition of Granular Media for Tangible Interactive Applications	Nov 13, 2024	Object Recognition	—Unverified
Hidden in Plain Sight: Evaluating Abstract Shape Recognition in Vision-Language Models	Nov 9, 2024	Object Recognition	CodeCode Available
Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream	Nov 8, 2024	Brain DecodingInductive Bias	CodeCode Available
Object Recognition in Human Computer Interaction:- A Comparative Analysis	Nov 6, 2024	Gesture RecognitionObject Recognition	—Unverified
Lost in Context: The Influence of Context on Feature Attribution Methods for Object Recognition	Nov 5, 2024	ObjectObject Recognition	CodeCode Available
Active Gaze Behavior Boosts Self-Supervised Object Learning	Nov 4, 2024	ObjectObject Recognition	—Unverified
Learning Where to Edit Vision Transformers	Nov 4, 2024	Meta-LearningModel Editing	CodeCode Available
Investigating the Gestalt Principle of Closure in Deep Convolutional Neural Networks	Nov 1, 2024	Object Recognition	CodeCode Available
Unsupervised Object Discovery: A Comprehensive Survey and Unified Taxonomy	Oct 30, 2024	NavigateObject	—Unverified
Training the Untrainable: Introducing Inductive Bias via Representational Alignment	Oct 26, 2024	Inductive BiasObject Recognition	—Unverified
Few-shot target-driven instance detection based on open-vocabulary object detection models	Oct 21, 2024	Image AugmentationObject	—Unverified
Development of Image Collection Method Using YOLO and Siamese Network	Oct 16, 2024	Image RetrievalObject Recognition	—Unverified
big.LITTLE Vision Transformer for Efficient Visual Recognition	Oct 14, 2024	image-classificationImage Classification	—Unverified
ChartKG: A Knowledge-Graph-Based Representation for Chart Images	Oct 13, 2024	Chart Question AnsweringKnowledge Graph Completion	—Unverified
Training-Free Open-Ended Object Detection and Segmentation via Attention as Prompts	Oct 8, 2024	Instance SegmentationObject	—Unverified
DAAL: Density-Aware Adaptive Line Margin Loss for Multi-Modal Deep Metric Learning	Oct 7, 2024	Face VerificationMetric Learning	CodeCode Available
MVP-Bench: Can Large Vision--Language Models Conduct Multi-level Visual Perception Like Humans?	Oct 6, 2024	Object Recognition	CodeCode Available
Fast Object Detection with a Machine Learning Edge Device	Oct 5, 2024	Autonomous NavigationCPU	—Unverified
Perceptual Piercing: Human Visual Cue-based Object Detection in Low Visibility Conditions	Oct 2, 2024	Autonomous DrivingComputational Efficiency	CodeCode Available
Can We Remove the Ground? Obstacle-aware Point Cloud Compression for Remote Object Detection	Oct 1, 2024	3D Object DetectionObject	—Unverified
Semantic Segmentation of Unmanned Aerial Vehicle Remote Sensing Images using SegFormer	Oct 1, 2024	Object RecognitionSegmentation	—Unverified
You Only Speak Once to See	Sep 27, 2024	Contrastive LearningObject	—Unverified
Enhancing Crime Scene Investigations through Virtual Reality and Deep Learning Techniques	Sep 27, 2024	Object Recognition	—Unverified
AI-Powered Augmented Reality for Satellite Assembly, Integration and Test	Sep 26, 2024	6D Pose EstimationObject Recognition	—Unverified
SeqNet: Sequential Networks for One-Shot Traffic Sign Recognition With Transfer Learning	Sep 23, 2024	Image RetrievalMetric Learning	CodeCode Available
Formula-Supervised Visual-Geometric Pre-training	Sep 20, 2024	3D Object Classification3D Object Recognition	—Unverified
A dynamic vision sensor object recognition model based on trainable event-driven convolution and spiking attention mechanism	Sep 19, 2024	Object Recognition	—Unverified
EventDance++: Language-guided Unsupervised Source-free Cross-modal Adaptation for Event-based Object Recognition	Sep 19, 2024	Object Recognition	—Unverified
Do Pre-trained Vision-Language Models Encode Object States?	Sep 16, 2024	Language ModelingLanguage Modelling	CodeCode Available
Benchmarking VLMs' Reasoning About Persuasive Atypical Images	Sep 16, 2024	BenchmarkingObject Recognition	—Unverified
Can Large Language Models Grasp Event Signals? Exploring Pure Zero-Shot Event-based Recognition	Sep 15, 2024	Object RecognitionZero-Shot Learning	CodeCode Available
Label Convergence: Defining an Upper Performance Bound in Object Recognition through Contradictory Annotations	Sep 14, 2024	Instance Segmentationobject-detection	CodeCode Available
Generalization Boosted Adapter for Open-Vocabulary Segmentation	Sep 13, 2024	Object RecognitionSegmentation	—Unverified

Show:10 25 50

← PrevPage 7 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified