Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 2042 papers

Title	Date	Tasks	Status	Hype
Person Re-Identification with a Locally Aware Transformer	Jun 7, 2021	Object RecognitionPerson Re-Identification	CodeCode Available	1
CLIP-guided Federated Learning on Heterogeneous and Long-Tailed Data	Dec 14, 2023	Contrastive LearningFederated Learning	CodeCode Available	1
AdaNorm: Adaptive Gradient Norm Correction based Optimizer for CNNs	Oct 12, 2022	Object Recognition	CodeCode Available	1
Spatial457: A Diagnostic Benchmark for 6D Spatial Reasoning of Large Multimodal Models	Feb 12, 2025	AttributeDiagnostic	CodeCode Available	1
Recognize Any Regions	Nov 2, 2023	object-detectionObject Detection	CodeCode Available	1
Relation Networks for Object Detection	Nov 30, 2017	Objectobject-detection	CodeCode Available	1
Causal Transportability for Visual Recognition	Apr 26, 2022	image-classificationImage Classification	CodeCode Available	1
CLoVe: Encoding Compositional Language in Contrastive Vision-Language Models	Feb 22, 2024	Object RecognitionRetrieval	CodeCode Available	1
SafePicking: Learning Safe Object Extraction via Object-Level Mapping	Feb 11, 2022	Motion PlanningObject	CodeCode Available	1
BURST: A Benchmark for Unifying Object Recognition, Segmentation and Tracking in Video	Sep 25, 2022	Long-tail Video Object SegmentationMulti-Object Tracking	CodeCode Available	1
Brain-Score: Which Artificial Neural Network for Object Recognition is most Brain-Like?	Jan 2, 2020	Object Recognition	CodeCode Available	1
Category-Prompt Refined Feature Learning for Long-Tailed Multi-Label Image Classification	Aug 15, 2024	image-classificationImage Classification	CodeCode Available	1
Self-Supervised Learning with Kernel Dependence Maximization	Jun 15, 2021	Depth EstimationLinear evaluation	CodeCode Available	1
Self-Supervised Linear Motion Deblurring	Feb 10, 2020	DeblurringImage Deblurring	CodeCode Available	1
Adapting Self-Supervised Vision Transformers by Probing Attention-Conditioned Masking Consistency	Jun 16, 2022	Domain AdaptationObject Recognition	CodeCode Available	1
Sill-Net: Feature Augmentation with Separated Illumination Representation	Feb 6, 2021	Few-Shot Image ClassificationImage Classification	CodeCode Available	1
Single Shot MC Dropout Approximation	Jul 7, 2020	Autonomous DrivingObject Recognition	CodeCode Available	1
Comics Datasets Framework: Mix of Comics datasets for detection benchmarking	Jul 3, 2024	BenchmarkingObject	CodeCode Available	1
COTR: Compact Occupancy TRansformer for Vision-based 3D Occupancy Prediction	Dec 4, 2023	3D geometryAutonomous Driving	CodeCode Available	1
FSD: Fast Self-Supervised Single RGB-D to Categorical 3D Objects	Oct 19, 2023	3D Object Recognition6D Pose Estimation	CodeCode Available	1
On the Element-Wise Representation and Reasoning in Zero-Shot Image Recognition: A Systematic Survey	Aug 9, 2024	Object Recognition	CodeCode Available	1
An Adaptive Sampling Scheme to Efficiently Train Fully Convolutional Networks for Semantic Segmentation	Sep 8, 2017	AnatomyObject Recognition	—Unverified	0
An Adaptive Descriptor Design for Object Recognition in the Wild	May 1, 2013	Domain AdaptationObject	—Unverified	0
A biologically plausible network for the computation of orientation dominance	Dec 1, 2010	Object Recognition	—Unverified	0
PCA-RECT: An Energy-efficient Object Detection Approach for Event Cameras	Apr 24, 2019	Dimensionality Reductionfeature selection	—Unverified	0
A Variational Feature Encoding Method of 3D Object for Probabilistic Semantic SLAM	Aug 30, 2018	Bayesian InferenceObject	—Unverified	0
Boosting Object Recognition in Point Clouds by Saliency Detection	Nov 6, 2019	Object RecognitionSaliency Detection	—Unverified	0
Boosting with Maximum Adaptive Sampling	Dec 1, 2011	Object Recognition	—Unverified	0
A Multi-purpose Realistic Haze Benchmark with Quantifiable Haze Levels and Ground Truth	Jun 13, 2022	Objectobject-detection	—Unverified	0
Automatic Dataset Augmentation	Aug 28, 2017	Object Recognition	—Unverified	0
A Multiclass Boosting Framework for Achieving Fast and Provable Adversarial Robustness	Mar 1, 2021	Adversarial RobustnessObject Recognition	—Unverified	0
Amplitude-Based Approach to Evidence Accumulation	Mar 27, 2013	ObjectObject Recognition	—Unverified	0
Amodal Completion and Size Constancy in Natural Scenes	Sep 27, 2015	Objectobject-detection	—Unverified	0
A Benchmark Grocery Dataset of Realworld Point Clouds From Single View	Feb 12, 2024	3D Point Cloud ClassificationContinual Learning	—Unverified	0
A Light and Smart Wearable Platform with Multimodal Foundation Model for Enhanced Spatial Reasoning in People with Blindness and Low Vision	May 16, 2025	Large Language ModelNavigate	—Unverified	0
BORDER: An Oriented Rectangles Approach to Texture-Less Object Recognition	Jun 1, 2016	Line Segment DetectionObject	—Unverified	0
Auditing ImageNet: Towards a Model-driven Framework for Annotating Demographic Attributes of Large-Scale Image Datasets	May 3, 2019	Object Recognition	—Unverified	0
Audiovisual Highlight Detection in Videos	Feb 11, 2021	Highlight DetectionObject Recognition	—Unverified	0
Augmenting Image Annotation: A Human-LMM Collaborative Framework for Efficient Object Selection and Label Generation	Mar 14, 2025	Object Recognition	—Unverified	0
Augmenting Strong Supervision Using Web Data for Fine-Grained Categorization	Dec 1, 2015	Object Recognition	—Unverified	0
A Unifying Framework in Vector-valued Reproducing Kernel Hilbert Spaces for Manifold Regularization and Co-Regularized Multi-view Learning	Jan 31, 2014	MULTI-VIEW LEARNINGObject Recognition	—Unverified	0
Automatically Discovering Local Visual Material Attributes	Jun 1, 2015	ObjectObject Recognition	—Unverified	0
Adaptive Object Detection with Dual Multi-Label Prediction	Mar 29, 2020	Domain AdaptationImage-to-Image Translation	—Unverified	0
Automatic Graphic Logo Detection via Fast Region-based Convolutional Networks	Apr 20, 2016	Data AugmentationLogo Recognition	—Unverified	0
Automatic Ultrasound Image Segmentation of Supraclavicular Nerve Using Dilated U-Net Deep Learning Architecture	Aug 9, 2022	Image SegmentationMedical Diagnosis	—Unverified	0
Autonomous Manipulation Learning for Similar Deformable Objects via Only One Demonstration	Jan 1, 2023	Deformable Object ManipulationObject	—Unverified	0
AU Dataset for Visuo-Haptic Object Recognition for Robots	Dec 27, 2021	ObjectObject Recognition	—Unverified	0
Background Invariance Testing According to Semantic Proximity	Aug 19, 2022	Object Recognition	—Unverified	0
A Multisensory Learning Architecture for Rotation-invariant Object Recognition	Sep 14, 2020	BenchmarkingObject	—Unverified	0
ATZSL: Defensive Zero-Shot Recognition in the Presence of Adversaries	Oct 24, 2019	Image CaptioningObject Recognition	—Unverified	0

Show:10 25 50

← PrevPage 5 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified