Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1850 of 2042 papers

Title	Date	Tasks	Status
SegICP: Integrated Deep Semantic Segmentation and Pose Estimation	Mar 5, 2017	Object RecognitionPoint Cloud Registration	CodeCode Available
Multiple Object Recognition with Visual Attention	Dec 24, 2014	ObjectObject Recognition	CodeCode Available
SharpNet: Fast and Accurate Recovery of Occluding Contours in Monocular Depth Estimation	May 21, 2019	Depth EstimationDepth Prediction	CodeCode Available
Multi-level 3D CNN for Learning Multi-scale Spatial Features	May 30, 2018	3D Object RecognitionObject	CodeCode Available
Image Captioning using Deep Neural Architectures	Jan 17, 2018	Image CaptioningMachine Translation	CodeCode Available
Improved object recognition using neural networks trained to mimic the brain's statistical properties	May 25, 2019	ObjectObject Categorization	CodeCode Available
Multiscale Dubuc: A New Similarity Measure for Time Series	Nov 15, 2024	Dynamic Time WarpingObject Recognition	CodeCode Available
Unsupervised Domain Adaptation through Inter-modal Rotation for RGB-D Object Recognition	Apr 21, 2020	Domain AdaptationObject Categorization	CodeCode Available
A Dataset for Crucial Object Recognition in Blind and Low-Vision Individuals' Navigation	Jul 23, 2024	Object Recognition	CodeCode Available
ImageNet Classification with Deep Convolutional Neural Networks	Dec 1, 2012	General ClassificationGPU	CodeCode Available
Food Image Recognition by Using Convolutional Neural Networks (CNNs)	Dec 3, 2016	Data AugmentationGeneral Classification	CodeCode Available
Prediction Surface Uncertainty Quantification in Object Detection Models for Autonomous Driving	Jul 11, 2021	Autonomous DrivingDecision Making	CodeCode Available
Fit to Measure: Reasoning about Sizes for Robust Object Recognition	Oct 27, 2020	BIG-bench Machine LearningObject	CodeCode Available
Multi-stage Deep Classifier Cascades for Open World Recognition	Aug 26, 2019	Object Recognition	CodeCode Available
Unsupervised Domain Adaptation using Feature-Whitening and Consensus Loss	Mar 7, 2019	Domain AdaptationGeneral Classification	CodeCode Available
Image Privacy Prediction Using Deep Neural Networks	Mar 8, 2019	Object RecognitionPrediction	CodeCode Available
Privacy Leakage of SIFT Features via Deep Generative Model based Image Reconstruction	Sep 2, 2020	Content-Based Image RetrievalImage Reconstruction	CodeCode Available
Image Style Transfer Using Convolutional Neural Networks	Jun 1, 2016	Image GenerationObject Recognition	CodeCode Available
Imagine2touch: Predictive Tactile Sensing for Robotic Manipulation using Efficient Low-Dimensional Signals	May 2, 2024	ObjectObject Recognition	CodeCode Available
SUSTechGAN: Image Generation for Object Detection in Adverse Conditions of Autonomous Driving	Jul 18, 2024	Autonomous DrivingImage Generation	CodeCode Available
Self-supervised Domain Adaptation for Computer Vision Tasks	Jul 25, 2019	Domain AdaptationObject Recognition	CodeCode Available
Enhancing Fine-Grained 3D Object Recognition using Hybrid Multi-Modal Vision Transformer-CNN Models	Oct 3, 2022	3D Object RecognitionFine-Grained Image Classification	CodeCode Available
Probing Multimodal Large Language Models for Global and Local Semantic Representations	Feb 27, 2024	Image to textobject-detection	CodeCode Available
Transfer Learning based Detection of Diabetic Retinopathy from Small Dataset	May 17, 2019	ClassificationDeep Learning	CodeCode Available
MVP-Bench: Can Large Vision--Language Models Conduct Multi-level Visual Perception Like Humans?	Oct 6, 2024	Object Recognition	CodeCode Available
MVT: Multi-view Vision Transformer for 3D Object Recognition	Oct 25, 2021	3D Object RecognitionInductive Bias	CodeCode Available
Characterizing and evaluating adversarial examples for Offline Handwritten Signature Verification	Jan 10, 2019	BIG-bench Machine LearningObject Recognition	CodeCode Available
Discriminative Spatial-Semantic VOS Solution: 1st Place Solution for 6th LSVOS	Aug 29, 2024	ObjectObject Recognition	CodeCode Available
Naturally Computed Scale Invariance in the Residual Stream of ResNet18	Apr 22, 2025	Object Recognition	CodeCode Available
Projected Distribution Loss for Image Enhancement	Dec 16, 2020	DeblurringDemosaicking	CodeCode Available
Improving Annotation for 3D Pose Dataset of Fine-Grained Object Categories	Oct 19, 2018	3D Pose EstimationObject	CodeCode Available
Fine-grained Attention and Feature-sharing Generative Adversarial Networks for Single Image Super-Resolution	Nov 25, 2019	Generative Adversarial NetworkImage Super-Resolution	CodeCode Available
Central Moment Discrepancy (CMD) for Domain-Invariant Representation Learning	Feb 28, 2017	Domain AdaptationObject Recognition	CodeCode Available
CBM: Curriculum by Masking	Jul 6, 2024	Object RecognitionTransfer Learning	CodeCode Available
Continual egocentric object recognition	Dec 6, 2019	Active LearningNovelty Detection	CodeCode Available
SwiDeN : Convolutional Neural Networks For Depiction Invariant Object Recognition	Jul 29, 2016	Depiction Invariant Object RecognitionObject	CodeCode Available
Finding Tiny Faces	Dec 13, 2016	Face DetectionObject Recognition	CodeCode Available
THOR2: Topological Analysis for 3D Shape and Color-Based Human-Inspired Object Recognition in Unseen Environments	Aug 2, 2024	ObjectObject Recognition	CodeCode Available
NetTailor: Tuning the Architecture, Not Just the Weights	Jun 29, 2019	Continual LearningObject Recognition	CodeCode Available
Improving Pre-Trained Weights Through Meta-Heuristics Fine-Tuning	Dec 19, 2022	image-classificationImage Classification	CodeCode Available
FewSOL: A Dataset for Few-Shot Object Learning in Robotic Environments	Jul 6, 2022	AttributeClassification	CodeCode Available
ContextMix: A context-aware data augmentation method for industrial visual inspection systems	Jan 18, 2024	Data AugmentationObject Recognition	CodeCode Available
Improving Robustness to Model Inversion Attacks via Sparse Coding Architectures	Mar 21, 2024	DenoisingImage Denoising	CodeCode Available
Context-Aware Zero-Shot Recognition	Apr 19, 2019	Object RecognitionZero-Shot Learning	CodeCode Available
Improving Unsupervised Task-driven Models of Ventral Visual Stream via Relative Position Predictivity	May 13, 2025	Contrastive LearningObject	CodeCode Available
Inception Recurrent Convolutional Neural Network for Object Recognition	Apr 25, 2017	ObjectObject Recognition	CodeCode Available
Putting visual object recognition in context	Nov 17, 2019	ObjectObject Recognition	CodeCode Available
PVNet: A Joint Convolutional Network of Point Cloud and Multi-View for 3D Shape Recognition	Aug 23, 2018	3D Object Recognition3D Shape Classification	CodeCode Available
Temporal-Coded Deep Spiking Neural Network with Easy Training and Robust Performance	Sep 24, 2019	Data AugmentationObject Recognition	CodeCode Available
PydMobileNet: Improved Version of MobileNets with Pyramid Depthwise Separable Convolution	Nov 17, 2018	Object Recognition	CodeCode Available

Show:10 25 50

← PrevPage 37 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified