Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 2042 papers

Title	Date	Tasks	Status
SESS: Saliency Enhancing with Scaling and Sliding	Jul 5, 2022	Explainable artificial intelligenceObject Detection	CodeCode Available
Compositional Clustering: Applications to Multi-Label Object Recognition and Speaker Identification	Sep 9, 2021	ClusteringFew-Shot Learning	CodeCode Available
Recognizing Object by Components with Human Prior Knowledge Enhances Adversarial Robustness of Deep Neural Networks	Dec 4, 2022	Adversarial RobustnessInductive Bias	CodeCode Available
A Comparative Analysis on Bangla Handwritten Digit Recognition with Data Augmentation and Non-Augmentation Process	Jun 26, 2020	Data AugmentationHandwritten Digit Recognition	CodeCode Available
T-CNN: Tubelets with Convolutional Neural Networks for Object Detection from Videos	Apr 9, 2016	Novel Object DetectionObject	CodeCode Available
Knowledge-driven Active Learning	Oct 15, 2021	Active LearningMulti-Label Classification	CodeCode Available
Cartesian K-Means	Jun 1, 2013	ClusteringObject Recognition	CodeCode Available
Object recognition in atmospheric turbulence scenes	Oct 25, 2022	Objectobject-detection	CodeCode Available
Label Convergence: Defining an Upper Performance Bound in Object Recognition through Contradictory Annotations	Sep 14, 2024	Instance Segmentationobject-detection	CodeCode Available
Machine learning with neural networks	Jan 17, 2019	BIG-bench Machine LearningObject Recognition	CodeCode Available
Reconstruction-guided attention improves the robustness and shape processing of neural networks	Sep 27, 2022	ObjectObject Recognition	CodeCode Available
Facial Expression Recognition Research Based on Deep Learning	Apr 22, 2019	Deep LearningFacial Expression Recognition	CodeCode Available
Optimizing Spatio-Temporal Information Processing in Spiking Neural Networks via Unconstrained Leaky Integrate-and-Fire Neurons and Hybrid Coding	Aug 22, 2024	object-detectionObject Detection	CodeCode Available
Recurrent Attention Models with Object-centric Capsule Representation for Multi-object Recognition	Oct 11, 2021	DecoderObject	CodeCode Available
SHTOcc: Effective 3D Occupancy Prediction with Sparse Head and Tail Voxels	May 28, 2025	Autonomous DrivingGPU	CodeCode Available
Captioning Images with Diverse Objects	Jun 24, 2016	ObjectObject Recognition	CodeCode Available
Recurrent Convolutional Fusion for RGB-D Object Recognition	Jun 5, 2018	ObjectObject Categorization	CodeCode Available
Exploring Novel Object Recognition and Spontaneous Location Recognition Machine Learning Analysis Techniques in Alzheimer's Mice	Dec 12, 2023	Object RecognitionPose Estimation	CodeCode Available
Experiments with mmWave Automotive Radar Test-bed	Dec 29, 2019	Object Recognition	CodeCode Available
Object Recognition under Multifarious Conditions: A Reliability Analysis and A Feature Similarity-based Performance Estimation	Feb 18, 2019	Object Recognition	CodeCode Available
Teacher-Student Consistency For Multi-Source Domain Adaptation	Oct 20, 2020	Domain AdaptationObject Recognition	CodeCode Available
Object Recognition with and without Objects	Nov 20, 2016	ObjectObject Recognition	CodeCode Available
A Fast Method For Computing Principal Curvatures From Range Images	Jul 3, 2017	GPUObject Recognition	CodeCode Available
Deliberative Explanations: visualizing network insecurities	Dec 1, 2019	AttributeObject Recognition	CodeCode Available
Recurrent Soft Attention Model for Common Object Recognition	May 4, 2017	modelObject	CodeCode Available
EXOT: Exit-aware Object Tracker for Safe Robotic Manipulation of Moving Object	Jun 8, 2023	ObjectObject Recognition	CodeCode Available
Canonical Saliency Maps: Decoding Deep Face Models	May 4, 2021	Face ModelObject Recognition	CodeCode Available
SilVar: Speech Driven Multimodal Model for Reasoning Visual Question Answering and Object Localization	Dec 21, 2024	Image CaptioningMultimodal Reasoning	CodeCode Available
Can Large Language Models Grasp Event Signals? Exploring Pure Zero-Shot Event-based Recognition	Sep 15, 2024	Object RecognitionZero-Shot Learning	CodeCode Available
Transformers: State-of-the-Art Natural Language Processing	Oct 1, 2020	Image ClassificationObject Recognition	CodeCode Available
MetaCOG: A Hierarchical Probabilistic Model for Learning Meta-Cognitive Visual Representations	Oct 6, 2021	Bayesian InferenceObject	CodeCode Available
Unsupervised Learning from Video with Deep Neural Embeddings	May 28, 2019	Action RecognitionObject Recognition	CodeCode Available
Occlusion Coherence: Detecting and Localizing Occluded Faces	Jun 28, 2015	Face DetectionObject Recognition	CodeCode Available
Learning and Visualizing Localized Geometric Features Using 3D-CNN: An Application to Manufacturability Analysis of Drilled Holes	Nov 13, 2017	3D Object RecognitionDecision Making	CodeCode Available
Learning a Probabilistic Latent Space of Object Shapes via 3D Generative-Adversarial Modeling	Oct 24, 2016	3D Object Recognition3D Point Cloud Linear Classification	CodeCode Available
Learning a smooth kernel regularizer for convolutional neural networks	Mar 5, 2019	L2 RegularizationObject Recognition	CodeCode Available
Tree-CNN: A Hierarchical Deep Convolutional Neural Network for Incremental Learning	Feb 15, 2018	Incremental LearningObject Recognition	CodeCode Available
Ambient Sound Provides Supervision for Visual Learning	Aug 25, 2016	Object Recognition	CodeCode Available
ODDObjects: A Framework for Multiclass Unsupervised Anomaly Detection on Masked Objects	Apr 26, 2021	Anomaly DetectionImage Reconstruction	CodeCode Available
Single camera pose estimation using Bayesian filtering and Kinect motion priors	May 20, 2014	2D Pose EstimationCamera Pose Estimation	CodeCode Available
Learning Adaptive Classifiers Synthesis for Generalized Few-Shot Learning	Jun 7, 2019	Few-Shot LearningGeneralized Few-Shot Learning	CodeCode Available
BViT: Broad Attention based Vision Transformer	Feb 13, 2022	image-classificationImage Classification	CodeCode Available
Deep supervised learning for hyperspectral data classification through convolutional neural networks	Jul 26, 2015	ClassificationFew-Shot Image Classification	CodeCode Available
Learning compact binary descriptors with unsupervised deep neural networks	Jun 1, 2016	Image RetrievalObject	CodeCode Available
Ensemble learning in CNN augmented with fully connected subnetworks	Mar 19, 2020	Ensemble LearningImage Classification	CodeCode Available
OLÃ: Orthogonal Low-Rank Embedding - A Plug and Play Geometric Loss for Deep Learning	Jun 1, 2018	General Classificationimage-classification	CodeCode Available
OLÉ: Orthogonal Low-rank Embedding, A Plug and Play Geometric Loss for Deep Learning	Dec 5, 2017	General Classificationimage-classification	CodeCode Available
Enhancing Pollinator Conservation towards Agriculture 4.0: Monitoring of Bees through Object Recognition	May 24, 2024	Object Recognition	CodeCode Available
DeepSat - A Learning framework for Satellite Imagery	Sep 11, 2015	ClassificationDenoising	CodeCode Available
Triangle-Net: Towards Robustness in Point Cloud Learning	Feb 27, 2020	3D Classification3D Object Recognition	CodeCode Available

Show:10 25 50

← PrevPage 39 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified