Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 2042 papers

Title	Date	Tasks	Status	Hype
Learning what and where to attend	May 22, 2018	DiagnosticImage Categorization	CodeCode Available	1
Wavelet Convolutional Neural Networks	May 20, 2018	General Classificationimage-classification	CodeCode Available	1
Dynamic Few-Shot Visual Learning without Forgetting	Apr 25, 2018	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	1
DeepScores -- A Dataset for Segmentation, Detection and Classification of Tiny Objects	Mar 27, 2018	General ClassificationObject	CodeCode Available	1
Generalizable Data-free Objective for Crafting Universal Adversarial Perturbations	Jan 24, 2018	Adversarial AttackDepth Estimation	CodeCode Available	1
Relation Networks for Object Detection	Nov 30, 2017	Objectobject-detection	CodeCode Available	1
Distributed Deep Neural Networks over the Cloud, the Edge and End Devices	Sep 6, 2017	Distributed ComputingObject Recognition	CodeCode Available	1
Multiple Instance Detection Network with Online Instance Classifier Refinement	Apr 1, 2017	Multiple Instance LearningObject	CodeCode Available	1
Evolving Deep Neural Networks	Mar 1, 2017	Deep LearningImage Captioning	CodeCode Available	1
Densely Connected Convolutional Networks	Aug 25, 2016	Breast Tumour ClassificationClassification	CodeCode Available	1
Deep Predictive Coding Networks for Video Prediction and Unsupervised Learning	May 25, 2016	Object RecognitionVideo Prediction	CodeCode Available	1
Domain Generalization for Object Recognition with Multi-task Autoencoders	Aug 31, 2015	DenoisingDomain Generalization	CodeCode Available	1
Training Deep Neural Networks on Noisy Labels with Bootstrapping	Dec 20, 2014	Emotion RecognitionObject Recognition	CodeCode Available	1
Deep Gaze I: Boosting Saliency Prediction with Feature Maps Trained on ImageNet	Nov 4, 2014	Object RecognitionPoint Processes	CodeCode Available	1
Going Deeper with Convolutions	Sep 17, 2014	General ClassificationImage Classification	CodeCode Available	1
ImageNet Large Scale Visual Recognition Challenge	Sep 1, 2014	General Classificationimage-classification	CodeCode Available	1
3D ShapeNets: A Deep Representation for Volumetric Shapes	Jun 22, 2014	3D Point Cloud Classification3D Shape Representation	CodeCode Available	1
Microsoft COCO: Common Objects in Context	May 1, 2014	Instance SegmentationObject	CodeCode Available	1
OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks	Dec 21, 2013	General ClassificationImage Classification	CodeCode Available	1
Describing Textures in the Wild	Nov 14, 2013	Material RecognitionObject Recognition	CodeCode Available	1
Improving neural networks by preventing co-adaptation of feature detectors	Jul 3, 2012	Image ClassificationObject Recognition	CodeCode Available	1
GeoMag: A Vision-Language Model for Pixel-level Fine-Grained Remote Sensing Image Parsing	Jul 8, 2025	Language ModelingLanguage Modelling	—Unverified	0
Out-of-distribution detection in 3D applications: a review	Jul 1, 2025	Autonomous DrivingNavigate	—Unverified	0
SASep: Saliency-Aware Structured Separation of Geometry and Feature for Open Set Learning on Point Clouds	Jun 16, 2025	3D Object RecognitionObject Recognition	CodeCode Available	0
Continual Hyperbolic Learning of Instances and Classes	Jun 12, 2025	Continual LearningObject Recognition	—Unverified	0
DCIRNet: Depth Completion with Iterative Refinement for Dexterous Grasping of Transparent and Reflective Objects	Jun 11, 2025	Depth CompletionDepth Estimation	—Unverified	0
Aligning Text, Images, and 3D Structure Token-by-Token	Jun 9, 2025	3D Object RecognitionInstruction Following	—Unverified	0
Feature-Based Lie Group Transformer for Real-World Applications	Jun 5, 2025	ObjectObject Recognition	—Unverified	0
EV-Flying: an Event-based Dataset for In-The-Wild Recognition of Flying Objects	Jun 4, 2025	Event-based visionObject Recognition	—Unverified	0
Explicitly Modeling Subcortical Vision with a Neuro-Inspired Front-End Improves CNN Robustness	Jun 3, 2025	Data AugmentationObject Recognition	—Unverified	0
Efficient Estimation of Regularized Tyler's M-Estimator Using Approximate LOOCV	May 30, 2025	Face RecognitionObject Recognition	—Unverified	0
TrackVLA: Embodied Visual Tracking in the Wild	May 29, 2025	Language ModelingLanguage Modelling	—Unverified	0
SHTOcc: Effective 3D Occupancy Prediction with Sparse Head and Tail Voxels	May 28, 2025	Autonomous DrivingGPU	CodeCode Available	0
ADD-SLAM: Adaptive Dynamic Dense SLAM with Gaussian Splatting	May 26, 2025	NeRFobject-detection	—Unverified	0
Detailed Evaluation of Modern Machine Learning Approaches for Optic Plastics Sorting	May 22, 2025	Instance SegmentationObject Recognition	—Unverified	0
Refining Neural Activation Patterns for Layer-Level Concept Discovery in Neural Network-Based Receivers	May 21, 2025	ClusteringObject Recognition	—Unverified	0
RAZER: Robust Accelerated Zero-Shot 3D Open-Vocabulary Panoptic Reconstruction with Spatio-Temporal Aggregation	May 21, 2025	GPUNatural Language Queries	—Unverified	0
PLAICraft: Large-Scale Time-Aligned Vision-Speech-Action Dataset for Embodied AI	May 19, 2025	BenchmarkingMinecraft	—Unverified	0
Model alignment using inter-modal bridges	May 18, 2025	Image Generationmodel	—Unverified	0
ViEEG: Hierarchical Neural Coding with Cross-Modal Progressive Enhancement for EEG-Based Visual Decoding	May 18, 2025	Brain DecodingContrastive Learning	—Unverified	0
A Light and Smart Wearable Platform with Multimodal Foundation Model for Enhanced Spatial Reasoning in People with Blindness and Low Vision	May 16, 2025	Large Language ModelNavigate	—Unverified	0
AW-GATCN: Adaptive Weighted Graph Attention Convolutional Network for Event Camera Data Joint Denoising and Object Recognition	May 16, 2025	DenoisingEvent Segmentation	—Unverified	0
MIRAGE: A Multi-modal Benchmark for Spatial Perception, Reasoning, and Intelligence	May 15, 2025	AttributeObject	—Unverified	0
Improving Unsupervised Task-driven Models of Ventral Visual Stream via Relative Position Predictivity	May 13, 2025	Contrastive LearningObject	CodeCode Available	0
Topology-Guided Knowledge Distillation for Efficient Point Cloud Processing	May 12, 2025	3D Object RecognitionAutonomous Driving	CodeCode Available	0
Visually Interpretable Subtask Reasoning for Visual Question Answering	May 12, 2025	AttributeObject Recognition	CodeCode Available	0
ArtRAG: Retrieval-Augmented Generation with Structured Context for Visual Art Understanding	May 9, 2025	Image CaptioningObject Recognition	—Unverified	0
Beyond Recognition: Evaluating Visual Perspective Taking in Vision Language Models	May 3, 2025	DiagnosticObject Recognition	—Unverified	0
Transferable Adversarial Attacks on Black-Box Vision-Language Models	May 2, 2025	Image CaptioningObject Recognition	—Unverified	0
Zoomer: Adaptive Image Focus Optimization for Black-box MLLM	Apr 30, 2025	Image CaptioningObject Recognition	—Unverified	0

Show:10 25 50

← PrevPage 5 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified