Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1750 of 2042 papers

Title	Date	Tasks	Status
Does resistance to style-transfer equal Global Shape Bias? Measuring network sensitivity to global shape configuration	Oct 11, 2023	Image ClassificationObject Recognition	CodeCode Available
MARVIS: Motion & Geometry Aware Real and Virtual Image Segmentation	Mar 14, 2024	3D ReconstructionAutonomous Navigation	CodeCode Available
Genetic CNN	Mar 4, 2017	Object Recognition	CodeCode Available
COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images	Jan 26, 2016	DiversityGeneral Classification	CodeCode Available
MaskFusion: Real-Time Recognition, Tracking and Reconstruction of Multiple Moving Objects	Apr 24, 2018	ObjectObject Recognition	CodeCode Available
Geometric and Textural Augmentation for Domain Gap Reduction	Jan 1, 2022	ObjectObject Recognition	CodeCode Available
MASSeg : 2nd Technical Report for 4th PVUW MOSE Track	Apr 14, 2025	Data AugmentationObject	CodeCode Available
Geometry-Based Region Proposals for Real-Time Robot Detection of Tabletop Objects	Mar 14, 2017	Novel Object DetectionObject	CodeCode Available
CNN Fixations: An unraveling approach to visualize the discriminative image regions	Aug 22, 2017	Caption GenerationImage Captioning	CodeCode Available
Mixed Evidence for Gestalt Grouping in Deep Neural Networks	Mar 14, 2022	Object Recognition	CodeCode Available
Generalisation in humans and deep neural networks	Aug 27, 2018	Object Recognition	CodeCode Available
Deep Cross Residual Learning for Multitask Visual Recognition	Apr 5, 2016	Object Recognition	CodeCode Available
Global Second-order Pooling Convolutional Networks	Nov 29, 2018	Object Recognition	CodeCode Available
A Domain Guided CNN Architecture for Predicting Age from Structural Brain Images	Aug 11, 2018	Object Recognition	CodeCode Available
GAANet: Ghost Auto Anchor Network for Detecting Varying Size Drones in Dark	May 5, 2023	Objectobject-detection	CodeCode Available
DeepCorrect: Correcting DNN models against Image Distortions	May 5, 2017	ClassificationGeneral Classification	CodeCode Available
Deep Co-Occurrence Feature Learning for Visual Object Recognition	Jul 1, 2017	ObjectObject Recognition	CodeCode Available
Deep Compositional Captioning: Describing Novel Object Categories without Paired Training Data	Nov 17, 2015	Image CaptioningNovel Concepts	CodeCode Available
Beyond accuracy: quantifying trial-by-trial behaviour of CNNs and humans by measuring error consistency	Jun 30, 2020	Decision MakingObject Recognition	CodeCode Available
The Freiburg Groceries Dataset	Nov 17, 2016	BenchmarkingBIG-bench Machine Learning	CodeCode Available
Deep Competitive Pathway Networks	Sep 29, 2017	Image ClassificationObject Recognition	CodeCode Available
Decision-making and control with diffractive optical networks	Dec 21, 2022	Autonomous DrivingCar Racing	CodeCode Available
Memory Aware Synapses: Learning what (not) to forget	Nov 27, 2017	Lifelong learningObject Recognition	CodeCode Available
DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition	Oct 6, 2013	ClusteringDomain Adaptation	CodeCode Available
Grasp Pre-shape Selection by Synthetic Training: Eye-in-hand Shared Control on the Hannes Prosthesis	Mar 18, 2022	BenchmarkingObject Recognition	CodeCode Available
DAAL: Density-Aware Adaptive Line Margin Loss for Multi-Modal Deep Metric Learning	Oct 7, 2024	Face VerificationMetric Learning	CodeCode Available
Grid-augmented vision: A simple yet effective approach for enhanced spatial understanding in multi-modal agents	Nov 27, 2024	Autonomous NavigationObject Recognition	CodeCode Available
Grid Cell Path Integration For Movement-Based Visual Object Recognition	Feb 17, 2021	Few-Shot LearningNavigate	CodeCode Available
Grounded Human-Object Interaction Hotspots from Video	Dec 11, 2018	Human-Object Interaction DetectionObject	CodeCode Available
Adapting Deep Network Features to Capture Psychological Representations	Aug 6, 2016	Object RecognitionScene Understanding	CodeCode Available
Verbalized Representation Learning for Interpretable Few-Shot Generalization	Nov 27, 2024	Language ModelingLanguage Modelling	CodeCode Available
Cutting the Error by Half: Investigation of Very Deep CNN and Advanced Training Strategies for Document Image Classification	Apr 11, 2017	document-image-classificationDocument Image Classification	CodeCode Available
PCANet: A Simple Deep Learning Baseline for Image Classification?	Apr 14, 2014	ClassificationDeep Learning	CodeCode Available
FPNN: Field Probing Neural Networks for 3D Data	May 20, 2016	3D geometry3D Object Recognition	CodeCode Available
Do Deep Neural Networks Suffer from Crowding?	Jun 26, 2017	Object Recognition	CodeCode Available
Do deep nets really need weight decay and dropout?	Feb 20, 2018	Data AugmentationObject Recognition	CodeCode Available
Diverse, Difficult, and Odd Instances (D2O): A New Test Set for Object Classification	Jan 29, 2023	MiscellaneousObject Recognition	CodeCode Available
CURE-OR: Challenging Unreal and Real Environments for Object Recognition	Oct 18, 2018	ObjectObject Recognition	CodeCode Available
Handwritten Bangla Character Recognition Using The State-of-Art Deep Convolutional Neural Networks	Dec 28, 2017	Object RecognitionTranslation	CodeCode Available
MindSet: Vision. A toolbox for testing DNNs on key psychological experiments	Apr 8, 2024	DecoderObject Recognition	CodeCode Available
Task-generalizable Adversarial Attack based on Perceptual Metric	Nov 22, 2018	Adversarial Attackobject-detection	CodeCode Available
Adding Knowledge to Unsupervised Algorithms for the Recognition of Intent	Nov 12, 2020	3D Object ReconstructionObject Recognition	CodeCode Available
Video to Events: Recycling Video Datasets for Event Cameras	Dec 6, 2019	Object RecognitionSemantic Segmentation	CodeCode Available
Foveation in the Era of Deep Learning	Dec 3, 2023	Deep LearningFoveation	CodeCode Available
HD-CNN: Hierarchical Deep Convolutional Neural Network for Large Scale Visual Recognition	Oct 3, 2014	image-classificationImage Classification	CodeCode Available
What does LIME really see in images?	Feb 11, 2021	Object RecognitionSuperpixels	CodeCode Available
Sample Correlation for Fingerprinting Deep Face Recognition	Dec 30, 2024	Adversarial DefenseEmotion Recognition	CodeCode Available
MISC210K: A Large-Scale Dataset for Multi-Instance Semantic Correspondence	Jan 1, 2023	ObjectObject Recognition	CodeCode Available
Perceptual Piercing: Human Visual Cue-based Object Detection in Low Visibility Conditions	Oct 2, 2024	Autonomous DrivingComputational Efficiency	CodeCode Available
Hidden in Plain Sight: Evaluating Abstract Shape Recognition in Vision-Language Models	Nov 9, 2024	Object Recognition	CodeCode Available

Show:10 25 50

← PrevPage 35 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified