Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1726–1750 of 2042 papers

Title	Date	Tasks	Status
DAAL: Density-Aware Adaptive Line Margin Loss for Multi-Modal Deep Metric Learning	Oct 7, 2024	Face VerificationMetric Learning	CodeCode Available
Grid-augmented vision: A simple yet effective approach for enhanced spatial understanding in multi-modal agents	Nov 27, 2024	Autonomous NavigationObject Recognition	CodeCode Available
Grid Cell Path Integration For Movement-Based Visual Object Recognition	Feb 17, 2021	Few-Shot LearningNavigate	CodeCode Available
Grounded Human-Object Interaction Hotspots from Video	Dec 11, 2018	Human-Object Interaction DetectionObject	CodeCode Available
Adapting Deep Network Features to Capture Psychological Representations	Aug 6, 2016	Object RecognitionScene Understanding	CodeCode Available
Verbalized Representation Learning for Interpretable Few-Shot Generalization	Nov 27, 2024	Language ModelingLanguage Modelling	CodeCode Available
Cutting the Error by Half: Investigation of Very Deep CNN and Advanced Training Strategies for Document Image Classification	Apr 11, 2017	document-image-classificationDocument Image Classification	CodeCode Available
PCANet: A Simple Deep Learning Baseline for Image Classification?	Apr 14, 2014	ClassificationDeep Learning	CodeCode Available
FPNN: Field Probing Neural Networks for 3D Data	May 20, 2016	3D geometry3D Object Recognition	CodeCode Available
Do Deep Neural Networks Suffer from Crowding?	Jun 26, 2017	Object Recognition	CodeCode Available
Do deep nets really need weight decay and dropout?	Feb 20, 2018	Data AugmentationObject Recognition	CodeCode Available
Diverse, Difficult, and Odd Instances (D2O): A New Test Set for Object Classification	Jan 29, 2023	MiscellaneousObject Recognition	CodeCode Available
CURE-OR: Challenging Unreal and Real Environments for Object Recognition	Oct 18, 2018	ObjectObject Recognition	CodeCode Available
Handwritten Bangla Character Recognition Using The State-of-Art Deep Convolutional Neural Networks	Dec 28, 2017	Object RecognitionTranslation	CodeCode Available
MindSet: Vision. A toolbox for testing DNNs on key psychological experiments	Apr 8, 2024	DecoderObject Recognition	CodeCode Available
Task-generalizable Adversarial Attack based on Perceptual Metric	Nov 22, 2018	Adversarial Attackobject-detection	CodeCode Available
Adding Knowledge to Unsupervised Algorithms for the Recognition of Intent	Nov 12, 2020	3D Object ReconstructionObject Recognition	CodeCode Available
Video to Events: Recycling Video Datasets for Event Cameras	Dec 6, 2019	Object RecognitionSemantic Segmentation	CodeCode Available
Foveation in the Era of Deep Learning	Dec 3, 2023	Deep LearningFoveation	CodeCode Available
HD-CNN: Hierarchical Deep Convolutional Neural Network for Large Scale Visual Recognition	Oct 3, 2014	image-classificationImage Classification	CodeCode Available
What does LIME really see in images?	Feb 11, 2021	Object RecognitionSuperpixels	CodeCode Available
Sample Correlation for Fingerprinting Deep Face Recognition	Dec 30, 2024	Adversarial DefenseEmotion Recognition	CodeCode Available
MISC210K: A Large-Scale Dataset for Multi-Instance Semantic Correspondence	Jan 1, 2023	ObjectObject Recognition	CodeCode Available
Perceptual Piercing: Human Visual Cue-based Object Detection in Low Visibility Conditions	Oct 2, 2024	Autonomous DrivingComputational Efficiency	CodeCode Available
Hidden in Plain Sight: Evaluating Abstract Shape Recognition in Vision-Language Models	Nov 9, 2024	Object Recognition	CodeCode Available

Show:10 25 50

← PrevPage 70 of 82Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified