Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 2042 papers

Title	Date	Tasks	Status	Hype
Egoshots, an ego-vision life-logging dataset and semantic fidelity metric to evaluate diversity in image captioning models	Mar 26, 2020	DiversityImage Captioning	CodeCode Available	1
Empirical Upper Bound, Error Diagnosis and Invariance Analysis of Modern Object Detectors	Apr 5, 2020	Objectobject-detection	CodeCode Available	1
Equalization Loss for Long-Tailed Object Recognition	Mar 11, 2020	Long-tail LearningObject	CodeCode Available	1
EvDistill: Asynchronous Events to End-task Learning via Bidirectional Reconstruction-guided Cross-modal Knowledge Distillation	Nov 24, 2021	Event-based Object SegmentationKnowledge Distillation	CodeCode Available	1
EventRPG: Event Data Augmentation with Relevance Propagation Guidance	Mar 14, 2024	Action RecognitionData Augmentation	CodeCode Available	1
Evolving Deep Neural Networks	Mar 1, 2017	Deep LearningImage Captioning	CodeCode Available	1
Expanding Event Modality Applications through a Robust CLIP-Based Encoder	Dec 4, 2024	Few-Shot LearningObject Recognition	CodeCode Available	1
Explainability-Aware One Point Attack for Point Cloud Neural Networks	Oct 8, 2021	3D Object RecognitionAdversarial Robustness	CodeCode Available	1
Compact Generalized Non-local Network	Oct 31, 2018	Object DetectionObject Recognition	CodeCode Available	1
Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance Segmentation	Aug 13, 2020	ClassificationFew-Shot Object Detection	CodeCode Available	1
FSD: Fast Self-Supervised Single RGB-D to Categorical 3D Objects	Oct 19, 2023	3D Object Recognition6D Pose Estimation	CodeCode Available	1
F-SIOL-310: A Robotic Dataset and Benchmark for Few-Shot Incremental Object Learning	Mar 23, 2021	Incremental LearningObject	CodeCode Available	1
Generalizable Data-free Objective for Crafting Universal Adversarial Perturbations	Jan 24, 2018	Adversarial AttackDepth Estimation	CodeCode Available	1
Learning what and where to attend	May 22, 2018	DiagnosticImage Categorization	CodeCode Available	1
Comics Datasets Framework: Mix of Comics datasets for detection benchmarking	Jul 3, 2024	BenchmarkingObject	CodeCode Available	1
Comprehensive Multi-Modal Prototypes are Simple and Effective Classifiers for Vast-Vocabulary Object Detection	Dec 23, 2024	object-detectionObject Detection	CodeCode Available	1
CLIP-guided Federated Learning on Heterogeneous and Long-Tailed Data	Dec 14, 2023	Contrastive LearningFederated Learning	CodeCode Available	1
Causal Transportability for Visual Recognition	Apr 26, 2022	image-classificationImage Classification	CodeCode Available	1
Implicit Feature Refinement for Instance Segmentation	Dec 9, 2021	Instance SegmentationObject Recognition	CodeCode Available	1
Comparison of semi-supervised deep learning algorithms for audio classification	Feb 16, 2021	Audio ClassificationAudio Tagging	CodeCode Available	1
CLoVe: Encoding Compositional Language in Contrastive Vision-Language Models	Feb 22, 2024	Object RecognitionRetrieval	CodeCode Available	1
Computing the Testing Error without a Testing Set	May 1, 2020	Object RecognitionSemantic Segmentation	CodeCode Available	1
Brain-Score: Which Artificial Neural Network for Object Recognition is most Brain-Like?	Jan 2, 2020	Object Recognition	CodeCode Available	1
Joint Distribution Matters: Deep Brownian Distance Covariance for Few-Shot Classification	Apr 9, 2022	Classificationdomain classification	CodeCode Available	1
Learning Counterfactually Invariant Predictors	Jul 20, 2022	counterfactualObject Recognition	CodeCode Available	1
Learning Dense Object Descriptors from Multiple Views for Low-shot Category Generalization	Nov 28, 2022	Novel View SynthesisObject	CodeCode Available	1
Billion-scale semi-supervised learning for image classification	May 2, 2019	ClassificationGeneral Classification	CodeCode Available	1
Learning Semi-supervised Gaussian Mixture Models for Generalized Category Discovery	May 10, 2023	Contrastive Learningimage-classification	CodeCode Available	1
BURST: A Benchmark for Unifying Object Recognition, Segmentation and Tracking in Video	Sep 25, 2022	Long-tail Video Object SegmentationMulti-Object Tracking	CodeCode Available	1
Attribution in Scale and Space	Apr 3, 2020	AttributeObject Recognition	CodeCode Available	1
A Study of Face Obfuscation in ImageNet	Mar 10, 2021	AttributeObject	CodeCode Available	1
LMC: Large Model Collaboration with Cross-assessment for Training-Free Open-Set Object Recognition	Sep 22, 2023	ObjectObject Recognition	CodeCode Available	1
Bilateral Event Mining and Complementary for Event Stream Super-Resolution	May 16, 2024	Object RecognitionSuper-Resolution	CodeCode Available	1
Category-Prompt Refined Feature Learning for Long-Tailed Multi-Label Image Classification	Aug 15, 2024	image-classificationImage Classification	CodeCode Available	1
Microsoft COCO: Common Objects in Context	May 1, 2014	Instance SegmentationObject	CodeCode Available	1
MiKASA: Multi-Key-Anchor & Scene-Aware Transformer for 3D Visual Grounding	Mar 5, 2024	3D visual groundingDecision Making	CodeCode Available	1
Are Convolutional Neural Networks or Transformers more like human vision?	May 15, 2021	BIG-bench Machine LearningObject Recognition	CodeCode Available	1
Hebbian learning with gradients: Hebbian convolutional neural networks with modern deep learning frameworks	Jul 4, 2021	Deep LearningObject Recognition	CodeCode Available	1
Natural Language Rationales with Full-Stack Visual Reasoning: From Pixels to Semantic Frames to Commonsense Graphs	Oct 15, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Neural Regression, Representational Similarity, Model Zoology & Neural Taskonomy at Scale in Rodent Visual Cortex	Dec 1, 2021	BenchmarkingObject Recognition	CodeCode Available	1
Computing the Testing Error Without a Testing Set	Jun 1, 2020	Object RecognitionSemantic Segmentation	CodeCode Available	1
Offline Meta-Reinforcement Learning with Advantage Weighting	Aug 13, 2020	Machine TranslationMeta-Learning	CodeCode Available	1
When and how CNNs generalize to out-of-distribution category-viewpoint combinations	Jul 15, 2020	DiversityObject Recognition	CodeCode Available	1
On the Challenges of Open World Recognitionunder Shifting Visual Domains	Jul 9, 2021	Domain GeneralizationObject Recognition	CodeCode Available	1
ORBIT: A Real-World Few-Shot Dataset for Teachable Object Recognition	Apr 8, 2021	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	1
Overcoming Classifier Imbalance for Long-tail Object Detection with Balanced Group Softmax	Jun 18, 2020	image-classificationImage Classification	CodeCode Available	1
Deep Subdomain Adaptation Network for Image Classification	Jun 17, 2021	ClassificationDomain Adaptation	CodeCode Available	1
Part-guided Relational Transformers for Fine-grained Visual Recognition	Dec 28, 2022	Fine-Grained Image ClassificationFine-Grained Visual Recognition	CodeCode Available	1
3D ShapeNets: A Deep Representation for Volumetric Shapes	Jun 22, 2014	3D Point Cloud Classification3D Shape Representation	CodeCode Available	1
FAIR1M: A Benchmark Dataset for Fine-grained Object Recognition in High-Resolution Remote Sensing Imagery	Mar 9, 2021	Deep LearningObject	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified