Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 2042 papers

Title	Date	Tasks	Status	Hype
Learning Counterfactually Invariant Predictors	Jul 20, 2022	counterfactualObject Recognition	CodeCode Available	1
Contributions of Shape, Texture, and Color in Visual Recognition	Jul 19, 2022	AttributeGeneral Classification	CodeCode Available	1
Learning Iterative Reasoning through Energy Minimization	Jun 30, 2022	image-classificationImage Classification	CodeCode Available	1
Adapting Self-Supervised Vision Transformers by Probing Attention-Conditioned Masking Consistency	Jun 16, 2022	Domain AdaptationObject Recognition	CodeCode Available	1
Sparse Mixture-of-Experts are Domain Generalizable Learners	Jun 8, 2022	Domain GeneralizationMixture-of-Experts	CodeCode Available	1
ProxyMix: Proxy-based Mixup Training with Label Refinery for Source-Free Domain Adaptation	May 29, 2022	Domain AdaptationObject Recognition	CodeCode Available	1
Causal Transportability for Visual Recognition	Apr 26, 2022	image-classificationImage Classification	CodeCode Available	1
Joint Distribution Matters: Deep Brownian Distance Covariance for Few-Shot Classification	Apr 9, 2022	Classificationdomain classification	CodeCode Available	1
Ev-TTA: Test-Time Adaptation for Event-Based Object Recognition	Mar 23, 2022	Event-based visionObject Recognition	CodeCode Available	1
DetMatch: Two Teachers are Better Than One for Joint 2D and 3D Semi-Supervised Object Detection	Mar 17, 2022	object-detectionObject Detection	CodeCode Available	1
Debiased Self-Training for Semi-Supervised Learning	Feb 15, 2022	Object RecognitionScene Classification	CodeCode Available	1
SafePicking: Learning Safe Object Extraction via Object-Level Mapping	Feb 11, 2022	Motion PlanningObject	CodeCode Available	1
Rethinking the Two-Stage Framework for Grounded Situation Recognition	Dec 10, 2021	Grounded Situation RecognitionObject Recognition	CodeCode Available	1
Implicit Feature Refinement for Instance Segmentation	Dec 9, 2021	Instance SegmentationObject Recognition	CodeCode Available	1
PartImageNet: A Large, High-Quality Dataset of Parts	Dec 2, 2021	Activity RecognitionFew-Shot Learning	CodeCode Available	1
N-ImageNet: Towards Robust, Fine-Grained Object Recognition with Event Cameras	Dec 2, 2021	ClassificationObject	CodeCode Available	1
The Norm Must Go On: Dynamic Unsupervised Domain Adaptation by Normalization	Dec 1, 2021	Autonomous DrivingDomain Adaptation	CodeCode Available	1
Neural Regression, Representational Similarity, Model Zoology & Neural Taskonomy at Scale in Rodent Visual Cortex	Dec 1, 2021	BenchmarkingObject Recognition	CodeCode Available	1
TDAM: Top-Down Attention Module for Contextually Guided Feature Selection in CNNs	Nov 26, 2021	feature selectionImage Classification	CodeCode Available	1
EvDistill: Asynchronous Events to End-task Learning via Bidirectional Reconstruction-guided Cross-modal Knowledge Distillation	Nov 24, 2021	Event-based Object SegmentationKnowledge Distillation	CodeCode Available	1
IconQA: A New Benchmark for Abstract Diagram Understanding and Visual Language Reasoning	Oct 25, 2021	Arithmetic ReasoningMathematical Question Answering	CodeCode Available	1
Explainability-Aware One Point Attack for Point Cloud Neural Networks	Oct 8, 2021	3D Object RecognitionAdversarial Robustness	CodeCode Available	1
Voxel Transformer for 3D Object Detection	Sep 6, 2021	3D Object DetectionComputational Efficiency	CodeCode Available	1
Patchwork: Concentric Zone-based Region-wise Ground Segmentation with Ground Likelihood Estimation Using a 3D LiDAR Sensor	Aug 12, 2021	Object RecognitionSegmentation	CodeCode Available	1
On the Challenges of Open World Recognitionunder Shifting Visual Domains	Jul 9, 2021	Domain GeneralizationObject Recognition	CodeCode Available	1

Show:10 25 50

← PrevPage 5 of 82Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified