Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 2042 papers

Title	Date	Tasks	Status	Hype
Learning Counterfactually Invariant Predictors	Jul 20, 2022	counterfactualObject Recognition	CodeCode Available	1
Contributions of Shape, Texture, and Color in Visual Recognition	Jul 19, 2022	AttributeGeneral Classification	CodeCode Available	1
Learning Iterative Reasoning through Energy Minimization	Jun 30, 2022	image-classificationImage Classification	CodeCode Available	1
Adapting Self-Supervised Vision Transformers by Probing Attention-Conditioned Masking Consistency	Jun 16, 2022	Domain AdaptationObject Recognition	CodeCode Available	1
Sparse Mixture-of-Experts are Domain Generalizable Learners	Jun 8, 2022	Domain GeneralizationMixture-of-Experts	CodeCode Available	1
ProxyMix: Proxy-based Mixup Training with Label Refinery for Source-Free Domain Adaptation	May 29, 2022	Domain AdaptationObject Recognition	CodeCode Available	1
Causal Transportability for Visual Recognition	Apr 26, 2022	image-classificationImage Classification	CodeCode Available	1
Joint Distribution Matters: Deep Brownian Distance Covariance for Few-Shot Classification	Apr 9, 2022	Classificationdomain classification	CodeCode Available	1
Ev-TTA: Test-Time Adaptation for Event-Based Object Recognition	Mar 23, 2022	Event-based visionObject Recognition	CodeCode Available	1
DetMatch: Two Teachers are Better Than One for Joint 2D and 3D Semi-Supervised Object Detection	Mar 17, 2022	object-detectionObject Detection	CodeCode Available	1
Debiased Self-Training for Semi-Supervised Learning	Feb 15, 2022	Object RecognitionScene Classification	CodeCode Available	1
SafePicking: Learning Safe Object Extraction via Object-Level Mapping	Feb 11, 2022	Motion PlanningObject	CodeCode Available	1
Rethinking the Two-Stage Framework for Grounded Situation Recognition	Dec 10, 2021	Grounded Situation RecognitionObject Recognition	CodeCode Available	1
Implicit Feature Refinement for Instance Segmentation	Dec 9, 2021	Instance SegmentationObject Recognition	CodeCode Available	1
PartImageNet: A Large, High-Quality Dataset of Parts	Dec 2, 2021	Activity RecognitionFew-Shot Learning	CodeCode Available	1
N-ImageNet: Towards Robust, Fine-Grained Object Recognition with Event Cameras	Dec 2, 2021	ClassificationObject	CodeCode Available	1
Neural Regression, Representational Similarity, Model Zoology & Neural Taskonomy at Scale in Rodent Visual Cortex	Dec 1, 2021	BenchmarkingObject Recognition	CodeCode Available	1
The Norm Must Go On: Dynamic Unsupervised Domain Adaptation by Normalization	Dec 1, 2021	Autonomous DrivingDomain Adaptation	CodeCode Available	1
TDAM: Top-Down Attention Module for Contextually Guided Feature Selection in CNNs	Nov 26, 2021	feature selectionImage Classification	CodeCode Available	1
EvDistill: Asynchronous Events to End-task Learning via Bidirectional Reconstruction-guided Cross-modal Knowledge Distillation	Nov 24, 2021	Event-based Object SegmentationKnowledge Distillation	CodeCode Available	1
IconQA: A New Benchmark for Abstract Diagram Understanding and Visual Language Reasoning	Oct 25, 2021	Arithmetic ReasoningMathematical Question Answering	CodeCode Available	1
Explainability-Aware One Point Attack for Point Cloud Neural Networks	Oct 8, 2021	3D Object RecognitionAdversarial Robustness	CodeCode Available	1
Voxel Transformer for 3D Object Detection	Sep 6, 2021	3D Object DetectionComputational Efficiency	CodeCode Available	1
Patchwork: Concentric Zone-based Region-wise Ground Segmentation with Ground Likelihood Estimation Using a 3D LiDAR Sensor	Aug 12, 2021	Object RecognitionSegmentation	CodeCode Available	1
On the Challenges of Open World Recognitionunder Shifting Visual Domains	Jul 9, 2021	Domain GeneralizationObject Recognition	CodeCode Available	1
Mind Your Outliers! Investigating the Negative Impact of Outliers on Active Learning for Visual Question Answering	Jul 6, 2021	Active LearningObject Recognition	CodeCode Available	1
Hebbian learning with gradients: Hebbian convolutional neural networks with modern deep learning frameworks	Jul 4, 2021	Deep LearningObject Recognition	CodeCode Available	1
Wasserstein Barycenter for Multi-Source Domain Adaptation	Jun 19, 2021	Domain AdaptationFace Recognition	CodeCode Available	1
Deep Subdomain Adaptation Network for Image Classification	Jun 17, 2021	ClassificationDomain Adaptation	CodeCode Available	1
Self-Supervised Learning with Kernel Dependence Maximization	Jun 15, 2021	Depth EstimationLinear evaluation	CodeCode Available	1
Partial success in closing the gap between human and machine vision	Jun 14, 2021	Image ClassificationObject Recognition	CodeCode Available	1
Person Re-Identification with a Locally Aware Transformer	Jun 7, 2021	Object RecognitionPerson Re-Identification	CodeCode Available	1
Convolutional Neural Networks with Gated Recurrent Connections	Jun 5, 2021	object-detectionObject Detection	CodeCode Available	1
DOCTOR: A Simple Method for Detecting Misclassification Errors	Jun 4, 2021	Object RecognitionSentiment Analysis	CodeCode Available	1
Superpixel-based Knowledge Infusion in Deep Neural Networks for Image Classification	May 20, 2021	Face RecognitionGraph Neural Network	CodeCode Available	1
Are Convolutional Neural Networks or Transformers more like human vision?	May 15, 2021	BIG-bench Machine LearningObject Recognition	CodeCode Available	1
This Looks Like That... Does it? Shortcomings of Latent Space Prototype Interpretability in Deep Networks	May 5, 2021	Explainable artificial intelligenceImage Classification	CodeCode Available	1
RelTransformer: A Transformer-Based Long-Tail Visual Relationship Recognition	Apr 24, 2021	Image CaptioningObject Recognition	CodeCode Available	1
ORBIT: A Real-World Few-Shot Dataset for Teachable Object Recognition	Apr 8, 2021	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	1
F-SIOL-310: A Robotic Dataset and Benchmark for Few-Shot Incremental Object Learning	Mar 23, 2021	Incremental LearningObject	CodeCode Available	1
A Study of Face Obfuscation in ImageNet	Mar 10, 2021	AttributeObject	CodeCode Available	1
PatchNet -- Short-range Template Matching for Efficient Video Processing	Mar 10, 2021	Objectobject-detection	CodeCode Available	1
FAIR1M: A Benchmark Dataset for Fine-grained Object Recognition in High-Resolution Remote Sensing Imagery	Mar 9, 2021	Deep LearningObject	CodeCode Available	1
Contemplating real-world object classification	Mar 8, 2021	ClassificationData Augmentation	CodeCode Available	1
Comparison of semi-supervised deep learning algorithms for audio classification	Feb 16, 2021	Audio ClassificationAudio Tagging	CodeCode Available	1
Sill-Net: Feature Augmentation with Separated Illumination Representation	Feb 6, 2021	Few-Shot Image ClassificationImage Classification	CodeCode Available	1
Using Shape to Categorize: Low-Shot Learning with an Explicit Shape Bias	Jan 18, 2021	ObjectObject Recognition	CodeCode Available	1
Self-Supervised Pretraining of 3D Features on any Point-Cloud	Jan 7, 2021	Objectobject-detection	CodeCode Available	1
Adaptive Threshold for Online Object Recognition and Re-identification Tasks	Dec 28, 2020	ClassificationFace Recognition	CodeCode Available	1
Source Data-absent Unsupervised Domain Adaptation through Hypothesis Transfer and Labeling Transfer	Dec 14, 2020	ClassificationDomain Adaptation	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified