Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 2042 papers

Title	Date	Tasks	Status	Hype
Full-Glow: Fully conditional Glow for more realistic image generation	Dec 10, 2020	Image GenerationObject Recognition	CodeCode Available	1
The Lottery Ticket Hypothesis for Object Recognition	Dec 8, 2020	Instance SegmentationKeypoint Estimation	CodeCode Available	1
Simulating a Primary Visual Cortex at the Front of CNNs Improves Robustness to Image Perturbations	Dec 1, 2020	Object Recognition	CodeCode Available	1
Enriching ImageNet with Human Similarity Judgments and Psychological Embeddings	Nov 22, 2020	Bayesian InferenceObject Recognition	CodeCode Available	1
RAMP-CNN: A Novel Neural Network for Enhanced Automotive Radar Object Recognition	Nov 13, 2020	object-detectionObject Detection	CodeCode Available	1
Unsupervised Vision-and-Language Pre-training Without Parallel Images and Captions	Oct 24, 2020	Machine TranslationObject Recognition	CodeCode Available	1
LCD -- Line Clustering and Description for Place Recognition	Oct 21, 2020	ClusteringImage Retrieval	CodeCode Available	1
Natural Language Rationales with Full-Stack Visual Reasoning: From Pixels to Semantic Frames to Commonsense Graphs	Oct 15, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
The MECCANO Dataset: Understanding Human-Object Interactions from Egocentric Videos in an Industrial-like Domain	Oct 12, 2020	Action RecognitionActive Object Detection	CodeCode Available	1
Robust and Efficient Post-Processing for Video Object Detection (REPP)	Oct 1, 2020	Autonomous DrivingDense Object Detection	CodeCode Available	1
Robust and efficient post-processing for video object detection	Sep 23, 2020	Autonomous DrivingObject	CodeCode Available	1
Offline Meta-Reinforcement Learning with Advantage Weighting	Aug 13, 2020	Machine TranslationMeta-Learning	CodeCode Available	1
Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance Segmentation	Aug 13, 2020	ClassificationFew-Shot Object Detection	CodeCode Available	1
TactileSGNet: A Spiking Graph Neural Network for Event-based Tactile Object Recognition	Aug 1, 2020	Graph Neural NetworkObject Recognition	CodeCode Available	1
Do Adversarially Robust ImageNet Models Transfer Better?	Jul 16, 2020	Object RecognitionTransfer Learning	CodeCode Available	1
When and how CNNs generalize to out-of-distribution category-viewpoint combinations	Jul 15, 2020	DiversityObject Recognition	CodeCode Available	1
Single Shot MC Dropout Approximation	Jul 7, 2020	Autonomous DrivingObject Recognition	CodeCode Available	1
Overcoming Classifier Imbalance for Long-tail Object Detection with Balanced Group Softmax	Jun 18, 2020	image-classificationImage Classification	CodeCode Available	1
Noise or Signal: The Role of Image Backgrounds in Object Recognition	Jun 17, 2020	BIG-bench Machine LearningObject Recognition	CodeCode Available	1
v2e: From Video Frames to Realistic DVS Events	Jun 13, 2020	Object Recognition	CodeCode Available	1
Adaptive Subspaces for Few-Shot Learning	Jun 1, 2020	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	1
Computing the Testing Error Without a Testing Set	Jun 1, 2020	Object RecognitionSemantic Segmentation	CodeCode Available	1
Traditional Method Inspired Deep Neural Network for Edge Detection	May 28, 2020	Edge DetectionImage Segmentation	CodeCode Available	1
Computing the Testing Error without a Testing Set	May 1, 2020	Object RecognitionSemantic Segmentation	CodeCode Available	1
When CNNs Meet Random RNNs: Towards Multi-Level Analysis for RGB-D Object and Scene Recognition	Apr 26, 2020	Object RecognitionScene Recognition	CodeCode Available	1
SL-DML: Signal Level Deep Metric Learning for Multimodal One-Shot Action Recognition	Apr 23, 2020	Action RecognitionFace Identification	CodeCode Available	1
Understanding Integrated Gradients with SmoothTaylor for Deep Neural Network Attribution	Apr 22, 2020	image-classificationImage Classification	CodeCode Available	1
VOWEL: A Local Online Learning Rule for Recurrent Networks of Probabilistic Spiking Winner-Take-All Circuits	Apr 20, 2020	AllObject Recognition	CodeCode Available	1
TOG: Targeted Adversarial Objectness Gradient Attacks on Real-time Object Detection Systems	Apr 9, 2020	Autonomous DrivingObject	CodeCode Available	1
Empirical Upper Bound, Error Diagnosis and Invariance Analysis of Modern Object Detectors	Apr 5, 2020	Objectobject-detection	CodeCode Available	1
ObjectNet Dataset: Reanalysis and Correction	Apr 4, 2020	Data AugmentationImage Classification	CodeCode Available	1
Attribution in Scale and Space	Apr 3, 2020	AttributeObject Recognition	CodeCode Available	1
Look-into-Object: Self-supervised Structure Modeling for Object Recognition	Mar 31, 2020	Fine-Grained Image ClassificationImage Recognition	CodeCode Available	1
Exploit Clues from Views: Self-Supervised and Regularized Learning for Multiview Object Recognition	Mar 28, 2020	ObjectObject Recognition	CodeCode Available	1
Egoshots, an ego-vision life-logging dataset and semantic fidelity metric to evaluate diversity in image captioning models	Mar 26, 2020	DiversityImage Captioning	CodeCode Available	1
Event-based Asynchronous Sparse Convolutional Networks	Mar 20, 2020	object-detectionObject Detection	CodeCode Available	1
Multi-branch and Multi-scale Attention Learning for Fine-Grained Visual Categorization	Mar 20, 2020	Fine-Grained Image ClassificationFine-Grained Image Recognition	CodeCode Available	1
Pose Augmentation: Class-agnostic Object Pose Transformation for Object Recognition	Mar 19, 2020	ObjectObject Recognition	CodeCode Available	1
Equalization Loss for Long-Tailed Object Recognition	Mar 11, 2020	Long-tail LearningObject	CodeCode Available	1
Self-Supervised Linear Motion Deblurring	Feb 10, 2020	DeblurringImage Deblurring	CodeCode Available	1
OPFython: A Python-Inspired Optimum-Path Forest Classifier	Jan 28, 2020	DiversityGeneral Classification	CodeCode Available	1
Brain-Score: Which Artificial Neural Network for Object Recognition is most Brain-Like?	Jan 2, 2020	Object Recognition	CodeCode Available	1
Rehearsal-Free Continual Learning over Small Non-I.I.D. Batches	Jul 8, 2019	class-incremental learningClass Incremental Learning	CodeCode Available	1
Billion-scale semi-supervised learning for image classification	May 2, 2019	ClassificationGeneral Classification	CodeCode Available	1
Efficient Attention: Attention with Linear Complexities	Dec 4, 2018	Depth EstimationExtractive Text Summarization	CodeCode Available	1
ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness	Nov 29, 2018	Domain GeneralizationImage Classification	CodeCode Available	1
Compact Generalized Non-local Network	Oct 31, 2018	Object DetectionObject Recognition	CodeCode Available	1
PCL: Proposal Cluster Learning for Weakly Supervised Object Detection	Jul 9, 2018	image-classificationMultiple Instance Learning	CodeCode Available	1
Task-Driven Convolutional Recurrent Models of the Visual System	Jun 20, 2018	General ClassificationObject Recognition	CodeCode Available	1
Why do deep convolutional networks generalize so poorly to small image transformations?	May 30, 2018	Data AugmentationObject Recognition	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified