Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 2042 papers

Title	Date	Tasks	Status	Hype
Investigating the Role of Attribute Context in Vision-Language Models for Object Recognition and Detection	Mar 17, 2023	AttributeContrastive Learning	—Unverified	0
Explainable GeoAI: Can saliency maps help interpret artificial intelligence's learning process? An empirical study on natural feature detection	Mar 16, 2023	Deep LearningObject Recognition	CodeCode Available	1
Improving Out-of-Distribution Detection with Disentangled Foreground and Background Features	Mar 15, 2023	DisentanglementObject Recognition	CodeCode Available	0
Machine Learning Computer Vision Applications for Spatial AI Object Recognition in Orange County, California	Mar 14, 2023	ObjectObject Recognition	—Unverified	0
Feature representations useful for predicting image memorability	Mar 14, 2023	Object RecognitionOpen-Ended Question Answering	—Unverified	0
Variation of Gender Biases in Visual Recognition Models Before and After Finetuning	Mar 14, 2023	Object Recognition	—Unverified	0
EvConv: Fast CNN Inference on Event Camera Inputs For High-Speed Robot Perception	Mar 8, 2023	Depth EstimationObject Recognition	—Unverified	0
Toward a Geometric Theory of Manifold Untangling	Mar 7, 2023	ObjectObject Recognition	—Unverified	0
Learning Efficient Coding of Natural Images with Maximum Manifold Capacity Representations	Mar 6, 2023	Contrastive LearningObject Recognition	CodeCode Available	1
Domain-aware Triplet loss in Domain Generalization	Mar 1, 2023	ClusteringDomain Generalization	CodeCode Available	0
DuEqNet: Dual-Equivariance Network in Outdoor 3D Object Detection for Autonomous Driving	Feb 27, 2023	3D Object DetectionAutonomous Driving	—Unverified	0
InOR-Net: Incremental 3D Object Recognition Network for Point Cloud Representation	Feb 20, 2023	3D Object RecognitionFairness	—Unverified	0
Deep Learning for Event-based Vision: A Comprehensive Survey and Benchmarks	Feb 17, 2023	DeblurringDeep Learning	CodeCode Available	1
Towards Local Visual Modeling for Image Captioning	Feb 13, 2023	Image CaptioningObject Recognition	CodeCode Available	1
Scaling Vision Transformers to 22 Billion Parameters	Feb 10, 2023	Action ClassificationFairness	CodeCode Available	0
Zero-Knowledge Zero-Shot Learning for Novel Visual Category Discovery	Feb 9, 2023	Generalized Zero-Shot LearningObject Recognition	—Unverified	0
Convolutional Neural Networks Trained to Identify Words Provide a Surprisingly Good Account of Visual Form Priming Effects	Feb 8, 2023	FormObject Recognition	—Unverified	0
Dynamic Atomic Column Detection in Transmission Electron Microscopy Videos via Ridge Estimation	Feb 2, 2023	Object Recognition	—Unverified	0
Diverse, Difficult, and Odd Instances (D2O): A New Test Set for Object Classification	Jan 29, 2023	MiscellaneousObject Recognition	CodeCode Available	0
Connecting metrics for shape-texture knowledge in computer vision	Jan 25, 2023	image-classificationImage Classification	—Unverified	0
An Efficient Semi-Automated Scheme for Infrastructure LiDAR Annotation	Jan 25, 2023	Autonomous DrivingMulti-Object Tracking	—Unverified	0
Effective Baselines for Multiple Object Rearrangement Planning in Partially Observable Mapped Environments	Jan 24, 2023	Deep Reinforcement LearningObject	—Unverified	0
ODOR: The ICPR2022 ODeuropa Challenge on Olfactory Object Recognition	Jan 24, 2023	Domain AdaptationFew-Shot Learning	—Unverified	0
Improving Performance of Object Detection using the Mechanisms of Visual Recognition in Humans	Jan 23, 2023	Objectobject-detection	—Unverified	0
A Comprehensive Review of Modern Object Segmentation Approaches	Jan 13, 2023	Image SegmentationObject	—Unverified	0
Visual Story Generation Based on Emotion and Keywords	Jan 7, 2023	Image GenerationObject Recognition	CodeCode Available	0
TempSAL -- Uncovering Temporal Information for Deep Saliency Prediction	Jan 5, 2023	ObjectObject Recognition	CodeCode Available	1
GeoDE: a Geographically Diverse Evaluation Dataset for Object Recognition	Jan 5, 2023	ObjectObject Recognition	—Unverified	0
Deep Learning from Parametrically Generated Virtual Buildings for Real-World Object Recognition	Jan 3, 2023	3D ReconstructionObject Recognition	—Unverified	0
Shift from Texture-bias to Shape-bias: Edge Deformation-based Augmentation for Robust Object Recognition	Jan 1, 2023	Object Recognition	—Unverified	0
Autonomous Manipulation Learning for Similar Deformable Objects via Only One Demonstration	Jan 1, 2023	Deformable Object ManipulationObject	—Unverified	0
MISC210K: A Large-Scale Dataset for Multi-Instance Semantic Correspondence	Jan 1, 2023	ObjectObject Recognition	CodeCode Available	0
TempSAL - Uncovering Temporal Information for Deep Saliency Prediction	Jan 1, 2023	ObjectObject Recognition	CodeCode Available	1
Parsing Objects at a Finer Granularity: A Survey	Dec 28, 2022	Fine-Grained Visual RecognitionHuman Part Segmentation	—Unverified	0
Part-guided Relational Transformers for Fine-grained Visual Recognition	Dec 28, 2022	Fine-Grained Image ClassificationFine-Grained Visual Recognition	CodeCode Available	1
Brain Cancer Segmentation Using YOLOv5 Deep Neural Network	Dec 27, 2022	GPUInstance Segmentation	—Unverified	0
Decision-making and control with diffractive optical networks	Dec 21, 2022	Autonomous DrivingCar Racing	CodeCode Available	0
Improving Pre-Trained Weights Through Meta-Heuristics Fine-Tuning	Dec 19, 2022	image-classificationImage Classification	CodeCode Available	0
ColorSense: A Study on Color Vision in Machine Visual Recognition	Dec 16, 2022	Data AugmentationObject Recognition	—Unverified	0
RTMDet: An Empirical Study of Designing Real-Time Object Detectors	Dec 14, 2022	GPUInstance Segmentation	CodeCode Available	4
OAMixer: Object-aware Mixing Layer for Vision Transformers	Dec 13, 2022	Inductive BiasObject	CodeCode Available	0
Doubly Right Object Recognition: A Why Prompt for Visual Rationales	Dec 12, 2022	Object Recognition	CodeCode Available	1
A novel feature-scrambling approach reveals the capacity of convolutional neural networks to learn spatial relations	Dec 12, 2022	ObjectObject Recognition	—Unverified	0
Teaching What You Should Teach: A Data-Based Distillation Method	Dec 11, 2022	Data AugmentationKnowledge Distillation	—Unverified	0
State-Regularized Recurrent Neural Networks to Extract Automata and Explain Predictions	Dec 10, 2022	MemorizationObject Recognition	—Unverified	0
Beyond Object Recognition: A New Benchmark towards Object Concept Learning	Dec 6, 2022	AttributeObject	—Unverified	0
Recognizing Object by Components with Human Prior Knowledge Enhances Adversarial Robustness of Deep Neural Networks	Dec 4, 2022	Adversarial RobustnessInductive Bias	CodeCode Available	0
PASTA: Proportional Amplitude Spectrum Training Augmentation for Syn-to-Real Domain Generalization	Dec 2, 2022	Domain Generalizationobject-detection	CodeCode Available	1
Extreme Image Transformations Affect Humans and Machines Differently	Nov 30, 2022	Object Recognition	—Unverified	0
Efficient multi-scale representation of visual objects using a biologically plausible spike-latency code and winner-take-all inhibition	Nov 30, 2022	AllObject	—Unverified	0

Show:10 25 50

← PrevPage 9 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified