Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 2042 papers

Title	Date	Tasks	Status	Hype
ALGO: Object-Grounded Visual Commonsense Reasoning for Open-World Egocentric Action Recognition	Jun 9, 2024	Action RecognitionObject Recognition	—Unverified	0
Flexible ViG: Learning the Self-Saliency for Flexible Object Recognition	Jun 6, 2024	Graph Neural NetworkObject Recognition	—Unverified	0
Haptic in-sensor computing device made of carbon nanotube-polydimethylsiloxane nanocomposites	Jun 6, 2024	Object Recognition	—Unverified	0
The 3D-PC: a benchmark for visual perspective taking in humans and machines	Jun 6, 2024	Object Recognition	CodeCode Available	1
A Review of Pulse-Coupled Neural Network Applications in Computer Vision and Image Processing	Jun 1, 2024	Edge DetectionImage Compression	—Unverified	0
Face processing emerges from object-trained convolutional neural networks	May 29, 2024	Object Recognition	—Unverified	0
MM-Mixing: Multi-Modal Mixing Alignment for 3D Understanding	May 28, 2024	3D Classification3D Object Recognition	—Unverified	0
Enhancing Pollinator Conservation towards Agriculture 4.0: Monitoring of Bees through Object Recognition	May 24, 2024	Object Recognition	CodeCode Available	0
Transformer in Touch: A Survey	May 21, 2024	Object RecognitionSurvey	—Unverified	0
BiomedParse: a biomedical foundation model for image parsing of everything everywhere all at once	May 21, 2024	AllImage Segmentation	—Unverified	0
Zero-shot counting with a dual-stream neural network model	May 16, 2024	Object RecognitionZero-Shot Counting	—Unverified	0
Bilateral Event Mining and Complementary for Event Stream Super-Resolution	May 16, 2024	Object RecognitionSuper-Resolution	CodeCode Available	1
AIris: An AI-powered Wearable Assistive Device for the Visually Impaired	May 13, 2024	Face RecognitionObject Recognition	—Unverified	0
ADLDA: A Method to Reduce the Harm of Data Distribution Shift in Data Augmentation	May 11, 2024	Data AugmentationDomain Adaptation	—Unverified	0
UnSegGNet: Unsupervised Image Segmentation using Graph Neural Networks	May 9, 2024	Image SegmentationObject Recognition	CodeCode Available	0
Probing Human Visual Robustness with Neurally-Guided Deep Neural Networks	May 4, 2024	Decision MakingNavigate	CodeCode Available	0
Imagine2touch: Predictive Tactile Sensing for Robotic Manipulation using Efficient Low-Dimensional Signals	May 2, 2024	ObjectObject Recognition	CodeCode Available	0
SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients	May 2, 2024	image-classificationImage Classification	—Unverified	0
Open-Set 3D Semantic Instance Maps for Vision Language Navigation -- O3D-SIM	Apr 27, 2024	Image SegmentationNavigate	CodeCode Available	0
Deep Models for Multi-View 3D Object Recognition: A Review	Apr 23, 2024	3D Classification3D Object Recognition	—Unverified	0
CloudFort: Enhancing Robustness of 3D Point Cloud Classification Against Backdoor Attacks via Spatial Partitioning and Ensemble Prediction	Apr 22, 2024	3D Point Cloud ClassificationAutonomous Vehicles	—Unverified	0
On-board classification of underwater images using hybrid classical-quantum CNN based method	Apr 19, 2024	Autonomous VehiclesGPU	—Unverified	0
ECOR: Explainable CLIP for Object Recognition	Apr 19, 2024	Objectobject-detection	—Unverified	0
Exploring the Transferability of Visual Prompting for Multimodal Large Language Models	Apr 17, 2024	HallucinationMultimodal Reasoning	CodeCode Available	1
How to deal with glare for improved perception of Autonomous Vehicles	Apr 17, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Achieving Rotation Invariance in Convolution Operations: Shifting from Data-Driven to Mechanism-Assured	Apr 17, 2024	Data Augmentationimage-classification	—Unverified	0
A Diffusion-based Data Generator for Training Object Recognition Models in Ultra-Range Distance	Apr 15, 2024	Gesture RecognitionObject Recognition	—Unverified	0
Two Effects, One Trigger: On the Modality Gap, Object Bias, and Information Imbalance in Contrastive Vision-Language Models	Apr 11, 2024	AttributeObject	CodeCode Available	1
A Dataset and Framework for Learning State-invariant Object Representations	Apr 9, 2024	ObjectObject Recognition	CodeCode Available	0
MindSet: Vision. A toolbox for testing DNNs on key psychological experiments	Apr 8, 2024	DecoderObject Recognition	CodeCode Available	0
GLCM-Based Feature Combination for Extraction Model Optimization in Object Detection Using Machine Learning	Apr 6, 2024	Computational EfficiencyModel Optimization	—Unverified	0
Is CLIP the main roadblock for fine-grained open-world perception?	Apr 4, 2024	Autonomous DrivingNovel Concepts	CodeCode Available	2
One Noise to Rule Them All: Multi-View Adversarial Attacks with Universal Perturbation	Apr 2, 2024	3D Object RecognitionAll	CodeCode Available	0
Object-conditioned Bag of Instances for Few-Shot Personalized Instance Recognition	Apr 1, 2024	Objectobject-detection	—Unverified	0
SUGAR: Pre-training 3D Visual Representations for Robotics	Apr 1, 2024	3D Instance Segmentation3D Object Recognition	—Unverified	0
Constructing Multilingual Visual-Text Datasets Revealing Visual Multilingual Ability of Vision Language Models	Mar 29, 2024	Image-text matchingObject Recognition	—Unverified	0
Efficient Multi-Band Temporal Video Filter for Reducing Human-Robot Interaction	Mar 26, 2024	Object Recognition	—Unverified	0
PseudoTouch: Efficiently Imaging the Surface Feel of Objects for Robotic Manipulation	Mar 22, 2024	ObjectObject Recognition	—Unverified	0
ParFormer: A Vision Transformer with Parallel Mixer and Sparse Channel Attention Patch Embedding	Mar 22, 2024	GPUImage Classification	—Unverified	0
Improving Robustness to Model Inversion Attacks via Sparse Coding Architectures	Mar 21, 2024	DenoisingImage Denoising	CodeCode Available	0
EventDance: Unsupervised Source-free Cross-modal Adaptation for Event-based Object Recognition	Mar 21, 2024	Object RecognitionTransfer Learning	—Unverified	0
Lifting Multi-View Detection and Tracking to the Bird's Eye View	Mar 19, 2024	3D Object RecognitionMulti-Object Tracking	CodeCode Available	2
Towards Real-Time Fast Unmanned Aerial Vehicle Detection Using Dynamic Vision Sensors	Mar 18, 2024	CPUEvent-based vision	—Unverified	0
Latent Object Characteristics Recognition with Visual to Haptic-Audio Cross-modal Transfer Learning	Mar 15, 2024	ObjectObject Recognition	—Unverified	0
ViTCN: Vision Transformer Contrastive Network For Reasoning	Mar 15, 2024	Object Recognition	—Unverified	0
MARVIS: Motion & Geometry Aware Real and Virtual Image Segmentation	Mar 14, 2024	3D ReconstructionAutonomous Navigation	CodeCode Available	0
Don't Judge by the Look: Towards Motion Coherent Video Representation	Mar 14, 2024	Data AugmentationObject Recognition	CodeCode Available	0
Generalized Relevance Learning Grassmann Quantization	Mar 14, 2024	Activity RecognitionFace Recognition	CodeCode Available	0
EventRPG: Event Data Augmentation with Relevance Propagation Guidance	Mar 14, 2024	Action RecognitionData Augmentation	CodeCode Available	1
Learn and Search: An Elegant Technique for Object Lookup using Contrastive Learning	Mar 12, 2024	Contrastive LearningObject	—Unverified	0

Show:10 25 50

← PrevPage 5 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified