Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 2042 papers

Title	Date	Tasks	Status
Enhancing Pollinator Conservation towards Agriculture 4.0: Monitoring of Bees through Object Recognition	May 24, 2024	Object Recognition	CodeCode Available
Transformer in Touch: A Survey	May 21, 2024	Object RecognitionSurvey	—Unverified
BiomedParse: a biomedical foundation model for image parsing of everything everywhere all at once	May 21, 2024	AllImage Segmentation	—Unverified
Zero-shot counting with a dual-stream neural network model	May 16, 2024	Object RecognitionZero-Shot Counting	—Unverified
AIris: An AI-powered Wearable Assistive Device for the Visually Impaired	May 13, 2024	Face RecognitionObject Recognition	—Unverified
ADLDA: A Method to Reduce the Harm of Data Distribution Shift in Data Augmentation	May 11, 2024	Data AugmentationDomain Adaptation	—Unverified
UnSegGNet: Unsupervised Image Segmentation using Graph Neural Networks	May 9, 2024	Image SegmentationObject Recognition	CodeCode Available
Probing Human Visual Robustness with Neurally-Guided Deep Neural Networks	May 4, 2024	Decision MakingNavigate	CodeCode Available
Imagine2touch: Predictive Tactile Sensing for Robotic Manipulation using Efficient Low-Dimensional Signals	May 2, 2024	ObjectObject Recognition	CodeCode Available
SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients	May 2, 2024	image-classificationImage Classification	—Unverified
Open-Set 3D Semantic Instance Maps for Vision Language Navigation -- O3D-SIM	Apr 27, 2024	Image SegmentationNavigate	CodeCode Available
Deep Models for Multi-View 3D Object Recognition: A Review	Apr 23, 2024	3D Classification3D Object Recognition	—Unverified
CloudFort: Enhancing Robustness of 3D Point Cloud Classification Against Backdoor Attacks via Spatial Partitioning and Ensemble Prediction	Apr 22, 2024	3D Point Cloud ClassificationAutonomous Vehicles	—Unverified
ECOR: Explainable CLIP for Object Recognition	Apr 19, 2024	Objectobject-detection	—Unverified
On-board classification of underwater images using hybrid classical-quantum CNN based method	Apr 19, 2024	Autonomous VehiclesGPU	—Unverified
How to deal with glare for improved perception of Autonomous Vehicles	Apr 17, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified
Achieving Rotation Invariance in Convolution Operations: Shifting from Data-Driven to Mechanism-Assured	Apr 17, 2024	Data Augmentationimage-classification	—Unverified
A Diffusion-based Data Generator for Training Object Recognition Models in Ultra-Range Distance	Apr 15, 2024	Gesture RecognitionObject Recognition	—Unverified
A Dataset and Framework for Learning State-invariant Object Representations	Apr 9, 2024	ObjectObject Recognition	CodeCode Available
MindSet: Vision. A toolbox for testing DNNs on key psychological experiments	Apr 8, 2024	DecoderObject Recognition	CodeCode Available
GLCM-Based Feature Combination for Extraction Model Optimization in Object Detection Using Machine Learning	Apr 6, 2024	Computational EfficiencyModel Optimization	—Unverified
One Noise to Rule Them All: Multi-View Adversarial Attacks with Universal Perturbation	Apr 2, 2024	3D Object RecognitionAll	CodeCode Available
SUGAR: Pre-training 3D Visual Representations for Robotics	Apr 1, 2024	3D Instance Segmentation3D Object Recognition	—Unverified
Object-conditioned Bag of Instances for Few-Shot Personalized Instance Recognition	Apr 1, 2024	Objectobject-detection	—Unverified
Constructing Multilingual Visual-Text Datasets Revealing Visual Multilingual Ability of Vision Language Models	Mar 29, 2024	Image-text matchingObject Recognition	—Unverified
Efficient Multi-Band Temporal Video Filter for Reducing Human-Robot Interaction	Mar 26, 2024	Object Recognition	—Unverified
PseudoTouch: Efficiently Imaging the Surface Feel of Objects for Robotic Manipulation	Mar 22, 2024	ObjectObject Recognition	—Unverified
ParFormer: A Vision Transformer with Parallel Mixer and Sparse Channel Attention Patch Embedding	Mar 22, 2024	GPUImage Classification	—Unverified
EventDance: Unsupervised Source-free Cross-modal Adaptation for Event-based Object Recognition	Mar 21, 2024	Object RecognitionTransfer Learning	—Unverified
Improving Robustness to Model Inversion Attacks via Sparse Coding Architectures	Mar 21, 2024	DenoisingImage Denoising	CodeCode Available
Towards Real-Time Fast Unmanned Aerial Vehicle Detection Using Dynamic Vision Sensors	Mar 18, 2024	CPUEvent-based vision	—Unverified
Latent Object Characteristics Recognition with Visual to Haptic-Audio Cross-modal Transfer Learning	Mar 15, 2024	ObjectObject Recognition	—Unverified
ViTCN: Vision Transformer Contrastive Network For Reasoning	Mar 15, 2024	Object Recognition	—Unverified
MARVIS: Motion & Geometry Aware Real and Virtual Image Segmentation	Mar 14, 2024	3D ReconstructionAutonomous Navigation	CodeCode Available
Don't Judge by the Look: Towards Motion Coherent Video Representation	Mar 14, 2024	Data AugmentationObject Recognition	CodeCode Available
Generalized Relevance Learning Grassmann Quantization	Mar 14, 2024	Activity RecognitionFace Recognition	CodeCode Available
Learn and Search: An Elegant Technique for Object Lookup using Contrastive Learning	Mar 12, 2024	Contrastive LearningObject	—Unverified
Mapping High-level Semantic Regions in Indoor Environments without Object Recognition	Mar 11, 2024	Graph GenerationLanguage Modeling	—Unverified
Textureless Object Recognition: An Edge-based Approach	Mar 10, 2024	ObjectObject Recognition	—Unverified
A spatiotemporal style transfer algorithm for dynamic visual stimulus generation	Mar 7, 2024	Image GenerationObject Recognition	—Unverified
LoDisc: Learning Global-Local Discriminative Features for Self-Supervised Fine-Grained Visual Recognition	Mar 6, 2024	Contrastive LearningFine-Grained Visual Recognition	—Unverified
Dual Pose-invariant Embeddings: Learning Category and Object-specific Discriminative Representations for Recognition and Retrieval	Mar 1, 2024	ObjectObject Recognition	—Unverified
Unveiling Typographic Deceptions: Insights of the Typographic Vulnerability in Large Vision-Language Model	Feb 29, 2024	Language ModelingLanguage Modelling	—Unverified
DOZE: A Dataset for Open-Vocabulary Zero-Shot Object Navigation in Dynamic Environments	Feb 29, 2024	AttributeCollision Avoidance	—Unverified
Probing Multimodal Large Language Models for Global and Local Semantic Representations	Feb 27, 2024	Image to textobject-detection	CodeCode Available
ISCUTE: Instance Segmentation of Cables Using Text Embedding	Feb 19, 2024	Instance SegmentationObject Recognition	—Unverified
SpikeNAS: A Fast Memory-Aware Neural Architecture Search Framework for Spiking Neural Network-based Autonomous Agents	Feb 17, 2024	GPUNeural Architecture Search	—Unverified
Leveraging Self-Supervised Instance Contrastive Learning for Radar Object Detection	Feb 13, 2024	Contrastive LearningObject	—Unverified
A Benchmark Grocery Dataset of Realworld Point Clouds From Single View	Feb 12, 2024	3D Point Cloud ClassificationContinual Learning	—Unverified
Optimizing Sparse Convolution on GPUs with CUDA for 3D Point Cloud Processing in Embedded Systems	Feb 12, 2024	Object Recognition	—Unverified

Show:10 25 50

← PrevPage 9 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified