Object Recognition

Object recognition is a computer vision technique for detecting + classifying objects in images or videos. Since this is a combined task of object detection plus image classification, the state-of-the-art tables are recorded for each component task here and here.

( Image credit: Tensorflow Object Detection API )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 2042 papers

Title	Date	Tasks	Status	Hype
Mapping High-level Semantic Regions in Indoor Environments without Object Recognition	Mar 11, 2024	Graph GenerationLanguage Modeling	—Unverified	0
Textureless Object Recognition: An Edge-based Approach	Mar 10, 2024	ObjectObject Recognition	—Unverified	0
A spatiotemporal style transfer algorithm for dynamic visual stimulus generation	Mar 7, 2024	Image GenerationObject Recognition	—Unverified	0
LoDisc: Learning Global-Local Discriminative Features for Self-Supervised Fine-Grained Visual Recognition	Mar 6, 2024	Contrastive LearningFine-Grained Visual Recognition	—Unverified	0
MiKASA: Multi-Key-Anchor & Scene-Aware Transformer for 3D Visual Grounding	Mar 5, 2024	3D visual groundingDecision Making	CodeCode Available	1
Dual Pose-invariant Embeddings: Learning Category and Object-specific Discriminative Representations for Recognition and Retrieval	Mar 1, 2024	ObjectObject Recognition	—Unverified	0
DOZE: A Dataset for Open-Vocabulary Zero-Shot Object Navigation in Dynamic Environments	Feb 29, 2024	AttributeCollision Avoidance	—Unverified	0
Unveiling Typographic Deceptions: Insights of the Typographic Vulnerability in Large Vision-Language Model	Feb 29, 2024	Language ModelingLanguage Modelling	—Unverified	0
Probing Multimodal Large Language Models for Global and Local Semantic Representations	Feb 27, 2024	Image to textobject-detection	CodeCode Available	0
CLoVe: Encoding Compositional Language in Contrastive Vision-Language Models	Feb 22, 2024	Object RecognitionRetrieval	CodeCode Available	1
ISCUTE: Instance Segmentation of Cables Using Text Embedding	Feb 19, 2024	Instance SegmentationObject Recognition	—Unverified	0
SpikeNAS: A Fast Memory-Aware Neural Architecture Search Framework for Spiking Neural Network-based Autonomous Agents	Feb 17, 2024	GPUNeural Architecture Search	—Unverified	0
Leveraging Self-Supervised Instance Contrastive Learning for Radar Object Detection	Feb 13, 2024	Contrastive LearningObject	—Unverified	0
A Benchmark Grocery Dataset of Realworld Point Clouds From Single View	Feb 12, 2024	3D Point Cloud ClassificationContinual Learning	—Unverified	0
Optimizing Sparse Convolution on GPUs with CUDA for 3D Point Cloud Processing in Embedded Systems	Feb 12, 2024	Object Recognition	—Unverified	0
Logical recognition method for solving the problem of identification in the Internet of Things	Feb 6, 2024	Object Recognition	—Unverified	0
A comparison between humans and AI at recognizing objects in unusual poses	Feb 6, 2024	Object Recognition	CodeCode Available	0
SHIELD : An Evaluation Benchmark for Face Spoofing and Forgery Detection with Multimodal Large Language Models	Feb 6, 2024	AttributeFace Anti-Spoofing	CodeCode Available	1
Motion Mapping Cognition: A Nondecomposable Primary Process in Human Vision	Feb 2, 2024	Image SegmentationObject Recognition	—Unverified	0
Self-supervised learning of video representations from a child's perspective	Feb 1, 2024	Object RecognitionSelf-Supervised Learning	CodeCode Available	1
Lightweight Pixel Difference Networks for Efficient Visual Representation Learning	Feb 1, 2024	Edge DetectionObject Recognition	CodeCode Available	4
Local Feature Matching Using Deep Learning: A Survey	Jan 31, 2024	3D ReconstructionDeep Learning	CodeCode Available	2
Achieving More Human Brain-Like Vision via Human EEG Representational Alignment	Jan 30, 2024	Adversarial RobustnessEEG	—Unverified	0
EdgeOL: Efficient in-situ Online Learning on Edge Devices	Jan 30, 2024	Continual LearningObject Recognition	—Unverified	0
EventF2S: Asynchronous and Sparse Spiking AER Framework using Neuromorphic-Friendly Algorithm	Jan 28, 2024	DenoisingObject Recognition	—Unverified	0
The Machine Vision Iceberg Explained: Advancing Dynamic Testing by Considering Holistic Environmental Relations	Jan 26, 2024	Object Recognition	—Unverified	0
pix2gestalt: Amodal Segmentation by Synthesizing Wholes	Jan 25, 2024	3D ReconstructionObject Recognition	CodeCode Available	3
Synthetic data enables faster annotation and robust segmentation for multi-object grasping in clutter	Jan 24, 2024	Dataset GenerationImage Segmentation	—Unverified	0
Agricultural Object Detection with You Look Only Once (YOLO) Algorithm: A Bibliometric and Systematic Literature Review	Jan 18, 2024	ArticlesObject	—Unverified	0
ContextMix: A context-aware data augmentation method for industrial visual inspection systems	Jan 18, 2024	Data AugmentationObject Recognition	CodeCode Available	0
Geo-locating Road Objects using Inverse Haversine Formula with NVIDIA Driveworks	Jan 15, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Application of 2D Homography for High Resolution Traffic Data Collection using CCTV Cameras	Jan 14, 2024	Camera CalibrationObject Recognition	—Unverified	0
Seeing the roads through the trees: A benchmark for modeling spatial dependencies with aerial imagery	Jan 12, 2024	Object RecognitionRoad Segmentation	CodeCode Available	2
Meta-forests: Domain generalization on random forests with meta-learning	Jan 9, 2024	Domain GeneralizationMeta-Learning	—Unverified	0
Incorporating Geo-Diverse Knowledge into Prompting for Increased Geographical Robustness in Object Recognition	Jan 3, 2024	DescriptiveLanguage Modeling	—Unverified	0
Shrinking Your TimeStep: Towards Low-Latency Neuromorphic Object Recognition with Spiking Neural Network	Jan 2, 2024	Data AugmentationEvent data classification	—Unverified	0
Layerwise complexity-matched learning yields an improved model of cortical area V2	Dec 18, 2023	Object Recognition	—Unverified	0
CLIP-guided Federated Learning on Heterogeneous and Long-Tailed Data	Dec 14, 2023	Contrastive LearningFederated Learning	CodeCode Available	1
Object Recognition from Scientific Document based on Compartment Refinement Framework	Dec 14, 2023	ArticlesDocument Layout Analysis	—Unverified	0
Representational constraints underlying similarity between task-optimized neural systems	Dec 13, 2023	Object Recognition	—Unverified	0
Exploring Novel Object Recognition and Spontaneous Location Recognition Machine Learning Analysis Techniques in Alzheimer's Mice	Dec 12, 2023	Object RecognitionPose Estimation	CodeCode Available	0
The Quest for an Integrated Set of Neural Mechanisms Underlying Object Recognition in Primates	Dec 10, 2023	ObjectObject Recognition	—Unverified	0
Scientific Preparation for CSST: Classification of Galaxy and Nebula/Star Cluster Based on Deep Learning	Dec 8, 2023	image-classificationImage Classification	—Unverified	0
Are Vision Transformers More Data Hungry Than Newborn Visual Systems?	Dec 5, 2023	ObjectObject Recognition	CodeCode Available	0
SRTransGAN: Image Super-Resolution using Transformer based Generative Adversarial Network	Dec 4, 2023	Binary ClassificationDecoder	—Unverified	0
COTR: Compact Occupancy TRansformer for Vision-based 3D Occupancy Prediction	Dec 4, 2023	3D geometryAutonomous Driving	CodeCode Available	1
Object Recognition as Next Token Prediction	Dec 4, 2023	DecoderLanguage Modeling	CodeCode Available	1
Foveation in the Era of Deep Learning	Dec 3, 2023	Deep LearningFoveation	CodeCode Available	0
Developmental Pretraining (DPT) for Image Classification Networks	Dec 1, 2023	Classificationimage-classification	CodeCode Available	0
Learning for Semantic Knowledge Base-Guided Online Feature Transmission in Dynamic Channels	Nov 30, 2023	Autonomous VehiclesDecision Making	—Unverified	0

Show:10 25 50

← PrevPage 6 of 41Next →

All datasets shape bias CIFAR10-DVS N-Caltech 101 ObjectNet (All classes)ObjectNet (ImageNet classes)ObjectNet (ImageNet classes, trained on ImageNet)DVS128 Gesture MECCANO N-CARS

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Imagen	shape bias	98.7	—	Unverified
2	Stable Diffusion	shape bias	92.7	—	Unverified
3	Parti	shape bias	91.7	—	Unverified
4	ViT-22B-384	shape bias	86.4	—	Unverified
5	ViT-22B-560	shape bias	83.8	—	Unverified
6	CLIP (ViT-B)	shape bias	79.9	—	Unverified
7	ViT-22B-224	shape bias	78	—	Unverified
8	ResNet-50 (L2 eps 5.0 adv trained)	shape bias	69.5	—	Unverified
9	ResNet-50 (with strong augmentations)	shape bias	62.2	—	Unverified
10	SWSL (ResNeXt-101)	shape bias	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.55	—	Unverified
2	SSNN	Accuracy (% )	78.57	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	85.62	—	Unverified
2	SSNN	Accuracy (% )	79.25	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	18.75	—	Unverified
2	yun	Top 5 Accuracy	14.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	DY	Top 5 Accuracy	0.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ObjectNet-Baseline	Top 5 Accuracy	52.24	—	Unverified
2	AJ2021	Top 5 Accuracy	27.68	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSNN	Accuracy (% )	94.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Faster-RCNN	mAP	30.39	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Spike-VGG11	Accuracy (% )	96	—	Unverified