Scene Understanding

Scene understanding involves interpreting the visual information of a scene, including objects, their spatial relationships, and the overall layout. It goes beyond simple object recognition by considering the context and how objects relate to each other and the environment.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 1723 papers

Title	Date	Tasks	Status	Hype
A Survey on Deep Learning Technique for Video Segmentation	Jul 2, 2021	Autonomous DrivingDeep Learning	CodeCode Available	1
An Analysis of State-of-the-Art Models for Situated Interactive MultiModal Conversations (SIMMC)	Jul 1, 2021	Scene Understanding	—Unverified	0
Egocentric Image Captioning for Privacy-Preserved Passive Dietary Intake Monitoring	Jul 1, 2021	Food RecognitionImage Captioning	—Unverified	0
Unsupervised Image Segmentation by Mutual Information Maximization and Adversarial Regularization	Jul 1, 2021	Image SegmentationScene Understanding	—Unverified	0
IMENet: Joint 3D Semantic Scene Completion and 2D Semantic Segmentation through Iterative Mutual Enhancement	Jun 29, 2021	2D Semantic Segmentation3D Semantic Scene Completion	—Unverified	0
False Negative Reduction in Video Instance Segmentation using Uncertainty Estimates	Jun 28, 2021	Depth EstimationInstance Segmentation	CodeCode Available	0
SDOF-Tracker: Fast and Accurate Multiple Human Tracking by Skipped-Detection and Optical-Flow	Jun 27, 2021	Human DetectionOptical Flow Estimation	CodeCode Available	0
OffRoadTranSeg: Semi-Supervised Segmentation using Transformers on OffRoad environments	Jun 26, 2021	Autonomous DrivingDepth Estimation	—Unverified	0
iReason: Multimodal Commonsense Reasoning using Videos and Natural Language with Interpretability	Jun 25, 2021	Bias DetectionQuestion Answering	—Unverified	0
P2T: Pyramid Pooling Transformer for Scene Understanding	Jun 22, 2021	image-classificationImage Classification	CodeCode Available	1
EPMF: Efficient Perception-aware Multi-sensor Fusion for 3D Semantic Segmentation	Jun 21, 2021	3D Semantic SegmentationAutonomous Driving	CodeCode Available	1
Projecting Your View Attentively: Monocular Road Scene Layout Estimation via Cross-View Transformation	Jun 19, 2021	Autonomous DrivingGPU	CodeCode Available	1
OpenRooms: An Open Framework for Photorealistic Indoor Scene Datasets	Jun 19, 2021	FrictionInverse Rendering	—Unverified	0
Feature-Level Collaboration: Joint Unsupervised Learning of Optical Flow, Stereo Depth and Camera Motion	Jun 19, 2021	Camera Pose EstimationDecoder	—Unverified	0
Part-aware Panoptic Segmentation	Jun 11, 2021	Image SegmentationPanoptic Segmentation	CodeCode Available	1
Vision Transformers with Hierarchical Attention	Jun 6, 2021	image-classificationImage Classification	CodeCode Available	1
Light Field Networks: Neural Scene Representations with Single-Evaluation Rendering	Jun 4, 2021	Meta-LearningScene Understanding	CodeCode Available	1
Towards urban scenes understanding through polarization cues	Jun 3, 2021	Depth EstimationScene Understanding	—Unverified	0
Polarimetric Spatio-Temporal Light Transport Probing	May 25, 2021	MetamerismScene Understanding	—Unverified	0
Egocentric Activity Recognition and Localization on a 3D Map	May 20, 2021	Action LocalizationAction Recognition	—Unverified	0
SAIL-VOS 3D: A Synthetic Dataset and Baselines for Object Detection and 3D Mesh Reconstruction from Video Data	May 18, 2021	object-detectionObject Detection	—Unverified	0
Image interpretation by iterative bottom-up top-down processing	May 12, 2021	Scene Understanding	CodeCode Available	0
Scene Understanding for Autonomous Driving	May 11, 2021	Autonomous DrivingScene Understanding	—Unverified	0
Lane Graph Estimation for Scene Understanding in Urban Driving	May 1, 2021	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
ACDC: The Adverse Conditions Dataset with Correspondences for Robust Semantic Driving Scene Perception	Apr 27, 2021	Instance Segmentationobject-detection	—Unverified	0
RelTransformer: A Transformer-Based Long-Tail Visual Relationship Recognition	Apr 24, 2021	Image CaptioningObject Recognition	CodeCode Available	1
Aerial Scene Understanding in The Wild: Multi-Scene Recognition via Prototype-based Memory Networks	Apr 22, 2021	RetrievalScene Recognition	CodeCode Available	0
Wireless Sensing With Deep Spectrogram Network and Primitive Based Autoregressive Hybrid Channel Model	Apr 21, 2021	Dataset GenerationScene Understanding	—Unverified	0
MonoGRNet: A General Framework for Monocular 3D Object Detection	Apr 18, 2021	2D Object Detection3D Object Detection	—Unverified	0
SSPC-Net: Semi-supervised Semantic 3D Point Cloud Segmentation Network	Apr 16, 2021	Point Cloud SegmentationScene Understanding	CodeCode Available	1
Single Image Depth Estimation: An Overview	Apr 13, 2021	Deep LearningDepth Estimation	—Unverified	0
Visiting the Invisible: Layer-by-Layer Completed Scene Decomposition	Apr 12, 2021	Instance SegmentationScene Understanding	CodeCode Available	1
Semantic Scene Completion via Integrating Instances and Scene in-the-Loop	Apr 8, 2021	3D Semantic Scene CompletionScene Understanding	CodeCode Available	1
Affordance Transfer Learning for Human-Object Interaction Detection	Apr 7, 2021	Affordance DetectionAffordance Recognition	CodeCode Available	1
Learning Triadic Belief Dynamics in Nonverbal Communication from Videos	Apr 7, 2021	Scene Understanding	CodeCode Available	1
Deep ensembles based on Stochastic Activation Selection for Polyp Segmentation	Apr 2, 2021	Autonomous DrivingDecoder	—Unverified	0
Evaluation of Multimodal Semantic Segmentation using RGB-D Data	Mar 31, 2021	Scene UnderstandingSemantic Segmentation	—Unverified	0
Multi-View Radar Semantic Segmentation	Mar 30, 2021	Autonomous Drivingobject-detection	CodeCode Available	1
PlaneSegNet: Fast and Robust Plane Estimation Using a Single-stage Instance Segmentation CNN	Mar 29, 2021	Instance SegmentationScene Understanding	—Unverified	0
SceneGraphFusion: Incremental 3D Scene Graph Prediction from RGB-D Sequences	Mar 27, 2021	3D Object Classification3d scene graph generation	CodeCode Available	1
Bidirectional Projection Network for Cross Dimension Scene Understanding	Mar 26, 2021	2D Semantic Segmentation3D Semantic Segmentation	CodeCode Available	1
Input-Output Balanced Framework for Long-tailed LiDAR Semantic Segmentation	Mar 26, 2021	Autonomous VehiclesDiversity	—Unverified	0
Tracking Pedestrian Heads in Dense Crowd	Mar 24, 2021	Head DetectionMulti-Object Tracking	CodeCode Available	1
Relation-aware Instance Refinement for Weakly Supervised Visual Grounding	Mar 24, 2021	ObjectRelation	CodeCode Available	1
OFFSEG: A Semantic Segmentation Framework For Off-Road Driving	Mar 23, 2021	Scene UnderstandingSegmentation	CodeCode Available	1
Cross-Dataset Collaborative Learning for Semantic Segmentation in Autonomous Driving	Mar 21, 2021	3D Semantic SegmentationAutonomous Driving	—Unverified	0
Knowledge-Guided Object Discovery with Acquired Deep Impressions	Mar 19, 2021	ObjectObject Discovery	CodeCode Available	0
A Comprehensive Survey of Scene Graphs: Generation and Application	Mar 17, 2021	Image CaptioningQuestion Answering	—Unverified	0
Lite-HDSeg: LiDAR Semantic Segmentation Using Lite Harmonic Dense Convolutions	Mar 16, 2021	Autonomous DrivingDecoder	—Unverified	0
Detecting Human-Object Interaction via Fabricated Compositional Learning	Mar 15, 2021	Affordance RecognitionHuman-Object Interaction Detection	CodeCode Available	1

Show:10 25 50

← PrevPage 24 of 35Next →

All datasets Semantic Scene Understanding Challenge (passive actuation & ground-truth localisation)ADE20K val Semantic Scene Understanding Challenge (active actuation & ground-truth localisation)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ACRV Baseline	OMQ	0.44	—	Unverified
2	Team VGAI (TCS Research)	OMQ	0.37	—	Unverified
3	Demo_semantic_SLAM	OMQ	0.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CPN(ResNet-101)	Mean IoU	46.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ACRV Baseline	OMQ	0.35	—	Unverified