Scene Graph Generation

A scene graph is a structured representation of an image, where nodes in a scene graph correspond to object bounding boxes with their object categories, and edges correspond to their pairwise relationships between objects. The task of Scene Graph Generation is to generate a visually-grounded scene graph that most accurately correlates with an image.

Source: Scene Graph Generation by Iterative Message Passing

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 318 papers

Title	Date	Tasks	Status	Hype
4D Panoptic Scene Graph Generation	May 16, 2024	4D Panoptic SegmentationGraph Generation	CodeCode Available	3
Open World Scene Graph Generation using Vision Language Models	Jun 9, 2025	Graph GenerationScene Graph Generation	CodeCode Available	2
MM-OR: A Large Multimodal Operating Room Dataset for Semantic Understanding of High-Intensity Surgical Environments	Mar 4, 2025	2D Panoptic SegmentationGraph Generation	CodeCode Available	2
RelationField: Relate Anything in Radiance Fields	Dec 18, 2024	3d scene graph generationGraph Generation	CodeCode Available	2
SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding	Jun 14, 2024	Graph GenerationRelation	CodeCode Available	2
STAR: A First-Ever Dataset and A Large-Scale Benchmark for Scene Graph Generation in Large-Size Satellite Imagery	Jun 13, 2024	Graph GenerationObject	CodeCode Available	2
REACT: Real-time Efficiency and Accuracy Compromise for Tradeoffs in Scene Graph Generation	May 25, 2024	Graph GenerationObject	CodeCode Available	2
EGTR: Extracting Graph from Transformer for Scene Graph Generation	Apr 2, 2024	Graph GenerationMulti-Task Learning	CodeCode Available	2
From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models	Apr 1, 2024	Graph GenerationImage to text	CodeCode Available	2
HiKER-SGG: Hierarchical Knowledge Enhanced Robust Scene Graph Generation	Mar 18, 2024	Scene Graph Generation	CodeCode Available	2
SGTR+: End-to-end Scene Graph Generation with Transformer	Jan 23, 2024	graph constructionGraph Generation	CodeCode Available	2
Panoptic Scene Graph Generation	Jul 22, 2022	BenchmarkingPanoptic Scene Graph Generation	CodeCode Available	2
RelTR: Relation Transformer for Scene Graph Generation	Jan 27, 2022	DecoderGraph Generation	CodeCode Available	2
Unbiased Scene Graph Generation from Biased Training	Feb 27, 2020	Causal Inferencecounterfactual	CodeCode Available	2
Learning to Compose Dynamic Tree Structures for Visual Contexts	Dec 5, 2018	Graph GenerationPanoptic Scene Graph Generation	CodeCode Available	2
EgoExOR: An Ego-Exo-Centric Operating Room Dataset for Surgical Activity Understanding	May 30, 2025	Action RecognitionGraph Generation	CodeCode Available	1
DIFFVSGG: Diffusion-Driven Online Video Scene Graph Generation	Mar 18, 2025	DenoisingGPU	CodeCode Available	1
Weakly Supervised Video Scene Graph Generation via Natural Language Supervision	Feb 21, 2025	Graph GenerationImage Captioning	CodeCode Available	1
RA-SGG: Retrieval-Augmented Scene Graph Generation Framework via Multi-Prototype Learning	Dec 17, 2024	Graph GenerationMulti-Label Classification	CodeCode Available	1
ProVision: Programmatically Scaling Vision-centric Instruction Data for Multimodal Language Models	Dec 9, 2024	Graph GenerationScene Graph Generation	CodeCode Available	1
LLaVA-SpaceSGG: Visual Instruct Tuning for Open-vocabulary Scene Graph Generation with Enhanced Spatial Relations	Dec 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Scene Graph Generation with Role-Playing Large Language Models	Oct 20, 2024	DescriptiveGraph Generation	CodeCode Available	1
Semantic Diversity-aware Prototype-based Learning for Unbiased Scene Graph Generation	Jul 22, 2024	DiversityGraph Generation	CodeCode Available	1
OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models	Jul 15, 2024	Graph Generationobject-detection	CodeCode Available	1
A Fair Ranking and New Model for Panoptic Scene Graph Generation	Jul 12, 2024	Graph GenerationPanoptic Scene Graph Generation	CodeCode Available	1
Leveraging Predicate and Triplet Learning for Scene Graph Generation	Jun 4, 2024	Graph GenerationRelation	CodeCode Available	1
OED: Towards One-stage End-to-End Dynamic Scene Graph Generation	May 27, 2024	Graph Generationobject-detection	CodeCode Available	1
A Review and Efficient Implementation of Scene Graph Generation Metrics	Apr 15, 2024	BenchmarkingGraph Generation	CodeCode Available	1
ORacle: Large Vision-Language Models for Knowledge-Guided Holistic OR Domain Modeling	Apr 10, 2024	Data AugmentationGraph Generation	CodeCode Available	1
SportsHHI: A Dataset for Human-Human Interaction Detection in Sports Videos	Apr 6, 2024	Graph GenerationRelation	CodeCode Available	1
Groupwise Query Specialization and Quality-Aware Multi-Assignment for Transformer-based Visual Relationship Detection	Mar 26, 2024	RelationRelationship Detection	CodeCode Available	1
Towards Scene Graph Anticipation	Mar 7, 2024	Graph GenerationLong Term Anticipation	CodeCode Available	1
Adaptive Self-training Framework for Fine-grained Scene Graph Generation	Jan 18, 2024	Graph GenerationScene Graph Generation	CodeCode Available	1
Panoptic Video Scene Graph Generation	Nov 28, 2023	Graph GenerationPanoptic Scene Graph Generation	CodeCode Available	1
VLPrompt: Vision-Language Prompting for Panoptic Scene Graph Generation	Nov 27, 2023	Graph GenerationPanoptic Scene Graph Generation	CodeCode Available	1
Enhancing Scene Graph Generation with Hierarchical Relationships and Commonsense Knowledge	Nov 21, 2023	Large Language ModelMultimodal Deep Learning	CodeCode Available	1
Expanding Scene Graph Boundaries: Fully Open-vocabulary Scene Graph Generation via Visual-Concept Alignment and Retention	Nov 18, 2023	Concept AlignmentGraph Generation	CodeCode Available	1
NeuSyRE: Neuro-Symbolic Visual Understanding and Reasoning Framework based on Scene Graph Enrichment	Nov 5, 2023	Caption GenerationCommon Sense Reasoning	CodeCode Available	1
LLM4SGG: Large Language Models for Weakly Supervised Scene Graph Generation	Oct 16, 2023	Few-Shot LearningLarge Language Model	CodeCode Available	1
Less is More: Toward Zero-Shot Local Scene Graph Generation via Foundation Models	Oct 2, 2023	Graph GenerationScene Graph Generation	CodeCode Available	1
Spatial-Temporal Knowledge-Embedded Transformer for Video Scene Graph Generation	Sep 23, 2023	Graph GenerationObject	CodeCode Available	1
Zero-Shot Scene Graph Generation via Triplet Calibration and Reduction	Sep 7, 2023	Graph GenerationScene Graph Generation	CodeCode Available	1
Vision Relation Transformer for Unbiased Scene Graph Generation	Aug 18, 2023	DecoderGraph Generation	CodeCode Available	1
RLIPv2: Fast Scaling of Relational Language-Image Pre-training	Aug 18, 2023	Graph GenerationHuman-Object Interaction Detection	CodeCode Available	1
Compositional Feature Augmentation for Unbiased Scene Graph Generation	Aug 13, 2023	DiversityGraph Generation	CodeCode Available	1
Panoptic Scene Graph Generation with Semantics-Prototype Learning	Jul 28, 2023	Graph GenerationPanoptic Scene Graph Generation	CodeCode Available	1
Pair then Relation: Pair-Net for Panoptic Scene Graph Generation	Jul 17, 2023	Graph GenerationPanoptic Scene Graph Generation	CodeCode Available	1
Manga109Dialog: A Large-scale Dialogue Dataset for Comics Speaker Detection	Jun 30, 2023	Graph GenerationScene Graph Generation	CodeCode Available	1
Unbiased Scene Graph Generation in Videos	Apr 3, 2023	Graph GenerationScene Graph Generation	CodeCode Available	1
SPAN: Learning Similarity between Scene Graphs and Images with Transformers	Apr 2, 2023	Contrastive LearningGraph Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 7Next →

All datasets Visual Genome 4D-OR 3R-Scan VRD GQA MM-OR MS-COCO

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ExpressiveSGG	R@100	39.12	—	Unverified
2	NeuSyRE	R@100	39.1	—	Unverified
3	KnowZRel	zR@100	35.65	—	Unverified
4	SpeaQ (without reweighting)	Recall@50	32.9	—	Unverified
5	SpeaQ (with reweighting)	Recall@50	32.1	—	Unverified
6	Causal-TDE	Recall@50	31.93	—	Unverified
7	SG-EBM	Recall@50	31.74	—	Unverified
8	GPS-Net	Recall@50	28.9	—	Unverified
9	LOGIN	Recall@50	28.2	—	Unverified
10	VCTree	Recall@50	27.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ORacle	F1	0.91	—	Unverified
2	MM2SG	F1	0.9	—	Unverified
3	Pix2SG	F1	0.9	—	Unverified
4	LABRAD-OR	F1	0.88	—	Unverified
5	4D-OR baseline	F1	0.75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SceneGraphFusion	Top-5 Accuracy	0.87	—	Unverified
2	3DSSG [Wald2020_3dssg]	Top-5 Accuracy	0.66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FactorizableNet	Recall@50	18.32	—	Unverified
2	VRD	Recall@50	18.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	KnowZRel	zR@100	29.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MM2SG	Macro F1	0.53	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	NeuSyRE	R@100	38.5	—	Unverified