Generalized Referring Expression Segmentation

Generalized Referring Expression Segmentation (GRES), introduced by Liu et al in CVPR 2023, allows expressions indicating any number of target objects. GRES takes an image and a referring expression as input, and requires mask prediction of the target object(s).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–15 of 15 papers

Title	Date	Tasks	Status	Hype
DeRIS: Decoupling Perception and Cognition for Enhanced Referring Image Segmentation through Loopback Synergy	Jul 2, 2025	Data AugmentationGeneralized Referring Expression Segmentation	CodeCode Available	1
Refer to Anything with Vision-Language Prompts	Jun 5, 2025	BenchmarkingGeneralized Referring Expression Segmentation	—Unverified	0
Hierarchical Alignment-enhanced Adaptive Grounding Network for Generalized Referring Expression Comprehension	Jan 2, 2025	Generalized Referring Expression ComprehensionGeneralized Referring Expression Segmentation	—Unverified	0
Instance-Aware Generalized Referring Expression Segmentation	Nov 22, 2024	Generalized Referring Expression SegmentationObject	—Unverified	0
Bring Adaptive Binding Prototypes to Generalized Referring Expression Segmentation	May 24, 2024	DecoderGeneralized Referring Expression Segmentation	CodeCode Available	0
CoHD: A Counting-Aware Hierarchical Decoding Framework for Generalized Referring Expression Segmentation	May 24, 2024	Generalized Referring Expression SegmentationObject	CodeCode Available	1
PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model	Mar 21, 2024	DecoderGeneralized Referring Expression Segmentation	CodeCode Available	3
GROUNDHOG: Grounding Large Language Models to Holistic Segmentation	Feb 26, 2024	Causal Language ModelingGeneralized Referring Expression Segmentation	—Unverified	0
GSVA: Generalized Segmentation via Multimodal Large Language Models	Dec 15, 2023	DecoderGeneralized Referring Expression Segmentation	CodeCode Available	1
GRES: Generalized Referring Expression Segmentation	Jun 1, 2023	Generalized Referring Expression SegmentationReferring Expression	CodeCode Available	2
LAVT: Language-Aware Vision Transformer for Referring Image Segmentation	Dec 4, 2021	DecoderGeneralized Referring Expression Segmentation	CodeCode Available	1
CRIS: CLIP-Driven Referring Image Segmentation	Nov 30, 2021	Contrastive LearningDecoder	CodeCode Available	1
Vision-Language Transformer and Query Generation for Referring Segmentation	Aug 12, 2021	DecoderGeneralized Referring Expression Comprehension	CodeCode Available	1
Locate then Segment: A Strong Pipeline for Referring Image Segmentation	Mar 30, 2021	Generalized Referring Expression SegmentationImage Segmentation	—Unverified	0
MAttNet: Modular Attention Network for Referring Expression Comprehension	Jan 24, 2018	Generalized Referring Expression SegmentationReferring Expression	CodeCode Available	0

Show:10 25 50

No leaderboard results yet.