Referring Expression

Referring expressions places a bounding box around the instance corresponding to the provided description and image.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 364 papers

Title	Date	Tasks	Status
M^2IST: Multi-Modal Interactive Side-Tuning for Efficient Referring Expression Comprehension	Jul 1, 2024	GPUReferring Expression	—Unverified
Segment Anything Model for automated image data annotation: empirical studies using text prompts from Grounding DINO	Jun 27, 2024	Image SegmentationMedical Image Segmentation	—Unverified
ScanFormer: Referring Expression Comprehension by Iteratively Scanning	Jun 26, 2024	InformativenessReferring Expression	—Unverified
GOI: Find 3D Gaussians of Interest with an Optimizable Open-vocabulary Semantic-space Hyperplane	May 27, 2024	3DGSfeature selection	—Unverified
Bring Adaptive Binding Prototypes to Generalized Referring Expression Segmentation	May 24, 2024	DecoderGeneralized Referring Expression Segmentation	CodeCode Available
Adversarial Robustness for Visual Grounding of Multimodal Large Language Models	May 16, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available
Transcrib3D: 3D Referring Expression Resolution through Large Language Models	Apr 30, 2024	Referring Expression	—Unverified
Resilience through Scene Context in Visual Referring Expression Generation	Apr 18, 2024	Referring ExpressionReferring expression generation	CodeCode Available
Text-driven Affordance Learning from Egocentric Vision	Apr 3, 2024	Referring ExpressionReferring Expression Comprehension	—Unverified
SUGAR: Pre-training 3D Visual Representations for Robotics	Apr 1, 2024	3D Instance Segmentation3D Object Recognition	—Unverified
PropTest: Automatic Property Testing for Improved Visual Programming	Mar 25, 2024	Question AnsweringReferring Expression	—Unverified
WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar	Mar 19, 2024	Autonomous NavigationReferring Expression	—Unverified
Contrastive Region Guidance: Improving Grounding in Vision-Language Models without Training	Mar 4, 2024	MathPhrase Grounding	—Unverified
Intrinsic Task-based Evaluation for Referring Expression Generation	Feb 12, 2024	Referring ExpressionReferring expression generation	—Unverified
RESMatch: Referring Expression Segmentation in a Semi-Supervised Manner	Feb 8, 2024	Image SegmentationPseudo Label	—Unverified
Generalizable Entity Grounding via Assistance of Large Language Model	Feb 4, 2024	Language ModelingLanguage Modelling	—Unverified
Viewpoint-Aware Visual Grounding in 3D Scenes	Jan 1, 2024	3D visual groundingReferring Expression	—Unverified
Revisiting Counterfactual Problems in Referring Expression Comprehension	Jan 1, 2024	AttributeContrastive Learning	CodeCode Available
Compositional Zero-Shot Learning for Attribute-Based Object Reference in Human-Robot Interaction	Dec 21, 2023	16kAttribute	—Unverified
Localized Symbolic Knowledge Distillation for Visual Commonsense Models	Dec 8, 2023	Image DescriptionInstruction Following	CodeCode Available
Learning Pseudo-Labeler beyond Noun Concepts for Open-Vocabulary Object Detection	Dec 4, 2023	Image to textobject-detection	—Unverified
InstructSeq: Unifying Vision Tasks with Instruction-conditioned Multi-modal Sequence Generation	Nov 30, 2023	Image CaptioningReferring Expression	CodeCode Available
Continual Referring Expression Comprehension via Dual Modular Memorization	Nov 25, 2023	MemorizationReferring Expression	CodeCode Available
Griffon: Spelling out All Object Locations at Any Granularity with Large Language Models	Nov 24, 2023	AllReferring Expression	—Unverified
Enhancing Visual Grounding and Generalization: A Multi-Task Cycle Training Approach for Vision-Language Models	Nov 21, 2023	Image SegmentationLanguage Modelling	CodeCode Available
CoVLM: Composing Visual Entities and Relationships in Large Language Models Via Communicative Decoding	Nov 6, 2023	CoLAQuestion Answering	—Unverified
Towards Omni-supervised Referring Expression Segmentation	Nov 1, 2023	Referring ExpressionReferring Expression Segmentation	CodeCode Available
Text Augmented Spatial-aware Zero-shot Referring Image Segmentation	Oct 27, 2023	Image SegmentationReferring Expression	—Unverified
Video Referring Expression Comprehension via Transformer with Content-conditioned Query	Oct 25, 2023	cross-modal alignmentReferring Expression	—Unverified
Multi-modal Domain Adaptation for REG via Relation Transfer	Sep 23, 2023	Domain Adaptationimage-classification	—Unverified
CLIPUNetr: Assisting Human-robot Interface for Uncalibrated Visual Servoing Control with CLIP-driven Referring Expression Segmentation	Sep 17, 2023	DecoderReferring Expression	—Unverified
Collecting Visually-Grounded Dialogue with A Game Of Sorts	Sep 10, 2023	Coreference ResolutionImage Retrieval	CodeCode Available
Whether you can locate or not? Interactive Referring Expression Generation	Aug 19, 2023	Referring ExpressionReferring Expression Comprehension	CodeCode Available
'What are you referring to?' Evaluating the Ability of Multi-Modal Dialogue Models to Process Clarificational Exchanges	Jul 28, 2023	Referring Expression	CodeCode Available
Switching Head-Tail Funnel UNITER for Dual Referring Expression Comprehension with Fetch-and-Carry Tasks	Jul 14, 2023	ObjectReferring Expression	—Unverified
Switch-BERT: Learning to Model Multimodal Interactions by Switching Attention and Input	Jun 25, 2023	DiversityImage-text Retrieval	—Unverified
Referring Expression Comprehension Using Language Adaptive Inference	Jun 6, 2023	object-detectionObject Detection	CodeCode Available
Language Adaptive Weight Generation for Multi-task Visual Grounding	Jun 6, 2023	Referring ExpressionReferring Expression Comprehension	CodeCode Available
DisCLIP: Open-Vocabulary Referring Expression Generation	May 30, 2023	Referring ExpressionReferring expression generation	—Unverified
Language-Guided 3D Object Detection in Point Cloud for Autonomous Driving	May 25, 2023	3D Object DetectionAutonomous Driving	—Unverified
Pento-DIARef: A Diagnostic Dataset for Learning the Incremental Algorithm for Referring Expression Generation from Examples	May 24, 2023	DiagnosticReferring Expression	CodeCode Available
Yes, this Way! Learning to Ground Referring Expressions into Actions with Intra-episodic Feedback from Supportive Teachers	May 22, 2023	Referring Expression	CodeCode Available
Meta Compositional Referring Expression Segmentation	Apr 10, 2023	Meta-LearningReferring Expression	—Unverified
CK-Transformer: Commonsense Knowledge Enhanced Transformers for Referring Expression Comprehension	Feb 17, 2023	Referring ExpressionReferring Expression Comprehension	CodeCode Available
Dynamic Inference With Grounding Based Vision and Language Models	Jan 1, 2023	Language ModellingReferring Expression	—Unverified
Learning To Segment Every Referring Object Point by Point	Jan 1, 2023	ObjectReferring Expression	CodeCode Available
RefCLIP: A Universal Teacher for Weakly Supervised Referring Expression Comprehension	Jan 1, 2023	Referring ExpressionReferring Expression Comprehension	—Unverified
RefTeacher: A Strong Baseline for Semi-Supervised Referring Expression Comprehension	Jan 1, 2023	Imitation LearningPseudo Label	—Unverified
Fully and Weakly Supervised Referring Expression Segmentation with End-to-End Learning	Dec 17, 2022	PositionReferring Expression	—Unverified
A Unified Mutual Supervision Framework for Referring Expression Segmentation and Generation	Nov 15, 2022	Reference Expression GenerationReferring Expression	—Unverified

Show:10 25 50

← PrevPage 4 of 8Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Random	[email protected]	14.6	—	Unverified