Referring Expression Comprehension

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 167 papers

Title	Date	Tasks	Status
RefCrowd: Grounding the Target in Crowd with Referring Expressions	Jun 16, 2022	AttributeReferring Expression	—Unverified
WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar	Mar 19, 2024	Autonomous NavigationReferring Expression	—Unverified
Referring Expression Comprehension: A Survey of Methods and Datasets	Jul 19, 2020	object-detectionObject Detection	—Unverified
Self-paced Multi-grained Cross-modal Interaction Modeling for Referring Expression Comprehension	Apr 21, 2022	DiversityInformativeness	—Unverified
Referring Expression Instance Retrieval and A Strong End-to-End Baseline	Jun 23, 2025	Image RetrievalReferring Expression	—Unverified
Video Referring Expression Comprehension via Transformer with Content-aware Query	Oct 6, 2022	cross-modal alignmentReferring Expression	—Unverified
RefTeacher: A Strong Baseline for Semi-Supervised Referring Expression Comprehension	Jan 1, 2023	Imitation LearningPseudo Label	—Unverified
Revisiting Multi-Modal LLM Evaluation	Aug 9, 2024	Chart UnderstandingOptical Character Recognition	—Unverified
ScanFormer: Referring Expression Comprehension by Iteratively Scanning	Jun 26, 2024	InformativenessReferring Expression	—Unverified
Segment Anything Model for automated image data annotation: empirical studies using text prompts from Grounding DINO	Jun 27, 2024	Image SegmentationMedical Image Segmentation	—Unverified
Beyond Object Categories: Multi-Attribute Reference Understanding for Visual Grounding	Mar 25, 2025	AttributeObject	—Unverified
Dynamic Graph Attention for Referring Expression Comprehension	Sep 18, 2019	Graph AttentionReferring Expression	—Unverified
Dynamic Inference With Grounding Based Vision and Language Models	Jan 1, 2023	Language ModellingReferring Expression	—Unverified
DViN: Dynamic Visual Routing Network for Weakly Supervised Referring Expression Comprehension	Jan 1, 2025	DescriptiveReferring Expression	—Unverified
Differentiated Relevances Embedding for Group-based Referring Expression Comprehension	Mar 12, 2022	AttributeObject	—Unverified
ERNIE-ViL: Knowledge Enhanced Vision-Language Representations Through Scene Graph	Jun 30, 2020	AttributePrediction	—Unverified
Switch-BERT: Learning to Model Multimodal Interactions by Switching Attention and Input	Jun 25, 2023	DiversityImage-text Retrieval	—Unverified
Exploring Spatial Language Grounding Through Referring Expressions	Feb 4, 2025	Image CaptioningNegation	—Unverified
FindIt: Generalized Localization with Natural Language Queries	Mar 31, 2022	Natural Language QueriesObject	—Unverified
Switching Head-Tail Funnel UNITER for Dual Referring Expression Comprehension with Fetch-and-Carry Tasks	Jul 14, 2023	ObjectReferring Expression	—Unverified
FLORA: Formal Language Model Enables Robust Training-free Zero-shot Object Referring Analysis	Jan 17, 2025	Bayesian InferenceLanguage Modeling	—Unverified
Deep Fragment Embeddings for Bidirectional Image Sentence Mapping	Jun 22, 2014	Referring Expression ComprehensionRetrieval	—Unverified
CoVLM: Composing Visual Entities and Relationships in Large Language Models Via Communicative Decoding	Nov 6, 2023	CoLAQuestion Answering	—Unverified
Synthetic Visual Genome	Jun 9, 2025	Referring ExpressionReferring Expression Comprehension	—Unverified
GeoRSMLLM: A Multimodal Large Language Model for Vision-Language Tasks in Geoscience and Remote Sensing	Mar 16, 2025	Change DetectionImage Captioning	—Unverified
Giving Commands to a Self-driving Car: A Multimodal Reasoner for Visual Grounding	Mar 19, 2020	ObjectReferring Expression Comprehension	—Unverified
Cops-Ref: A new Dataset and Task on Compositional Referring Expression Comprehension	Mar 1, 2020	Referring ExpressionReferring Expression Comprehension	—Unverified
Harlequin: Color-driven Generation of Synthetic Data for Referring Expression Comprehension	Nov 22, 2024	Referring ExpressionReferring Expression Comprehension	—Unverified
Hierarchical Alignment-enhanced Adaptive Grounding Network for Generalized Referring Expression Comprehension	Jan 2, 2025	Generalized Referring Expression ComprehensionGeneralized Referring Expression Segmentation	—Unverified
Contrastive Region Guidance: Improving Grounding in Vision-Language Models without Training	Mar 4, 2024	MathPhrase Grounding	—Unverified
Video Referring Expression Comprehension via Transformer with Content-conditioned Query	Oct 25, 2023	cross-modal alignmentReferring Expression	—Unverified
Task-aware Cross-modal Feature Refinement Transformer with Large Language Models for Visual Grounding	Jan 1, 2025	Referring ExpressionReferring Expression Comprehension	—Unverified
Language-Guided 3D Object Detection in Point Cloud for Autonomous Driving	May 25, 2023	3D Object DetectionAutonomous Driving	—Unverified
Language-Mediated, Object-Centric Representation Learning	Dec 31, 2020	ObjectObject Discovery	—Unverified
Text-driven Affordance Learning from Egocentric Vision	Apr 3, 2024	Referring ExpressionReferring Expression Comprehension	—Unverified
Learning Pseudo-Labeler beyond Noun Concepts for Open-Vocabulary Object Detection	Dec 4, 2023	Image to textobject-detection	—Unverified
Leveraging Non-Specialists for Accurate and Time Efficient AMR Annotation	May 1, 2020	Referring ExpressionReferring Expression Comprehension	—Unverified
Learning Visual Grounding from Generative Vision and Language Model	Jul 18, 2024	AttributeLanguage Modeling	—Unverified
Lite-MDETR: A Lightweight Multi-Modal Detector	Jan 1, 2022	object-detectionObject Detection	—Unverified
The Solution for the 5th GCAIAC Zero-shot Referring Expression Comprehension Challenge	Jul 6, 2024	Referring ExpressionReferring Expression Comprehension	—Unverified
Lyrics: Boosting Fine-grained Language-Vision Alignment and Comprehension via Semantic-aware Visual Objects	Dec 8, 2023	Image Captioningobject-detection	—Unverified
M^2IST: Multi-Modal Interactive Side-Tuning for Efficient Referring Expression Comprehension	Jul 1, 2024	GPUReferring Expression	—Unverified
Make Graph-based Referring Expression Comprehension Great Again through Expression-guided Dynamic Gating and Regression	Sep 5, 2024	Referring ExpressionReferring Expression Comprehension	—Unverified
ArraMon: A Joint Navigation-Assembly Instruction Interpretation Task in Dynamic Environments	Nov 15, 2020	Referring ExpressionReferring Expression Comprehension	—Unverified
MaskInversion: Localized Embeddings via Optimization of Explainability Maps	Jul 29, 2024	Image GenerationReferring Expression	—Unverified
A Real-Time Cross-modality Correlation Filtering Method for Referring Expression Comprehension	Sep 16, 2019	Referring ExpressionReferring Expression Comprehension	—Unverified
Compositional Zero-Shot Learning for Attribute-Based Object Reference in Human-Robot Interaction	Dec 21, 2023	16kAttribute	—Unverified
Commands 4 Autonomous Vehicles (C4AV) Workshop Summary	Sep 18, 2020	Autonomous VehiclesReferring Expression Comprehension	—Unverified
Evaluating and Improving Interactions with Hazy Oracles	Oct 19, 2021	Object TrackingReferring Expression	—Unverified
Modular Graph Attention Network for Complex Visual Relational Reasoning	Nov 22, 2020	Graph AttentionQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.