Referring Expression Comprehension

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 167 papers

Title	Date	Tasks	Status
Learning Pseudo-Labeler beyond Noun Concepts for Open-Vocabulary Object Detection	Dec 4, 2023	Image to textobject-detection	—Unverified
Continual Referring Expression Comprehension via Dual Modular Memorization	Nov 25, 2023	MemorizationReferring Expression	CodeCode Available
Griffon: Spelling out All Object Locations at Any Granularity with Large Language Models	Nov 24, 2023	AllReferring Expression	—Unverified
Enhancing Visual Grounding and Generalization: A Multi-Task Cycle Training Approach for Vision-Language Models	Nov 21, 2023	Image SegmentationLanguage Modelling	CodeCode Available
CoVLM: Composing Visual Entities and Relationships in Large Language Models Via Communicative Decoding	Nov 6, 2023	CoLAQuestion Answering	—Unverified
Video Referring Expression Comprehension via Transformer with Content-conditioned Query	Oct 25, 2023	cross-modal alignmentReferring Expression	—Unverified
Collecting Visually-Grounded Dialogue with A Game Of Sorts	Sep 10, 2023	Coreference ResolutionImage Retrieval	CodeCode Available
HuBo-VLM: Unified Vision-Language Model designed for HUman roBOt interaction tasks	Aug 24, 2023	Language ModelingLanguage Modelling	CodeCode Available
Whether you can locate or not? Interactive Referring Expression Generation	Aug 19, 2023	Referring ExpressionReferring Expression Comprehension	CodeCode Available
Switching Head-Tail Funnel UNITER for Dual Referring Expression Comprehension with Fetch-and-Carry Tasks	Jul 14, 2023	ObjectReferring Expression	—Unverified
Switch-BERT: Learning to Model Multimodal Interactions by Switching Attention and Input	Jun 25, 2023	DiversityImage-text Retrieval	—Unverified
Language Adaptive Weight Generation for Multi-task Visual Grounding	Jun 6, 2023	Referring ExpressionReferring Expression Comprehension	CodeCode Available
Referring Expression Comprehension Using Language Adaptive Inference	Jun 6, 2023	object-detectionObject Detection	CodeCode Available
Language-Guided 3D Object Detection in Point Cloud for Autonomous Driving	May 25, 2023	3D Object DetectionAutonomous Driving	—Unverified
CK-Transformer: Commonsense Knowledge Enhanced Transformers for Referring Expression Comprehension	Feb 17, 2023	Referring ExpressionReferring Expression Comprehension	CodeCode Available
RefCLIP: A Universal Teacher for Weakly Supervised Referring Expression Comprehension	Jan 1, 2023	Referring ExpressionReferring Expression Comprehension	—Unverified
Dynamic Inference With Grounding Based Vision and Language Models	Jan 1, 2023	Language ModellingReferring Expression	—Unverified
RefTeacher: A Strong Baseline for Semi-Supervised Referring Expression Comprehension	Jan 1, 2023	Imitation LearningPseudo Label	—Unverified
Scene-Text Oriented Reffering Expression Comprehension	Nov 4, 2022	Object LocalizationReferring Expression	CodeCode Available
Video Referring Expression Comprehension via Transformer with Content-aware Query	Oct 6, 2022	cross-modal alignmentReferring Expression	—Unverified
Exploring Modulated Detection Transformer as a Tool for Action Recognition in Videos	Sep 21, 2022	Action DetectionAction Recognition	CodeCode Available
One for All: One-stage Referring Expression Comprehension with Dynamic Reasoning	Jul 31, 2022	AllReferring Expression	—Unverified
Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks	Jun 17, 2022	Depth EstimationImage Generation	—Unverified
RefCrowd: Grounding the Target in Crowd with Referring Expressions	Jun 16, 2022	AttributeReferring Expression	—Unverified
Self-paced Multi-grained Cross-modal Interaction Modeling for Referring Expression Comprehension	Apr 21, 2022	DiversityInformativeness	—Unverified
FindIt: Generalized Localization with Natural Language Queries	Mar 31, 2022	Natural Language QueriesObject	—Unverified
Differentiated Relevances Embedding for Group-based Referring Expression Comprehension	Mar 12, 2022	AttributeObject	—Unverified
OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework	Feb 7, 2022	Image Captioningimage-classification	CodeCode Available
Webly Supervised Concept Expansion for General Purpose Vision Models	Feb 4, 2022	Human-Object Interaction DetectionImage Retrieval	—Unverified
Lite-MDETR: A Lightweight Multi-Modal Detector	Jan 1, 2022	object-detectionObject Detection	—Unverified
ReCLIP: A Strong Zero-Shot Baseline for Referring Expression Comprehension	Nov 16, 2021	image-classificationImage Classification	—Unverified
Evaluating and Improving Interactions with Hazy Oracles	Oct 19, 2021	Object TrackingReferring Expression	—Unverified
Towards Language-guided Visual Recognition via Dynamic Convolutions	Oct 17, 2021	Question AnsweringReferring Expression	CodeCode Available
Learning Better Visual Dialog Agents with Pretrained Visual-Linguistic Representation	May 24, 2021	Referring ExpressionReferring Expression Comprehension	CodeCode Available
Proposal-free One-stage Referring Expression via Grid-Word Cross-Attention	May 5, 2021	Question AnsweringReferring Expression	—Unverified
Playing Lottery Tickets with Vision and Language	Apr 23, 2021	Image-text RetrievalQuestion Answering	—Unverified
Understanding Synonymous Referring Expressions via Contrastive Features	Apr 20, 2021	ObjectReferring Expression	CodeCode Available
Co-Grounding Networks with Semantic Attention for Referring Expression Comprehension in Videos	Mar 23, 2021	Referring ExpressionReferring Expression Comprehension	—Unverified
Language-Mediated, Object-Centric Representation Learning	Dec 31, 2020	ObjectObject Discovery	—Unverified
PPGN: Phrase-Guided Proposal Generation Network For Referring Expression Comprehension	Dec 20, 2020	Referring ExpressionReferring Expression Comprehension	—Unverified
Modular Graph Attention Network for Complex Visual Relational Reasoning	Nov 22, 2020	Graph AttentionQuestion Answering	—Unverified
ArraMon: A Joint Navigation-Assembly Instruction Interpretation Task in Dynamic Environments	Nov 15, 2020	Referring ExpressionReferring Expression Comprehension	—Unverified
Language-Conditioned Feature Pyramids for Visual Selection Tasks	Nov 1, 2020	Referring ExpressionReferring Expression Comprehension	CodeCode Available
Commands 4 Autonomous Vehicles (C4AV) Workshop Summary	Sep 18, 2020	Autonomous VehiclesReferring Expression Comprehension	—Unverified
Cosine meets Softmax: A tough-to-beat baseline for visual grounding	Sep 13, 2020	Autonomous DrivingMetric Learning	CodeCode Available
AttnGrounder: Talking to Cars with Attention	Sep 11, 2020	Referring Expression ComprehensionVisual Grounding	CodeCode Available
Referring Expression Comprehension: A Survey of Methods and Datasets	Jul 19, 2020	object-detectionObject Detection	—Unverified
ERNIE-ViL: Knowledge Enhanced Vision-Language Representations Through Scene Graph	Jun 30, 2020	AttributePrediction	—Unverified
Give Me Something to Eat: Referring Expression Comprehension with Commonsense Knowledge	Jun 2, 2020	16kReferring Expression	—Unverified
Leveraging Non-Specialists for Accurate and Time Efficient AMR Annotation	May 1, 2020	Referring ExpressionReferring Expression Comprehension	—Unverified

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.