SOTAVerified|Agents Browse Leaderboard About

Natural Language Visual Grounding

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 32 papers

Title	Date	Tasks	Status	Hype
ALFWorld: Aligning Text and Embodied Environments for Interactive Learning	Oct 8, 2020	Natural Language Visual GroundingScene Understanding	CodeCode Available	1
A Linguistic Analysis of Visually Grounded Dialogues Based on Spatial Expressions	Oct 7, 2020	Coreference ResolutionNatural Language Visual Grounding	CodeCode Available	1
Learning Cross-modal Context Graph for Visual Grounding	Feb 13, 2020	Graph MatchingGraph Neural Network	CodeCode Available	1
ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks	Dec 3, 2019	Natural Language Visual Grounding	CodeCode Available	1
Self-Monitoring Navigation Agent via Auxiliary Progress Estimation	Jan 10, 2019	Natural Language Visual GroundingVision and Language Navigation	CodeCode Available	1
Visual Writing Prompts: Character-Grounded Story Generation with Curated Image Sequences	Jan 20, 2023	Coherence EvaluationGrounded language learning	—Unverified	0
Composing Pick-and-Place Tasks By Grounding Language	Feb 16, 2021	Natural Language Visual GroundingRobotic Grasping	CodeCode Available	0
Searching for Ambiguous Objects in Videos using Relational Referring Expressions	Aug 3, 2019	Deep AttentionNatural Language Visual Grounding	CodeCode Available	0
Modularized Textual Grounding for Counterfactual Resilience	Apr 7, 2019	Attributecounterfactual	CodeCode Available	0
Robust Change Captioning	Jan 8, 2019	Natural Language Visual Grounding	CodeCode Available	0

Show:10 25 50

← PrevPage 3 of 4Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UGround-V1-7B	Accuracy (%)	86.34	—	Unverified
2	Aguvis-7B	Accuracy (%)	83	—	Unverified
3	OS-Atlas-Base-7B	Accuracy (%)	82.47	—	Unverified
4	Aria-UI	Accuracy (%)	81.1	—	Unverified
5	Aguvis-G-7B	Accuracy (%)	81	—	Unverified
6	UGround-V1-2B	Accuracy (%)	77.67	—	Unverified
7	ShowUI	Accuracy (%)	75.1	—	Unverified
8	ShowUI-G	Accuracy (%)	75	—	Unverified
9	UGround	Accuracy (%)	73.3	—	Unverified
10	OmniParser	Accuracy (%)	73	—	Unverified