SOTAVerified|Agents Browse Leaderboard About

Natural Language Visual Grounding

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–32 of 32 papers

Title	Date	Tasks	Status	Hype
ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks	Dec 3, 2019	Natural Language Visual Grounding	CodeCode Available	1
Searching for Ambiguous Objects in Videos using Relational Referring Expressions	Aug 3, 2019	Deep AttentionNatural Language Visual Grounding	CodeCode Available	0
Modularized Textual Grounding for Counterfactual Resilience	Apr 7, 2019	Attributecounterfactual	CodeCode Available	0
Self-Monitoring Navigation Agent via Auxiliary Progress Estimation	Jan 10, 2019	Natural Language Visual GroundingVision and Language Navigation	CodeCode Available	1
Robust Change Captioning	Jan 8, 2019	Natural Language Visual Grounding	CodeCode Available	0
Learning to Assemble Neural Module Tree Networks for Visual Grounding	Dec 8, 2018	Dependency ParsingNatural Language Visual Grounding	—Unverified	0
Grounding of Textual Phrases in Images by Reconstruction	Nov 12, 2015	Language ModelingLanguage Modelling	CodeCode Available	0

Show:10 25 50

← PrevPage 2 of 2Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UGround-V1-7B	Accuracy (%)	86.34	—	Unverified
2	Aguvis-7B	Accuracy (%)	83	—	Unverified
3	OS-Atlas-Base-7B	Accuracy (%)	82.47	—	Unverified
4	Aria-UI	Accuracy (%)	81.1	—	Unverified
5	Aguvis-G-7B	Accuracy (%)	81	—	Unverified
6	UGround-V1-2B	Accuracy (%)	77.67	—	Unverified
7	ShowUI	Accuracy (%)	75.1	—	Unverified
8	ShowUI-G	Accuracy (%)	75	—	Unverified
9	UGround	Accuracy (%)	73.3	—	Unverified
10	OmniParser	Accuracy (%)	73	—	Unverified