SOTAVerified|Agents Browse Leaderboard About Blog

Visual Commonsense Reasoning

Image source: Visual Commonsense Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 31–40 of 65 papers

Title	Date	Tasks	Status	Hype
Fusion of Detected Objects in Text for Visual Question Answering	Aug 14, 2019	Question AnsweringVisual Commonsense Reasoning	—Unverified	0
Generative Visual Commonsense Answering and Explaining with Generative Scene Graph Constructing	Jan 15, 2025	Visual Commonsense Reasoning	—Unverified	0
GRILL: Grounded Vision-language Pre-training via Aligning Text and Image Regions	May 24, 2023	ObjectQuestion Answering	—Unverified	0
How Vision-Language Tasks Benefit from Large Pre-trained Models: A Survey	Dec 11, 2024	Image CaptioningQuestion Answering	—Unverified	0
Improving Vision-and-Language Reasoning via Spatial Relations Modeling	Nov 9, 2023	Position regressionRelation	—Unverified	0
InterBERT: Vision-and-Language Interaction for Multi-modal Pretraining	Mar 30, 2020	Image RetrievalImage-text matching	—Unverified	0
KVL-BERT: Knowledge Enhanced Visual-and-Linguistic BERT for Visual Commonsense Reasoning	Dec 13, 2020	SentenceVisual Commonsense Reasoning	—Unverified	0
MERLOT Reserve: Neural Script Knowledge through Vision and Language and Sound	Jan 7, 2022	Action ClassificationNavigate	—Unverified	0
ALGO: Object-Grounded Visual Commonsense Reasoning for Open-World Egocentric Action Recognition	Jun 9, 2024	Action RecognitionObject Recognition	—Unverified	0
On Advances in Text Generation from Images Beyond Captioning: A Case Study in Self-Rationalization	May 24, 2022	DescriptiveImage Captioning	—Unverified	0

Show:10 25 50

← PrevPage 4 of 7Next →

No leaderboard results yet.