SOTAVerified|Agents Browse Leaderboard About Blog

Visual Question Answering

MLLM Leaderboard

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1871–1880 of 2177 papers

Title	Date	Tasks	Status	Hype
TAB-VCR: Tags and Attributes based VCR Baselines	Dec 1, 2019	AttributeQuestion Answering	CodeCode Available	0
RUBi: Reducing Unimodal Biases for Visual Question Answering	Dec 1, 2019	Question AnsweringVisual Question Answering	CodeCode Available	0
Assessing the Robustness of Visual Question Answering Models	Nov 30, 2019	Question AnsweringVisual Question Answering	—Unverified	0
A Free Lunch in Generating Datasets: Building a VQG and VQA System with Attention and Humans in the Loop	Nov 30, 2019	Question AnsweringQuestion Generation	—Unverified	0
Unsupervised Keyword Extraction for Full-sentence VQA	Nov 23, 2019	Keyword ExtractionQuestion Answering	—Unverified	0
Temporal Reasoning via Audio Question Answering	Nov 21, 2019	Audio Question AnsweringDiagnostic	CodeCode Available	0
Explanation vs Attention: A Two-Player Game to Obtain Attention for VQA	Nov 19, 2019	Question AnsweringVisual Question Answering	—Unverified	0
DualVD: An Adaptive Dual Encoding Model for Deep Visual Understanding in Visual Dialogue	Nov 17, 2019	feature selectionQuestion Answering	CodeCode Available	0
Question-Conditioned Counterfactual Image Generation for VQA	Nov 14, 2019	counterfactualImage Generation	—Unverified	0
Open-Ended Visual Question Answering by Multi-Modal Domain Adaptation	Nov 11, 2019	Domain AdaptationQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 188 of 218Next →

All datasets MM-Vet ViP-Bench VQA v2 test-dev BenchLMM MMBench V*bench VQA v2 val MSRVTT-QA VQA v2 test-std MMHal-Bench MSVD-QA PlotQA-D1

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MMCTAgent (GPT-4 + GPT-4V)	GPT-4 score	74.24	—	Unverified
2	Qwen2-VL-72B	GPT-4 score	74	—	Unverified
3	InternVL2.5-78B	GPT-4 score	72.3	—	Unverified
4	GPT-4o +text rationale +IoT	GPT-4 score	72.2	—	Unverified
5	Lyra-Pro	GPT-4 score	71.4	—	Unverified
6	GLM-4V-Plus	GPT-4 score	71.1	—	Unverified
7	Phantom-7B	GPT-4 score	70.8	—	Unverified
8	InternVL2.5-38B	GPT-4 score	68.8	—	Unverified
9	InternVL2-26B (SGP, token ratio 64%)	GPT-4 score	65.6	—	Unverified
10	Baichuan-Omni (7B)	GPT-4 score	65.4	—	Unverified