SOTAVerified|Agents Browse Leaderboard About Blog

Visual Question Answering

MLLM Leaderboard

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1760 of 2177 papers

Title	Date	Tasks	Status	Hype
On the Promises and Challenges of Multimodal Foundation Models for Geographical, Environmental, Agricultural, and Urban Planning Applications	Dec 23, 2023	geo-localizationimage-classification	—Unverified	0
On the Significance of Question Encoder Sequence Model in the Out-of-Distribution Performance in Visual Question Answering	Aug 28, 2021	Graph AttentionQuestion Answering	—Unverified	0
On the Value of Out-of-Distribution Testing: An Example of Goodhart's Law	May 19, 2020	Model SelectionQuestion Answering	—Unverified	0
Open-Ended Visual Question Answering by Multi-Modal Domain Adaptation	Nov 11, 2019	Domain AdaptationQuestion Answering	—Unverified	0
Optimizing Explanations by Network Canonization and Hyperparameter Search	Nov 30, 2022	Explainable Artificial Intelligence (XAI)image-classification	—Unverified	0
Optimizing Visual Question Answering Models for Driving: Bridging the Gap Between Human and Machine Attention Patterns	Jun 13, 2024	Autonomous DrivingQuestion Answering	—Unverified	0
Optimus: Accelerating Large-Scale Multi-Modal LLM Training by Bubble Exploitation	Aug 7, 2024	GPUQuestion Answering	—Unverified	0
Order Matters: Exploring Order Sensitivity in Multimodal Large Language Models	Oct 22, 2024	In-Context LearningQuestion Answering	—Unverified	0
ORD: Object Relationship Discovery for Visual Dialogue Generation	Jun 15, 2020	Dialogue GenerationGraph Attention	—Unverified	0
ORION: A Holistic End-to-End Autonomous Driving Framework by Vision-Language Instructed Action Generation	Mar 25, 2025	Action GenerationAutonomous Driving	—Unverified	0

Show:10 25 50

← PrevPage 176 of 218Next →

All datasets MM-Vet ViP-Bench VQA v2 test-dev BenchLMM MMBench V*bench VQA v2 val MSRVTT-QA VQA v2 test-std MMHal-Bench MSVD-QA PlotQA-D1

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	MMCTAgent (GPT-4 + GPT-4V)	GPT-4 score	74.24	—	Unverified
2	Qwen2-VL-72B	GPT-4 score	74	—	Unverified
3	InternVL2.5-78B	GPT-4 score	72.3	—	Unverified
4	GPT-4o +text rationale +IoT	GPT-4 score	72.2	—	Unverified
5	Lyra-Pro	GPT-4 score	71.4	—	Unverified
6	GLM-4V-Plus	GPT-4 score	71.1	—	Unverified
7	Phantom-7B	GPT-4 score	70.8	—	Unverified
8	InternVL2.5-38B	GPT-4 score	68.8	—	Unverified
9	InternVL2-26B (SGP, token ratio 64%)	GPT-4 score	65.6	—	Unverified
10	Baichuan-Omni (7B)	GPT-4 score	65.4	—	Unverified