SOTAVerified|Agents Browse Leaderboard About

MME

MME is a comprehensive evaluation benchmark for multimodal large language models. It measures both perception and cognition abilities on a total of 14 subtasks, including existence, count, position, color, poster, celebrity, scene, landmark, artwork, OCR, commonsense reasoning, numerical calculation, text translation, and code reasoning.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 81–90 of 95 papers

Title	Date	Tasks	Status
ShareGPT4V: Improving Large Multi-Modal Models with Better Captions	Nov 21, 2023	DescriptiveMME	CodeCode Available
The Use of Symmetry for Models with Variable-size Variables	Nov 15, 2023	MME	—Unverified
Enhancing the Spatial Awareness Capability of Multi-Modal Large Language Model	Oct 31, 2023	Autonomous DrivingLanguage Modeling	—Unverified
Benchmarking and In-depth Performance Study of Large Language Models on Habana Gaudi Processors	Sep 29, 2023	BenchmarkingComputational Efficiency	—Unverified
InternLM-XComposer: A Vision-Language Large Model for Advanced Text-image Comprehension and Composition	Sep 26, 2023	ArticlesImage Comprehension	CodeCode Available
Domain Adaptation via Minimax Entropy for Real/Bogus Classification of Astronomical Alerts	Aug 15, 2023	AstronomyDomain Adaptation	—Unverified
Multi-Modal Evaluation Approach for Medical Image Segmentation	Feb 8, 2023	Image SegmentationMedical Image Segmentation	—Unverified
MAAL: Multimodality-Aware Autoencoder-Based Affordance Learning for 3D Articulated Objects	Jan 1, 2023	MMEObject	CodeCode Available
MM-GNN: Mix-Moment Graph Neural Network towards Modeling Neighborhood Feature Distribution	Aug 15, 2022	Graph Neural NetworkGraph Representation Learning	CodeCode Available
MME-CRS: Multi-Metric Evaluation Based on Correlation Re-Scaling for Evaluating Open-Domain Dialogue	Jun 19, 2022	Dialogue EvaluationMME	—Unverified

Show:10 25 50

← PrevPage 9 of 10Next →

No leaderboard results yet.