SOTAVerified|Agents Browse Leaderboard About Blog

MME

MME is a comprehensive evaluation benchmark for multimodal large language models. It measures both perception and cognition abilities on a total of 14 subtasks, including existence, count, position, color, poster, celebrity, scene, landmark, artwork, OCR, commonsense reasoning, numerical calculation, text translation, and code reasoning.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–95 of 95 papers

Title	Date	Tasks	Status
RITUAL: Random Image Transformations as a Universal Anti-hallucination Lever in Large Vision Language Models	May 28, 2024	HallucinationMME	—Unverified
Don't Miss the Forest for the Trees: Attentional Vision Calibration for Large Vision Language Models	May 28, 2024	MMEObject	—Unverified
Joint Visual and Text Prompting for Improved Object-Centric Perception with Multimodal Large Language Models	Apr 6, 2024	MMEObject	CodeCode Available
A Challenger to GPT-4V? Early Explorations of Gemini in Visual Expertise	Dec 19, 2023	MMEVisual Reasoning	—Unverified
Silkie: Preference Distillation for Large Visual Language Models	Dec 17, 2023	HallucinationMME	—Unverified
ShareGPT4V: Improving Large Multi-Modal Models with Better Captions	Nov 21, 2023	DescriptiveMME	CodeCode Available
The Use of Symmetry for Models with Variable-size Variables	Nov 15, 2023	MME	—Unverified
Enhancing the Spatial Awareness Capability of Multi-Modal Large Language Model	Oct 31, 2023	Autonomous DrivingLanguage Modeling	—Unverified
Benchmarking and In-depth Performance Study of Large Language Models on Habana Gaudi Processors	Sep 29, 2023	BenchmarkingComputational Efficiency	—Unverified
InternLM-XComposer: A Vision-Language Large Model for Advanced Text-image Comprehension and Composition	Sep 26, 2023	ArticlesImage Comprehension	CodeCode Available
Domain Adaptation via Minimax Entropy for Real/Bogus Classification of Astronomical Alerts	Aug 15, 2023	AstronomyDomain Adaptation	—Unverified
Multi-Modal Evaluation Approach for Medical Image Segmentation	Feb 8, 2023	Image SegmentationMedical Image Segmentation	—Unverified
MAAL: Multimodality-Aware Autoencoder-Based Affordance Learning for 3D Articulated Objects	Jan 1, 2023	MMEObject	CodeCode Available
MM-GNN: Mix-Moment Graph Neural Network towards Modeling Neighborhood Feature Distribution	Aug 15, 2022	Graph Neural NetworkGraph Representation Learning	CodeCode Available
MME-CRS: Multi-Metric Evaluation Based on Correlation Re-Scaling for Evaluating Open-Domain Dialogue	Jun 19, 2022	Dialogue EvaluationMME	—Unverified
Machine Learning Methods for Inferring the Number of UAV Emitters via Massive MIMO Receive Array	Mar 2, 2022	ClassificationMME	—Unverified
Online Meta-Learning for Multi-Source and Semi-Supervised Domain Adaptation	Apr 9, 2020	Domain AdaptationMeta-Learning	—Unverified
Learning Multilingual Meta-Embeddings for Code-Switching Named Entity Recognition	Aug 1, 2019	Language IdentificationMME	—Unverified
Deep Learning for Hybrid 5G Services in Mobile Edge Computing Systems: Learn from a Digital Twin	Jun 30, 2019	Edge-computingManagement	—Unverified
Scalable K-Medoids via True Error Bound and Familywise Bandits	May 27, 2019	ClusteringMME	—Unverified

Show:10 25 50

← PrevPage 4 of 4Next →

No leaderboard results yet.