SOTAVerified|Agents Browse Leaderboard About

Image-text matching

Image-Text Matching is a subtask within Cross-Modal Retrieval (CMR) that involves establishing associations between images and corresponding textual descriptions. The goal is to retrieve an image given a textual query or, conversely, retrieve a textual description given an image query. This task is challenging due to the heterogeneity gap between image and text data representations. Image-text matching is used in applications such as content-based image search, visual question answering, and multimodal summarization.

Assessing Brittleness of Image-Text Retrieval Benchmarks from Vision-Language Models Perspective

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 61–70 of 188 papers

Title	Date	Tasks	Status	Hype
Learning Comprehensive Representations with Richer Self for Text-to-Image Person Re-Identification	Oct 17, 2023	Image RetrievalImage-text matching	—Unverified	0
Prototype-based Aleatoric Uncertainty Quantification for Cross-modal Retrieval	Sep 29, 2023	Cross-Modal RetrievalImage-text matching	CodeCode Available	1
Align before Search: Aligning Ads Image to Text for Accurate Cross-Modal Sponsored Search	Sep 28, 2023	cross-modal alignmentCross-Modal Retrieval	CodeCode Available	0
Dynamic Visual Semantic Sub-Embeddings and Fast Re-Ranking	Sep 15, 2023	Image-text matchingRe-Ranking	—Unverified	0
Improving Multimodal Classification of Social Media Posts by Leveraging Image-Text Auxiliary Tasks	Sep 14, 2023	Image-text matchingSarcasm Detection	CodeCode Available	0
Towards Better Multi-modal Keyphrase Generation via Visual Entity Enhancement and Multi-granularity Image Noise Filtering	Sep 9, 2023	Image CaptioningImage-text matching	CodeCode Available	0
ViLTA: Enhancing Vision-Language Pre-training through Textual Augmentation	Aug 31, 2023	Image-text matchingLanguage Modeling	—Unverified	0
Uniformly Distributed Category Prototype-Guided Vision-Language Framework for Long-Tail Recognition	Aug 24, 2023	AttributeImage-text matching	—Unverified	0
Parameter-Efficient Transfer Learning for Remote Sensing Image-Text Retrieval	Aug 24, 2023	Cross-Modal RetrievalImage-text matching	CodeCode Available	1
EVE: Efficient Vision-Language Pre-training with Masked Prediction and Modality-Aware MoE	Aug 23, 2023	Image-text matchingImage-text Retrieval	—Unverified	0

Show:10 25 50

← PrevPage 7 of 19Next →

No leaderboard results yet.