Image-text Retrieval

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 248 papers

Title	Date	Tasks	Status
Attacking Attention of Foundation Models Disrupts Downstream Tasks	Jun 3, 2025	Depth EstimationImage-text Retrieval	CodeCode Available
Distill CLIP (DCLIP): Enhancing Image-Text Retrieval via Cross-Modal Transformer Distillation	May 25, 2025	Contrastive LearningImage-text Retrieval	—Unverified
EvdCLIP: Improving Vision-Language Retrieval with Entity Visual Descriptions from Large Language Models	May 24, 2025	Image-text RetrievalLanguage Modeling	—Unverified
Representation Discrepancy Bridging Method for Remote Sensing Image-Text Retrieval	May 22, 2025	cross-modal alignmentImage-text Retrieval	—Unverified
Breaking Language Barriers or Reinforcing Bias? A Study of Gender and Racial Disparities in Multilingual Contrastive Vision Language Models	May 20, 2025	Image-text RetrievalText Retrieval	—Unverified
A Vision-Language Foundation Model for Leaf Disease Identification	May 11, 2025	Contrastive Learningimage-classification	CodeCode Available
AGATE: Stealthy Black-box Watermarking for Multimodal Model Copyright Protection	Apr 28, 2025	Adversarial AttackAnomaly Detection	—Unverified
Breaking the Modality Barrier: Universal Embedding Learning with Multimodal LLMs	Apr 24, 2025	Image-text RetrievalInstruction Following	—Unverified
FocalLens: Instruction Tuning Enables Zero-Shot Conditional Image Representations	Apr 11, 2025	image-classificationImage Classification	—Unverified
SeLIP: Similarity Enhanced Contrastive Language Image Pretraining for Multi-modal Head MRI	Mar 25, 2025	Contrastive LearningImage Segmentation	—Unverified
Anatomy-Aware Conditional Image-Text Retrieval	Mar 10, 2025	AnatomyContrastive Learning	—Unverified
Variance-Aware Loss Scheduling for Multimodal Alignment in Low-Data Settings	Mar 5, 2025	Contrastive LearningImage-text Retrieval	—Unverified
LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning	Mar 4, 2025	Contrastive LearningImage-text Retrieval	—Unverified
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
Progressive Local Alignment for Medical Multimodal Pre-training	Feb 25, 2025	Contrastive LearningImage-text Retrieval	—Unverified
SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features	Feb 20, 2025	FairnessImage-text Retrieval	—Unverified
Fine-tuning Multimodal Transformers on Edge: A Parallel Split Learning Approach	Feb 10, 2025	Federated LearningImage-text Retrieval	—Unverified
DCFormer: Efficient 3D Vision-Language Modeling with Decomposed Convolutions	Feb 7, 2025	Anomaly DetectionImage-text Retrieval	—Unverified
MASS: Overcoming Language Bias in Image-Text Matching	Jan 20, 2025	Image-text matchingImage-text Retrieval	—Unverified
TSVC:Tripartite Learning with Semantic Variation Consistency for Robust Image-Text Retrieval	Jan 19, 2025	Cross-Modal RetrievalImage-text Retrieval	—Unverified
Advancing Myopia To Holism: Fully Contrastive Language-Image Pre-training	Jan 1, 2025	Image-text RetrievalImage to text	—Unverified
Reversed in Time: A Novel Temporal-Emphasized Benchmark for Cross-Modal Video-Text Retrieval	Dec 26, 2024	Image-text RetrievalInformation Retrieval	CodeCode Available
Barking Up The Syntactic Tree: Enhancing VLM Training with Syntactic Losses	Dec 11, 2024	Image-text RetrievalQuestion Answering	—Unverified
Explaining and Mitigating the Modality Gap in Contrastive Multimodal Learning	Dec 10, 2024	Contrastive LearningImage-text Retrieval	—Unverified
VladVA: Discriminative Fine-tuning of LVLMs	Dec 5, 2024	Image-text RetrievalRepresentation Learning	—Unverified

Show:10 25 50

← PrevPage 5 of 10Next →

No leaderboard results yet.