Image-text Retrieval

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 248 papers

Title	Date	Tasks	Status
Improving Adversarial Transferability of Vision-Language Pre-training Models through Collaborative Multimodal Interaction	Mar 16, 2024	Adversarial RobustnessImage-text Retrieval	—Unverified
Enhancing Conceptual Understanding in Multimodal Contrastive Learning through Hard Negative Samples	Mar 5, 2024	Concept AlignmentContrastive Learning	—Unverified
Embracing Language Inclusivity and Diversity in CLIP through Continual Language Learning	Jan 30, 2024	DiversityImage-text Retrieval	CodeCode Available
Enhancing Image-Text Matching with Adaptive Feature Aggregation	Jan 18, 2024	Image-text matchingImage-text Retrieval	CodeCode Available
SyCoCa: Symmetrizing Contrastive Captioners with Attentive Masking for Multimodal Alignment	Jan 4, 2024	Image Captioningimage-classification	—Unverified
Filter & Align: Leveraging Human Knowledge to Curate Image-Text Data	Dec 11, 2023	Image CaptioningImage-text Retrieval	—Unverified
LightCLIP: Learning Multi-Level Interaction for Lightweight Vision-Language Models	Dec 1, 2023	image-classificationImage Classification	—Unverified
IG Captioner: Information Gain Captioners are Strong Zero-shot Classifiers	Nov 27, 2023	Caption GenerationImage-text Retrieval	—Unverified
A New Fine-grained Alignment Method for Image-text Matching	Nov 3, 2023	Image-text matchingImage-text Retrieval	—Unverified
MCAD: Multi-teacher Cross-modal Alignment Distillation for efficient image-text retrieval	Oct 30, 2023	cross-modal alignmentImage-text Retrieval	—Unverified
Direction-Oriented Visual-semantic Embedding Model for Remote Sensing Image-text Retrieval	Oct 12, 2023	Cross-Modal RetrievalImage-text Retrieval	—Unverified
Ziya-Visual: Bilingual Large Vision-Language Model via Multi-Task Instruction Tuning	Oct 12, 2023	Image CaptioningImage-text Retrieval	—Unverified
Constructing Image-Text Pair Dataset from Books	Oct 3, 2023	Image-text RetrievalOptical Character Recognition (OCR)	—Unverified
Dual Relation Alignment for Composed Image Retrieval	Sep 5, 2023	Image RetrievalImage-text Retrieval	—Unverified
MultiWay-Adapater: Adapting large-scale multi-modal models for scalable image-text retrieval	Sep 4, 2023	Image-text RetrievalRetrieval	CodeCode Available
Contrastive Feature Masking Open-Vocabulary Vision Transformer	Sep 2, 2023	Contrastive LearningImage-text Retrieval	—Unverified
DLIP: Distilling Language-Image Pre-training	Aug 24, 2023	Image CaptioningImage-text Retrieval	—Unverified
EVE: Efficient Vision-Language Pre-training with Masked Prediction and Modality-Aware MoE	Aug 23, 2023	Image-text matchingImage-text Retrieval	—Unverified
Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images with Free Attention Masks	Aug 13, 2023	Contrastive Learningimage-classification	—Unverified
Distilling Knowledge from Text-to-Image Generative Models Improves Visio-Linguistic Reasoning in CLIP	Jul 18, 2023	AttributeImage-text Retrieval	—Unverified
Stop Pre-Training: Adapt Visual-Language Models to Unseen Languages	Jun 29, 2023	Image-text RetrievalMachine Translation	CodeCode Available
Switch-BERT: Learning to Model Multimodal Interactions by Switching Attention and Input	Jun 25, 2023	DiversityImage-text Retrieval	—Unverified
Integrating Listwise Ranking into Pairwise-based Image-Text Retrieval	May 26, 2023	Image-text RetrievalRetrieval	CodeCode Available
Hypernymization of named entity-rich captions for grounding-based multi-modal pretraining	Apr 25, 2023	ArticlesImage-text Retrieval	—Unverified
RECLIP: Resource-efficient CLIP by Training with Small Images	Apr 12, 2023	Contrastive LearningImage-text Retrieval	—Unverified

Show:10 25 50

← PrevPage 7 of 10Next →

No leaderboard results yet.