Zero-Shot Composed Image Retrieval (ZS-CIR)

Given a query composed of a reference image and a relative caption, Composed Image Retrieval (CIR) aims to retrieve target images that are visually similar to the reference one but incorporate the changes specified in the relative caption. The bi-modality of the query provides users with more precise control over the characteristics of the desired image, as some features are more easily described with language, while others can be better expressed visually.

Zero-Shot Composed Image Retrieval (ZS-CIR) is a subtask of CIR that aims to design an approach that manages to combine the reference image and the relative caption without the need for supervised learning.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–36 of 36 papers

Title	Date	Tasks	Status	Hype
MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval	Dec 19, 2024	Image RetrievalRetrieval	CodeCode Available	3
MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions	Mar 28, 2024	Image RetrievalImplicit Relations	CodeCode Available	3
Reason-before-Retrieve: One-Stage Reflective Chain-of-Thoughts for Training-Free Zero-Shot Composed Image Retrieval	Dec 15, 2024	Image RetrievalRetrieval	CodeCode Available	2
Semantic Editing Increment Benefits Zero-Shot Composed Image Retrieval	Oct 28, 2024	Image RetrievalImage to text	CodeCode Available	2
LDRE: LLM-based Divergent Reasoning and Ensemble for Zero-Shot Composed Image Retrieval	Jul 11, 2024	Image RetrievalImage to text	CodeCode Available	2
An Efficient Post-hoc Framework for Reducing Task Discrepancy of Text Encoders for Composed Image Retrieval	Jun 13, 2024	Contrastive LearningImage Retrieval	CodeCode Available	2
Composed Image Retrieval for Remote Sensing	May 24, 2024	Composed Image Retrieval (CoIR)Descriptive	CodeCode Available	2
iSEARLE: Improving Textual Inversion for Zero-Shot Composed Image Retrieval	May 5, 2024	BenchmarkingComposed Image Retrieval (CoIR)	CodeCode Available	2
CoLLM: A Large Language Model for Composed Image Retrieval	Mar 25, 2025	Image RetrievalLanguage Modeling	CodeCode Available	1
Missing Target-Relevant Information Prediction with World Model for Accurate Zero-Shot Composed Image Retrieval	Mar 21, 2025	AttributeImage Retrieval	CodeCode Available	1
ImageScope: Unifying Language-Guided Image Retrieval via Large Multimodal Model Collective Reasoning	Mar 13, 2025	Image RetrievalRetrieval	CodeCode Available	1
Composed Image Retrieval for Training-Free Domain Conversion	Dec 4, 2024	Image RetrievalLanguage Modeling	CodeCode Available	1
Improving Composed Image Retrieval via Contrastive Learning with Scaling Positives and Negatives	Apr 17, 2024	Contrastive LearningImage Retrieval	CodeCode Available	1
Knowledge-Enhanced Dual-stream Zero-shot Composed Image Retrieval	Mar 24, 2024	AttributeImage Retrieval	CodeCode Available	1
Language-only Efficient Training of Zero-shot Composed Image Retrieval	Dec 4, 2023	Image RetrievalRetrieval	CodeCode Available	1
Vision-by-Language for Training-Free Compositional Image Retrieval	Oct 13, 2023	Image RetrievalRetrieval	CodeCode Available	1
Context-I2W: Mapping Images to Context-dependent Words for Accurate Zero-Shot Composed Image Retrieval	Sep 28, 2023	AttributeImage Retrieval	CodeCode Available	1
CoVR-2: Automatic Data Construction for Composed Video Retrieval	Aug 28, 2023	Composed Image Retrieval (CoIR)Composed Video Retrieval (CoVR)	CodeCode Available	1
Zero-shot Composed Text-Image Retrieval	Jun 12, 2023	Image RetrievalRetrieval	CodeCode Available	1
Zero-Shot Composed Image Retrieval with Textual Inversion	Mar 27, 2023	Composed Image Retrieval (CoIR)Image Retrieval	CodeCode Available	1
CompoDiff: Versatile Composed Image Retrieval With Latent Diffusion	Mar 21, 2023	Composed Image Retrieval (CoIR)Image Retrieval	CodeCode Available	1
Pic2Word: Mapping Pictures to Words for Zero-shot Composed Image Retrieval	Feb 6, 2023	AttributeComposed Image Retrieval (CoIR)	CodeCode Available	1
"This is my unicorn, Fluffy": Personalizing frozen vision-language representations	Apr 4, 2022	Image RetrievalRetrieval	CodeCode Available	1
MLLM-Guided VLM Fine-Tuning with Joint Inference for Zero-Shot Composed Image Retrieval	May 26, 2025	Image RetrievalLarge Language Model	—Unverified	0
Multimodal Reasoning Agent for Zero-Shot Composed Image Retrieval	May 26, 2025	Contrastive LearningImage Retrieval	—Unverified	0
Data-Efficient Generalization for Zero-shot Composed Image Retrieval	Mar 7, 2025	Image RetrievalRetrieval	—Unverified	0
CoTMR: Chain-of-Thought Multi-Scale Reasoning for Training-Free Zero-Shot Composed Image Retrieval	Feb 28, 2025	Image RetrievalRetrieval	—Unverified	0
PDV: Prompt Directional Vectors for Zero-shot Composed Image Retrieval	Feb 11, 2025	Image RetrievalRetrieval	—Unverified	0
SCOT: Self-Supervised Contrastive Pretraining For Zero-Shot Compositional Retrieval	Jan 12, 2025	Image RetrievalRetrieval	—Unverified	0
Imagine and Seek: Improving Composed Image Retrieval with an Imagined Proxy	Nov 24, 2024	Image RetrievalRetrieval	—Unverified	0
MoTaDual: Modality-Task Dual Alignment for Enhanced Zero-shot Composed Image Retrieval	Oct 31, 2024	Image RetrievalPrompt Learning	—Unverified	0
Denoise-I2W: Mapping Images to Denoising Words for Accurate Zero-Shot Composed Image Retrieval	Oct 22, 2024	AttributeDenoising	CodeCode Available	0
Training-free Zero-shot Composed Image Retrieval via Weighted Modality Fusion and Similarity	Sep 7, 2024	Image CaptioningImage Retrieval	CodeCode Available	0
Training-free Zero-shot Composed Image Retrieval with Local Concept Reranking	Dec 14, 2023	Image RetrievalReranking	—Unverified	0
Pretrain like Your Inference: Masked Tuning Improves Zero-Shot Composed Image Retrieval	Nov 13, 2023	Contrastive LearningImage Retrieval	CodeCode Available	0
GeneCIS: A Benchmark for General Conditional Image Similarity	Jun 13, 2023	Image RetrievalRepresentation Learning	—Unverified	0

Show:10 25 50

No leaderboard results yet.