Text Retrieval

Text Retrieval is the task of finding the most text result (such as an answer, paragraph, or passage) given a query (which could be a question, keywords, or any relevant text)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 671 papers

Title	Date	Tasks	Status
NAPReg: Nouns As Proxies Regularization for Semantically Aware Cross-Modal Embeddings	Jan 7, 2023	Cross-Modal RetrievalImage-text Retrieval	CodeCode Available
Embracing Language Inclusivity and Diversity in CLIP through Continual Language Learning	Jan 30, 2024	DiversityImage-text Retrieval	CodeCode Available
Reproducibility, Replicability, and Insights into Visual Document Retrieval with Late Interaction	May 12, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Sentences From Natural Supervision	Apr 26, 2019	Image-text RetrievalObject	CodeCode Available
MultiWay-Adapater: Adapting large-scale multi-modal models for scalable image-text retrieval	Sep 4, 2023	Image-text RetrievalRetrieval	CodeCode Available
VL-Taboo: An Analysis of Attribute-based Zero-shot Capabilities of Vision-Language Models	Sep 12, 2022	AttributeImage-text Retrieval	CodeCode Available
Multi-stage Pre-training over Simplified Multimodal Pre-training Models	Jul 22, 2021	Image-text RetrievalRetrieval	CodeCode Available
Retrieval Augmentation for Deep Neural Networks	Feb 25, 2021	Image CaptioningRetrieval	CodeCode Available
Diving Deep into the Motion Representation of Video-Text Models	Jun 7, 2024	RetrievalText Retrieval	CodeCode Available
Dissecting Deep Metric Learning Losses for Image-Text Retrieval	Oct 21, 2022	Cross-Modal RetrievalImage-text matching	CodeCode Available
Multimodal Hypothetical Summary for Retrieval-based Multi-image Question Answering	Dec 19, 2024	Contrastive LearningLanguage Modeling	CodeCode Available
Reversed in Time: A Novel Temporal-Emphasized Benchmark for Cross-Modal Video-Text Retrieval	Dec 26, 2024	Image-text RetrievalInformation Retrieval	CodeCode Available
Differentiable Outlier Detection Enable Robust Deep Multimodal Analysis	Feb 11, 2023	Image-text RetrievalKnowledge Graphs	CodeCode Available
Multilingual Vision-Language Pre-training for the Remote Sensing Domain	Oct 30, 2024	Cross-Modal Retrievalimage-classification	CodeCode Available
MSVD-Indonesian: A Benchmark for Multimodal Video-Text Tasks in Indonesian	Jun 20, 2023	Cross-Lingual TransferRetrieval	CodeCode Available
MSTAR: Box-free Multi-query Scene Text Retrieval with Attention Recycling	Jun 12, 2025	16kRetrieval	CodeCode Available
AugTriever: Unsupervised Dense Retrieval and Domain Adaptation by Scalable Data Augmentation	Dec 17, 2022	Data AugmentationDomain Adaptation	CodeCode Available
Exposing and Mitigating Spurious Correlations for Cross-Modal Retrieval	Apr 6, 2023	Cross-Modal RetrievalImage-text Retrieval	CodeCode Available
Towards a text-based quantitative and explainable histopathology image analysis	Jul 10, 2024	image-classificationImage Classification	CodeCode Available
MODOC: A Modular Interface for Flexible Interlinking of Text Retrieval and Text Generation Functions	Aug 26, 2024	Information RetrievalRetrieval	CodeCode Available
Design of the topology for contrastive visual-textual alignment	Sep 5, 2022	Contrastive LearningImage-to-Text Retrieval	CodeCode Available
Rudder: A Cross Lingual Video and Text Retrieval Dataset	Mar 9, 2021	Natural Language QueriesRetrieval	CodeCode Available
Modelling Stopping Criteria for Search Results using Poisson Processes	Sep 13, 2019	RetrievalText Retrieval	CodeCode Available
Exploiting Positional Bias for Query-Agnostic Generative Content in Search	May 1, 2024	PositionText Retrieval	CodeCode Available
Mistral-SPLADE: LLMs for better Learned Sparse Retrieval	Aug 20, 2024	DecoderLanguage Modeling	CodeCode Available
An Unsupervised Cross-Modal Hashing Method Robust to Noisy Training Image-Text Correspondences in Remote Sensing	Feb 26, 2022	Image-text RetrievalMeta-Learning	CodeCode Available
Towards Robust Text Retrieval with Progressive Learning	Nov 20, 2023	Machine Reading ComprehensionQuestion Answering	CodeCode Available
MHSAN: Multi-Head Self-Attention Network for Visual Semantic Embedding	Jan 11, 2020	Image CaptioningImage-text Retrieval	CodeCode Available
USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text Retrieval	Jan 17, 2023	Contrastive LearningImage-text Retrieval	CodeCode Available
MeTA: A Unified Toolkit for Text Retrieval and Analysis	Aug 1, 2016	Document ClassificationInformation Retrieval	CodeCode Available
Explaining Text Similarity in Transformer Models	May 10, 2024	Information RetrievalRetrieval	CodeCode Available
Learning Joint Embedding with Multimodal Cues for Cross-Modal Video-Text Retrieval	Jun 11, 2018	Image-text RetrievalRetrieval	CodeCode Available
Large Vision-Language Models for Knowledge-Grounded Data Annotation of Memes	Jan 23, 2025	Emotion ClassificationImage Captioning	CodeCode Available
Expertized Caption Auto-Enhancement for Video-Text Retrieval	Feb 5, 2025	Caption GenerationRetrieval	CodeCode Available
A Binary Variational Autoencoder for Hashing	Oct 22, 2019	QuantizationRetrieval	CodeCode Available
Wukong: A 100 Million Large-scale Chinese Cross-modal Pre-training Benchmark	Feb 14, 2022	BenchmarkingContrastive Learning	CodeCode Available
Semantic-Preserving Augmentation for Robust Image-Text Retrieval	Mar 10, 2023	Image-text RetrievalRetrieval	CodeCode Available
Adding simple structure at inference improves Vision-Language Compositionality	Jun 11, 2025	AttributeImage-text Retrieval	CodeCode Available
Variational Deep Semantic Hashing for Text Documents	Aug 11, 2017	Image RetrievalInformation Retrieval	CodeCode Available
It Takes Two to Tango: Combining Visual and Textual Information for Detecting Duplicate Video-Based Bug Reports	Jan 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Shallow Cross-Encoders for Low-Latency Retrieval	Mar 29, 2024	CPUGPU	CodeCode Available
Tree-Based Text Retrieval via Hierarchical Clustering in RAGFrameworks: Application on Taiwanese Regulations	Jun 16, 2025	RAGRetrieval	CodeCode Available
A Bi-metric Framework for Fast Similarity Search	Jun 5, 2024	MTEB BenchmarkRe-Ranking	CodeCode Available
Intra-Modal Constraint Loss For Image-Text Retrieval	Jul 11, 2022	Cross-Modal RetrievalImage-text Retrieval	CodeCode Available
Denoising Table-Text Retrieval for Open-Domain Question Answering	Mar 26, 2024	DenoisingOpen-Domain Question Answering	CodeCode Available
DeepTileBars: Visualizing Term Distribution for Neural Information Retrieval	Nov 1, 2018	Ad-Hoc Information RetrievalDocument Ranking	CodeCode Available
Single Shot Scene Text Retrieval	Aug 27, 2018	Image RetrievalRetrieval	CodeCode Available
Single-Stream Multi-Level Alignment for Vision-Language Pretraining	Mar 27, 2022	Image-text RetrievalQuestion Answering	CodeCode Available
Video-Text Retrieval by Supervised Sparse Multi-Grained Learning	Feb 19, 2023	Representation LearningRetrieval	CodeCode Available
Socratic Models: Composing Zero-Shot Multimodal Reasoning with Language	Apr 1, 2022	DiversityImage Captioning	CodeCode Available

Show:10 25 50

← PrevPage 13 of 14Next →

No leaderboard results yet.