Text Retrieval

Text Retrieval is the task of finding the most text result (such as an answer, paragraph, or passage) given a query (which could be a question, keywords, or any relevant text)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 671 papers

Title	Date	Tasks	Status
Breaking Language Barriers or Reinforcing Bias? A Study of Gender and Racial Disparities in Multilingual Contrastive Vision Language Models	May 20, 2025	Image-text RetrievalText Retrieval	—Unverified
Towards Cross-modal Retrieval in Chinese Cultural Heritage Documents: Dataset and Solution	May 16, 2025	Cross-Modal RetrievalImage to text	—Unverified
Reproducibility, Replicability, and Insights into Visual Document Retrieval with Late Interaction	May 12, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
A Vision-Language Foundation Model for Leaf Disease Identification	May 11, 2025	Contrastive Learningimage-classification	CodeCode Available
QBD-RankedDataGen: Generating Custom Ranked Datasets for Improving Query-By-Document Search Using LLM-Reranking with Reduced Human Effort	May 7, 2025	Information RetrievalReranking	—Unverified
AGATE: Stealthy Black-box Watermarking for Multimodal Model Copyright Protection	Apr 28, 2025	Adversarial AttackAnomaly Detection	—Unverified
Breaking the Modality Barrier: Universal Embedding Learning with Multimodal LLMs	Apr 24, 2025	Image-text RetrievalInstruction Following	—Unverified
Towards Understanding Camera Motions in Any Video	Apr 21, 2025	Question AnsweringText Retrieval	—Unverified
SemCORE: A Semantic-Enhanced Generative Cross-Modal Retrieval Framework with MLLMs	Apr 17, 2025	Cross-Modal RetrievalImage Retrieval	—Unverified
DART: Disease-aware Image-Text Alignment and Self-correcting Re-alignment for Trustworthy Radiology Report Generation	Apr 16, 2025	Contrastive LearningImage to text	—Unverified
FocalLens: Instruction Tuning Enables Zero-Shot Conditional Image Representations	Apr 11, 2025	image-classificationImage Classification	—Unverified
Bridging Queries and Tables through Entities in Table Retrieval	Apr 9, 2025	RetrievalTable Retrieval	—Unverified
LV-MAE: Learning Long Video Representations through Masked-Embedding Autoencoders	Apr 4, 2025	Self-Supervised LearningText Retrieval	—Unverified
Learning Audio-guided Video Representation with Gated Attention for Video-Text Retrieval	Apr 3, 2025	Information RetrievalRepresentation Learning	—Unverified
M2D2: Exploring General-purpose Audio-Language Representations Beyond CLAP	Mar 28, 2025	Audio captioningAudio Classification	—Unverified
SeLIP: Similarity Enhanced Contrastive Language Image Pretraining for Multi-modal Head MRI	Mar 25, 2025	Contrastive LearningImage Segmentation	—Unverified
Anatomy-Aware Conditional Image-Text Retrieval	Mar 10, 2025	AnatomyContrastive Learning	—Unverified
Bridging Classical and Quantum String Matching: A Computational Reformulation of Bit-Parallelism	Mar 7, 2025	Text Retrieval	—Unverified
Variance-Aware Loss Scheduling for Multimodal Alignment in Low-Data Settings	Mar 5, 2025	Contrastive LearningImage-text Retrieval	—Unverified
Tailoring Table Retrieval from a Field-aware Hybrid Matching Perspective	Mar 4, 2025	RetrievalSentence	—Unverified
LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning	Mar 4, 2025	Contrastive LearningImage-text Retrieval	—Unverified
V^2Dial: Unification of Video and Visual Dialog via Multimodal Experts	Mar 3, 2025	Contrastive LearningText Retrieval	—Unverified
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
ABC: Achieving Better Control of Multimodal Embeddings using VLMs	Mar 1, 2025	Image to textImage-to-Text Retrieval	—Unverified
How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching	Feb 25, 2025	Multi-Task LearningRetrieval	—Unverified
Progressive Local Alignment for Medical Multimodal Pre-training	Feb 25, 2025	Contrastive LearningImage-text Retrieval	—Unverified
Med-gte-hybrid: A contextual embedding transformer model for extracting actionable information from clinical texts	Feb 21, 2025	Contrastive LearningDecision Making	—Unverified
ATRI: Mitigating Multilingual Audio Text Retrieval Inconsistencies by Reducing Data Distribution Errors	Feb 20, 2025	AudioCapsContrastive Learning	CodeCode Available
SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features	Feb 20, 2025	FairnessImage-text Retrieval	—Unverified
LSTM-based Selective Dense Text Retrieval Guided by Sparse Lexical Retrieval	Feb 15, 2025	RetrievalText Retrieval	—Unverified
Fine-tuning Multimodal Transformers on Edge: A Parallel Split Learning Approach	Feb 10, 2025	Federated LearningImage-text Retrieval	—Unverified
DCFormer: Efficient 3D Vision-Language Modeling with Decomposed Convolutions	Feb 7, 2025	Anomaly DetectionImage-text Retrieval	—Unverified
Expertized Caption Auto-Enhancement for Video-Text Retrieval	Feb 5, 2025	Caption GenerationRetrieval	CodeCode Available
Scientometric Analysis of the German IR Community within TREC & CLEF	Feb 5, 2025	Information RetrievalRetrieval	—Unverified
Large Vision-Language Models for Knowledge-Grounded Data Annotation of Memes	Jan 23, 2025	Emotion ClassificationImage Captioning	CodeCode Available
MASS: Overcoming Language Bias in Image-Text Matching	Jan 20, 2025	Image-text matchingImage-text Retrieval	—Unverified
TSVC:Tripartite Learning with Semantic Variation Consistency for Robust Image-Text Retrieval	Jan 19, 2025	Cross-Modal RetrievalImage-text Retrieval	—Unverified
CLIP is Almost All You Need: Towards Parameter-Efficient Scene Text Retrieval without OCR	Jan 1, 2025	AllOptical Character Recognition	—Unverified
Advancing Myopia To Holism: Fully Contrastive Language-Image Pre-training	Jan 1, 2025	Image-text RetrievalImage to text	—Unverified
Rethinking Noisy Video-Text Retrieval via Relation-aware Alignment	Jan 1, 2025	RelationRetrieval	—Unverified
Retaining Knowledge and Enhancing Long-Text Representations in CLIP through Dual-Teacher Distillation	Jan 1, 2025	image-classificationImage Classification	—Unverified
V^2Dial: Unification of Video and Visual Dialog via Multimodal Experts	Jan 1, 2025	Contrastive LearningText Retrieval	—Unverified
CaReBench: A Fine-Grained Benchmark for Video Captioning and Retrieval	Dec 31, 2024	RetrievalText Retrieval	—Unverified
The Text Classification Pipeline: Starting Shallow going Deeper	Dec 30, 2024	ClassificationInformation Retrieval	—Unverified
Multi-Head Attention Driven Dynamic Visual-Semantic Embedding for Enhanced Image-Text Matching	Dec 26, 2024	Image-text matchingText Matching	—Unverified
Reversed in Time: A Novel Temporal-Emphasized Benchmark for Cross-Modal Video-Text Retrieval	Dec 26, 2024	Image-text RetrievalInformation Retrieval	CodeCode Available
Optimizing Multi-Stage Language Models for Effective Text Retrieval	Dec 26, 2024	RetrievalText Retrieval	—Unverified
PolySmart @ TRECVid 2024 Medical Video Question Answering	Dec 20, 2024	Question AnsweringRetrieval	—Unverified
SKETCH: Structured Knowledge Enhanced Text Comprehension for Holistic Retrieval	Dec 19, 2024	Knowledge GraphsRAG	—Unverified
Multimodal Hypothetical Summary for Retrieval-based Multi-image Question Answering	Dec 19, 2024	Contrastive LearningLanguage Modeling	CodeCode Available

Show:10 25 50

← PrevPage 6 of 14Next →

No leaderboard results yet.