Text Retrieval

Text Retrieval is the task of finding the most text result (such as an answer, paragraph, or passage) given a query (which could be a question, keywords, or any relevant text)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 671 papers

Title	Date	Tasks	Status	Hype
Med-gte-hybrid: A contextual embedding transformer model for extracting actionable information from clinical texts	Feb 21, 2025	Contrastive LearningDecision Making	—Unverified	0
SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features	Feb 20, 2025	FairnessImage-text Retrieval	CodeCode Available	0
ATRI: Mitigating Multilingual Audio Text Retrieval Inconsistencies by Reducing Data Distribution Errors	Feb 20, 2025	AudioCapsContrastive Learning	CodeCode Available	0
PeerQA: A Scientific Question Answering Dataset from Peer Reviews	Feb 19, 2025	answerability predictionAnswer Generation	CodeCode Available	1
LSTM-based Selective Dense Text Retrieval Guided by Sparse Lexical Retrieval	Feb 15, 2025	RetrievalText Retrieval	—Unverified	0
Fine-tuning Multimodal Transformers on Edge: A Parallel Split Learning Approach	Feb 10, 2025	Federated LearningImage-text Retrieval	—Unverified	0
Temporal Working Memory: Query-Guided Segment Refinement for Enhanced Multimodal Understanding	Feb 9, 2025	Image CaptioningImage-text Retrieval	CodeCode Available	3
DCFormer: Efficient 3D Vision-Language Modeling with Decomposed Convolutions	Feb 7, 2025	Anomaly DetectionImage-text Retrieval	—Unverified	0
Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion	Feb 6, 2025	image-classificationImage Classification	CodeCode Available	2
Expertized Caption Auto-Enhancement for Video-Text Retrieval	Feb 5, 2025	Caption GenerationRetrieval	CodeCode Available	0
Scientometric Analysis of the German IR Community within TREC & CLEF	Feb 5, 2025	Information RetrievalRetrieval	—Unverified	0
Large Vision-Language Models for Knowledge-Grounded Data Annotation of Memes	Jan 23, 2025	Emotion ClassificationImage Captioning	CodeCode Available	0
A Survey of Graph Retrieval-Augmented Generation for Customized Large Language Models	Jan 21, 2025	RAGRetrieval	CodeCode Available	7
MASS: Overcoming Language Bias in Image-Text Matching	Jan 20, 2025	Image-text matchingImage-text Retrieval	—Unverified	0
TSVC:Tripartite Learning with Semantic Variation Consistency for Robust Image-Text Retrieval	Jan 19, 2025	Cross-Modal RetrievalImage-text Retrieval	—Unverified	0
BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature	Jan 13, 2025	ArticlesImage-text Retrieval	CodeCode Available	2
Advancing Myopia To Holism: Fully Contrastive Language-Image Pre-training	Jan 1, 2025	Image-text RetrievalImage to text	—Unverified	0
V^2Dial: Unification of Video and Visual Dialog via Multimodal Experts	Jan 1, 2025	Contrastive LearningText Retrieval	—Unverified	0
Retaining Knowledge and Enhancing Long-Text Representations in CLIP through Dual-Teacher Distillation	Jan 1, 2025	image-classificationImage Classification	—Unverified	0
CLIP is Almost All You Need: Towards Parameter-Efficient Scene Text Retrieval without OCR	Jan 1, 2025	AllOptical Character Recognition	—Unverified	0
Rethinking Noisy Video-Text Retrieval via Relation-aware Alignment	Jan 1, 2025	RelationRetrieval	—Unverified	0
CaReBench: A Fine-Grained Benchmark for Video Captioning and Retrieval	Dec 31, 2024	RetrievalText Retrieval	—Unverified	0
The Text Classification Pipeline: Starting Shallow going Deeper	Dec 30, 2024	ClassificationInformation Retrieval	—Unverified	0
GASLITEing the Retrieval: Exploring Vulnerabilities in Dense Embedding-based Search	Dec 30, 2024	RAGRetrieval	CodeCode Available	1
Optimizing Multi-Stage Language Models for Effective Text Retrieval	Dec 26, 2024	RetrievalText Retrieval	—Unverified	0
Multi-Head Attention Driven Dynamic Visual-Semantic Embedding for Enhanced Image-Text Matching	Dec 26, 2024	Image-text matchingText Matching	—Unverified	0
Reversed in Time: A Novel Temporal-Emphasized Benchmark for Cross-Modal Video-Text Retrieval	Dec 26, 2024	Image-text RetrievalInformation Retrieval	CodeCode Available	0
Where am I? Cross-View Geo-localization with Natural Language Descriptions	Dec 22, 2024	geo-localizationImage Retrieval	CodeCode Available	2
PolySmart @ TRECVid 2024 Medical Video Question Answering	Dec 20, 2024	Question AnsweringRetrieval	—Unverified	0
SKETCH: Structured Knowledge Enhanced Text Comprehension for Holistic Retrieval	Dec 19, 2024	Knowledge GraphsRAG	—Unverified	0
Multimodal Hypothetical Summary for Retrieval-based Multi-image Question Answering	Dec 19, 2024	Contrastive LearningLanguage Modeling	CodeCode Available	0
I0T: Embedding Standardization Method Towards Zero Modality Gap	Dec 18, 2024	Contrastive LearningImage-text Retrieval	CodeCode Available	1
CLASP: Contrastive Language-Speech Pretraining for Multilingual Multimodal Information Retrieval	Dec 17, 2024	Contrastive LearningInformation Retrieval	CodeCode Available	1
Establishing a Foundation for Tetun Ad-Hoc Text Retrieval: Stemming, Indexing, Retrieval, and Ranking	Dec 16, 2024	Information RetrievalRetrieval	—Unverified	0
Gramian Multimodal Representation Learning and Alignment	Dec 16, 2024	Contrastive LearningRepresentation Learning	CodeCode Available	2
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images	Dec 11, 2024	Contrastive LearningCross-Modal Information Retrieval	—Unverified	0
Barking Up The Syntactic Tree: Enhancing VLM Training with Syntactic Losses	Dec 11, 2024	Image-text RetrievalQuestion Answering	—Unverified	0
Explaining and Mitigating the Modality Gap in Contrastive Multimodal Learning	Dec 10, 2024	Contrastive LearningImage-text Retrieval	—Unverified	0
VladVA: Discriminative Fine-tuning of LVLMs	Dec 5, 2024	Image-text RetrievalRepresentation Learning	—Unverified	0
Linq-Embed-Mistral Technical Report	Dec 4, 2024	RetrievalText Retrieval	—Unverified	0
Adaptive Two-Phase Finetuning LLMs for Japanese Legal Text Retrieval	Dec 3, 2024	RetrievalText Retrieval	—Unverified	0
DIR: Retrieval-Augmented Image Captioning with Comprehensive Understanding	Dec 2, 2024	Caption GenerationDomain Generalization	—Unverified	0
Approximate Fiber Product: A Preliminary Algebraic-Geometric Perspective on Multimodal Embedding Alignment	Nov 30, 2024	Image-text RetrievalRepresentation Learning	—Unverified	0
CAREL: Instruction-guided reinforcement learning with cross-modal auxiliary objectives	Nov 29, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	0
AudioSetCaps: An Enriched Audio-Caption Dataset using Automated Generation Pipeline with Large Audio and Language Models	Nov 28, 2024	Audio captioningAudio to Text Retrieval	CodeCode Available	2
Knowledge Transfer Across Modalities with Natural Language Supervision	Nov 23, 2024	Image-text RetrievalNovel Concepts	—Unverified	0
Cross-Modal Pre-Aligned Method with Global and Local Information for Remote-Sensing Image and Text Retrieval	Nov 22, 2024	Image RetrievalReranking	—Unverified	0
Uni-Mlip: Unified Self-supervision for Medical Vision Language Pre-training	Nov 20, 2024	Contrastive Learningimage-classification	—Unverified	0
A Comparative Study of Text Retrieval Models on DaReCzech	Nov 19, 2024	Information RetrievalMachine Translation	—Unverified	0
A Survey of Medical Vision-and-Language Applications and Their Techniques	Nov 19, 2024	Decision MakingDiagnostic	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 14Next →

No leaderboard results yet.