Retrieval

A methodology that involves selecting relevant data or examples from a large dataset to support tasks like prediction, learning, or inference. It enhances models by providing context or additional information, often used in systems like retrieval-augmented generation or in-context learning.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 14297 papers

Title	Date	Tasks	Status	Hype
Ranking Free RAG: Replacing Re-ranking with Selection in RAG for Sensitive Domains	May 21, 2025	RAGRe-Ranking	—Unverified	0
SCENIR: Visual Semantic Clarity through Unsupervised Scene Graph Retrieval	May 21, 2025	counterfactualGraph Generation	CodeCode Available	0
Do RAG Systems Suffer From Positional Bias?	May 21, 2025	RAGRetrieval	—Unverified	0
ConvSearch-R1: Enhancing Query Reformulation for Conversational Search with Reasoning via Reinforcement Learning	May 21, 2025	Conversational Searchreinforcement-learning	CodeCode Available	2
Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective	May 21, 2025	Instruction FollowingLanguage Modeling	—Unverified	0
CRAFT: Training-Free Cascaded Retrieval for Tabular QA	May 21, 2025	Natural Language QueriesNatural Questions	—Unverified	0
An Alternative to FLOPS Regularization to Effectively Productionize SPLADE-Doc	May 21, 2025	Retrieval	—Unverified	0
HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases	May 21, 2025	RAGRetrieval	CodeCode Available	0
Scalable Defense against In-the-wild Jailbreaking Attacks with Safety Context Retrieval	May 21, 2025	RAGRetrieval	—Unverified	0
MIRB: Mathematical Information Retrieval Benchmark	May 21, 2025	Automated Theorem ProvingInformation Retrieval	CodeCode Available	0
The Atlas of In-Context Learning: How Attention Heads Shape In-Context Retrieval Augmentation	May 21, 2025	Answer GenerationIn-Context Learning	CodeCode Available	1
ChartCards: A Chart-Metadata Generation Framework for Multi-Task Chart Understanding	May 21, 2025	Chart Question AnsweringChart Understanding	CodeCode Available	0
LiveVLM: Efficient Online Video Understanding via Streaming-Oriented KV Cache and Retrieval	May 21, 2025	Autonomous DrivingQuestion Answering	—Unverified	0
Single LLM, Multiple Roles: A Unified Retrieval-Augmented Generation Framework Using Role-Specific Token Optimization	May 21, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Reinforcing Question Answering Agents with Minimalist Policy Gradient Optimization	May 20, 2025	HallucinationIn-Context Learning	—Unverified	0
DisastIR: A Comprehensive Information Retrieval Benchmark for Disaster Management	May 20, 2025	Decision MakingInformation Retrieval	CodeCode Available	1
Multimodal RAG-driven Anomaly Detection and Classification in Laser Powder Bed Fusion using Large Language Models	May 20, 2025	Anomaly DetectionDescriptive	—Unverified	0
SCAN: Semantic Document Layout Analysis for Textual and Visual Retrieval-Augmented Generation	May 20, 2025	Document Layout Analysisobject-detection	—Unverified	0
Knowledge Graph Based Repository-Level Code Generation	May 20, 2025	Code GenerationCode Search	—Unverified	0
Cross-Domain Diffusion with Progressive Alignment for Efficient Adaptive Retrieval	May 20, 2025	Domain AdaptationRetrieval	—Unverified	0
RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding	May 20, 2025	Image CaptioningQuestion Answering	CodeCode Available	0
Studying the Role of Input-Neighbor Overlap in Retrieval-Augmented Language Models Training Efficiency	May 20, 2025	Language ModelingLanguage Modelling	—Unverified	0
Automatic Dataset Generation for Knowledge Intensive Question Answering Tasks	May 20, 2025	Dataset GenerationQuestion Answering	—Unverified	0
LoVR: A Benchmark for Long Video Retrieval in Multimodal Contexts	May 20, 2025	Caption GenerationRetrieval	CodeCode Available	1
Beginning with You: Perceptual-Initialization Improves Vision-Language Representation and Alignment	May 20, 2025	Representation LearningRetrieval	—Unverified	0
RA-Touch: Retrieval-Augmented Touch Understanding with Enriched Visual Data	May 20, 2025	Retrieval	—Unverified	0
s3: You Don't Need That Much Data to Train a Search Agent via RL	May 20, 2025	RAGReinforcement Learning (RL)	CodeCode Available	4
Process vs. Outcome Reward: Which is Better for Agentic RAG Reinforcement Learning	May 20, 2025	Answer GenerationRAG	CodeCode Available	1
Rank-K: Test-Time Reasoning for Listwise Reranking	May 20, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Benchmarking the Myopic Trap: Positional Bias in Information Retrieval	May 20, 2025	BenchmarkingInformation Retrieval	CodeCode Available	5
R2MED: A Benchmark for Reasoning-Driven Medical Retrieval	May 20, 2025	DiagnosticRe-Ranking	CodeCode Available	1
VulCPE: Context-Aware Cybersecurity Vulnerability Retrieval and Management	May 20, 2025	ManagementRelation Extraction	—Unverified	0
Data-Efficient Hate Speech Detection via Cross-Lingual Nearest Neighbor Retrieval with Limited Labeled Data	May 20, 2025	Cross-Lingual TransferData Augmentation	—Unverified	0
Beyond Text: Unveiling Privacy Vulnerabilities in Multi-modal Retrieval-Augmented Generation	May 20, 2025	Privacy PreservingRAG	—Unverified	0
NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search	May 20, 2025	Answer GenerationInformation Retrieval	—Unverified	0
Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning	May 20, 2025	Attributegraph partitioning	—Unverified	0
JIR-Arena: The First Benchmark Dataset for Just-in-time Information Recommendation	May 19, 2025	Information RetrievalRetrieval	CodeCode Available	0
LLM-Based Compact Reranking with Document Features for Scientific Retrieval	May 19, 2025	Large Language ModelReranking	—Unverified	0
Cross-Lingual Representation Alignment Through Contrastive Image-Caption Tuning	May 19, 2025	Natural Language UnderstandingRetrieval	CodeCode Available	0
Towards A Generalist Code Embedding Model Based On Massive Data Synthesis	May 19, 2025	DiversityDomain Generalization	—Unverified	0
GuRE:Generative Query REwriter for Legal Passage Retrieval	May 19, 2025	Passage RetrievalRetrieval	CodeCode Available	1
LLM-based Query Expansion Fails for Unfamiliar and Ambiguous Queries	May 19, 2025	HallucinationRetrieval	CodeCode Available	0
RAR: Setting Knowledge Tripwires for Retrieval Augmented Rejection	May 19, 2025	RAGRetrieval	—Unverified	0
Duluth at SemEval-2025 Task 7: TF-IDF with Optimized Vector Dimensions for Multilingual Fact-Checked Claim Retrieval	May 19, 2025	Retrieval	CodeCode Available	0
Optimizing Retrieval Augmented Generation for Object Constraint Language	May 19, 2025	Large Language ModelObject	—Unverified	0
Sense and Sensitivity: Examining the Influence of Semantic Recall on Long Context Code Reasoning	May 19, 2025	RetrievalSensitivity	—Unverified	0
CPRet: A Dataset, Benchmark, and Model for Retrieval in Competitive Programming	May 19, 2025	FairnessLarge Language Model	CodeCode Available	2
Accelerating Adaptive Retrieval Augmented Generation via Instruction-Driven Representation Reduction of Retrieval Overlaps	May 19, 2025	RAGRetrieval	—Unverified	0
GMM-Based Comprehensive Feature Extraction and Relative Distance Preservation For Few-Shot Cross-Modal Retrieval	May 19, 2025	Contrastive LearningCross-Modal Retrieval	—Unverified	0
Know3-RAG: A Knowledge-aware RAG Framework with Adaptive Retrieval, Generation, and Filtering	May 19, 2025	Knowledge GraphsRAG	CodeCode Available	0

Show:10 25 50

← PrevPage 7 of 286Next →

All datasets Quora Question Pairs HotpotQA Natural Questions OK-VQA InfoSeek MVK Polyvore PubMedQA PubMedQA corpus with metadata ToolLens คลิปไวรัล!! ไอซ์ ปรีชญา ลืมปิดไลฟ์สดตอนอาบน้ำ ถูกแชร์กระหึ่มเน็ต

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	183.53	—	Unverified
2	Elasticsearch	Queries per second	21.8	—	Unverified
3	BM25-PT	Queries per second	6.49	—	Unverified
4	Rank-BM25	Queries per second	1.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	20.88	—	Unverified
2	Elasticsearch	Queries per second	7.11	—	Unverified
3	Rank-BM25	Queries per second	0.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	41.85	—	Unverified
2	Elasticsearch	Queries per second	12.16	—	Unverified
3	Rank-BM25	Queries per second	0.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FLMR	Recall@5	89.32	—	Unverified
2	RA-VQA	Recall@5	82.84	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PreFLMR	Recall@5	62.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP-KIS	text-to-video Mean Rank	30	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4Outfit	Recall@5	7.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MetaGen Blended RAG	Accuracy (Top-1)	82.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MetaGen Blended RAG	Accuracy (Top-1)	82.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	COLT	COMP@	84.55	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	hello	0L	1,121,222	—	Unverified