Retrieval

A methodology that involves selecting relevant data or examples from a large dataset to support tasks like prediction, learning, or inference. It enhances models by providing context or additional information, often used in systems like retrieval-augmented generation or in-context learning.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 14297 papers

Title	Date	Tasks	Status	Hype
Generative Representational Instruction Tuning	Feb 15, 2024	Language ModelingLanguage Modelling	CodeCode Available	4
Not what you've signed up for: Compromising Real-World LLM-Integrated Applications with Indirect Prompt Injection	Feb 23, 2023	Code CompletionComputer Security	CodeCode Available	4
RETSim: Resilient and Efficient Text Similarity	Nov 28, 2023	Adversarial TextClustering	CodeCode Available	4
Retrieval-Augmented Generation with Hierarchical Knowledge	Mar 13, 2025	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	4
s3: You Don't Need That Much Data to Train a Search Agent via RL	May 20, 2025	RAGReinforcement Learning (RL)	CodeCode Available	4
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks	May 22, 2020	Fact VerificationQuestion Answering	CodeCode Available	4
Gated Delta Networks: Improving Mamba2 with Delta Rule	Dec 9, 2024	Common Sense ReasoningLanguage Modeling	CodeCode Available	4
OnPrem.LLM: A Privacy-Conscious Document Intelligence Toolkit	May 12, 2025	GPUPrivacy Preserving	CodeCode Available	4
Retrieval-Augmented Generation for Large Language Models: A Survey	Dec 18, 2023	HallucinationRAG	CodeCode Available	4
Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling	Jun 11, 2024	4kLanguage Modeling	CodeCode Available	4
A Survey of LLM DATA	May 24, 2025	Large Language ModelManagement	CodeCode Available	4
EasyRAG: Efficient Retrieval-Augmented Generation Framework for Automated Network Operations	Oct 14, 2024	Answer GenerationQuestion Answering	CodeCode Available	4
Evaluating Pre-trained Convolutional Neural Networks and Foundation Models as Feature Extractors for Content-based Medical Image Retrieval	Sep 14, 2024	Contrastive LearningImage Retrieval	CodeCode Available	4
Resources for Brewing BEIR: Reproducible Reference Models and an Official Leaderboard	Jun 13, 2023	Information RetrievalRepresentation Learning	CodeCode Available	4
DuoAttention: Efficient Long-Context LLM Inference with Retrieval and Streaming Heads	Oct 14, 2024	GPUQuantization	CodeCode Available	4
RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation	Mar 8, 2024	Code GenerationHallucination	CodeCode Available	3
Any Information Is Just Worth One Single Screenshot: Unifying Search With Visualized Information Retrieval	Feb 17, 2025	Information RetrievalRetrieval	CodeCode Available	3
REAL: Benchmarking Autonomous Agents on Deterministic Simulations of Real Websites	Apr 15, 2025	Autonomous Web NavigationBenchmarking	CodeCode Available	3
RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation	Aug 21, 2024	RAGRetrieval	CodeCode Available	3
RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework	Aug 2, 2024	BenchmarkingDataset Generation	CodeCode Available	3
DALL-Eval: Probing the Reasoning Skills and Social Biases of Text-to-Image Generation Models	Feb 8, 2022	DiagnosticImage Captioning	CodeCode Available	3
RAG and RAU: A Survey on Retrieval-Augmented Language Model in Natural Language Processing	Apr 30, 2024	Computational EfficiencyHallucination	CodeCode Available	3
PoisonedRAG: Knowledge Corruption Attacks to Retrieval-Augmented Generation of Large Language Models	Feb 12, 2024	Answer GenerationHallucination	CodeCode Available	3
RAKG:Document-level Retrieval Augmented Knowledge Graph Construction	Apr 14, 2025	coreference-resolutionCoreference Resolution	CodeCode Available	3
PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers	Feb 13, 2024	Question AnsweringRetrieval	CodeCode Available	3
Direct Retrieval-augmented Optimization: Synergizing Knowledge Selection and Language Models	May 5, 2025	Policy Gradient MethodsRAG	CodeCode Available	3
CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models	Jan 30, 2024	Knowledge Base ConstructionQuestion Answering	CodeCode Available	3
Corrective Retrieval Augmented Generation	Jan 29, 2024	RAGRetrieval	CodeCode Available	3
OpenResearcher: Unleashing AI for Accelerated Scientific Research	Aug 13, 2024	RAGRetrieval	CodeCode Available	3
MultiHop-RAG: Benchmarking Retrieval-Augmented Generation for Multi-Hop Queries	Jan 27, 2024	BenchmarkingRAG	CodeCode Available	3
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs	Jun 7, 2024	BenchmarkingDecoder	CodeCode Available	3
ONE-PEACE: Exploring One General Representation Model Toward Unlimited Modalities	May 18, 2023	1 Image, 2*2 StitchiAction Classification	CodeCode Available	3
Parametric Retrieval Augmented Generation	Jan 27, 2025	Domain AdaptationRAG	CodeCode Available	3
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System	Mar 12, 2025	ChunkingComputational Efficiency	CodeCode Available	3
AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework	Mar 19, 2024	BenchmarkingFinancial Analysis	CodeCode Available	3
MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models	Oct 16, 2024	DiagnosticHallucination	CodeCode Available	3
MedRAG: Enhancing Retrieval-augmented Generation with Knowledge Graph-Elicited Reasoning for Healthcare Copilot	Feb 6, 2025	DiagnosticLarge Language Model	CodeCode Available	3
MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval	Dec 19, 2024	Image RetrievalRetrieval	CodeCode Available	3
MDocAgent: A Multi-Modal Multi-Agent Framework for Document Understanding	Mar 18, 2025	document understandingQuestion Answering	CodeCode Available	3
MS MARCO Web Search: a Large-scale Information-rich Web Dataset with Millions of Real Click Labels	May 13, 2024	Information RetrievalRetrieval	CodeCode Available	3
PathRAG: Pruning Graph-based Retrieval Augmented Generation with Relational Paths	Feb 18, 2025	RAGRetrieval	CodeCode Available	3
REPLUG: Retrieval-Augmented Black-Box Language Models	Jan 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	3
Ai2 Scholar QA: Organized Literature Synthesis with Attribution	Apr 15, 2025	Question AnsweringRetrieval	CodeCode Available	3
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models	Sep 7, 2024	ChunkingRetrieval	CodeCode Available	3
LRP4RAG: Detecting Hallucinations in Retrieval-Augmented Generation via Layer-wise Relevance Propagation	Aug 28, 2024	RAGRetrieval	CodeCode Available	3
A GPU-specialized Inference Parameter Server for Large-Scale Deep Recommendation Models	Oct 17, 2022	CPUGPU	CodeCode Available	3
CHESS: Contextual Harnessing for Efficient SQL Synthesis	May 27, 2024	Large Language ModelPrivacy Preserving	CodeCode Available	3
Large Language Model based Long-tail Query Rewriting in Taobao Search	Nov 7, 2023	Contrastive LearningLanguage Modeling	CodeCode Available	3
M3D: Advancing 3D Medical Image Analysis with Multi-Modal Large Language Models	Mar 31, 2024	Image-text RetrievalLanguage Modeling	CodeCode Available	3
Can Mamba Learn How to Learn? A Comparative Study on In-Context Learning Tasks	Feb 6, 2024	In-Context LearningLanguage Modeling	CodeCode Available	3

Show:10 25 50

← PrevPage 3 of 286Next →

All datasets Quora Question Pairs HotpotQA Natural Questions OK-VQA InfoSeek MVK Polyvore PubMedQA PubMedQA corpus with metadata ToolLens คลิปไวรัล!! ไอซ์ ปรีชญา ลืมปิดไลฟ์สดตอนอาบน้ำ ถูกแชร์กระหึ่มเน็ต

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	183.53	—	Unverified
2	Elasticsearch	Queries per second	21.8	—	Unverified
3	BM25-PT	Queries per second	6.49	—	Unverified
4	Rank-BM25	Queries per second	1.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	20.88	—	Unverified
2	Elasticsearch	Queries per second	7.11	—	Unverified
3	Rank-BM25	Queries per second	0.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	41.85	—	Unverified
2	Elasticsearch	Queries per second	12.16	—	Unverified
3	Rank-BM25	Queries per second	0.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FLMR	Recall@5	89.32	—	Unverified
2	RA-VQA	Recall@5	82.84	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PreFLMR	Recall@5	62.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP-KIS	text-to-video Mean Rank	30	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4Outfit	Recall@5	7.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MetaGen Blended RAG	Accuracy (Top-1)	82.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MetaGen Blended RAG	Accuracy (Top-1)	82.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	COLT	COMP@	84.55	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	hello	0L	1,121,222	—	Unverified