Retrieval

A methodology that involves selecting relevant data or examples from a large dataset to support tasks like prediction, learning, or inference. It enhances models by providing context or additional information, often used in systems like retrieval-augmented generation or in-context learning.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 14297 papers

Title	Date	Tasks	Status	Hype
Graph Retrieval-Augmented Generation: A Survey	Aug 15, 2024	HallucinationRAG	CodeCode Available	3
OpenResearcher: Unleashing AI for Accelerated Scientific Research	Aug 13, 2024	RAGRetrieval	CodeCode Available	3
BMX: Entropy-weighted Similarity and Semantic-enhanced Lexical Search	Aug 13, 2024	Information RetrievalRetrieval	CodeCode Available	3
RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework	Aug 2, 2024	BenchmarkingDataset Generation	CodeCode Available	3
TaskGen: A Task-Based, Memory-Infused Agentic Framework using StrictJSON	Jul 22, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Human-like Episodic Memory for Infinite Context LLMs	Jul 12, 2024	Computational EfficiencyEvent Segmentation	CodeCode Available	3
Scaling Retrieval-Based Language Models with a Trillion-Token Datastore	Jul 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Robust Neural Information Retrieval: An Adversarial and Out-of-distribution Perspective	Jul 9, 2024	Information RetrievalRetrieval	CodeCode Available	3
Retrieval-augmented generation in multilingual settings	Jul 1, 2024	Prompt EngineeringRAG	CodeCode Available	3
BERGEN: A Benchmarking Library for Retrieval-Augmented Generation	Jul 1, 2024	BenchmarkingRAG	CodeCode Available	3
Searching for Best Practices in Retrieval-Augmented Generation	Jul 1, 2024	Question AnsweringRAG	CodeCode Available	3
Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More?	Jun 19, 2024	RAGRetrieval	CodeCode Available	3
AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning	Jun 17, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
AutoSurvey: Large Language Models Can Automatically Write Surveys	Jun 10, 2024	RetrievalSurvey	CodeCode Available	3
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs	Jun 7, 2024	BenchmarkingDecoder	CodeCode Available	3
GNN-RAG: Graph Neural Retrieval for Large Language Model Reasoning	May 30, 2024	Graph Question AnsweringKnowledge Graphs	CodeCode Available	3
CHESS: Contextual Harnessing for Efficient SQL Synthesis	May 27, 2024	Large Language ModelPrivacy Preserving	CodeCode Available	3
GRAG: Graph Retrieval-Augmented Generation	May 26, 2024	Entity RetrievalKnowledge Graphs	CodeCode Available	3
MS MARCO Web Search: a Large-scale Information-rich Web Dataset with Millions of Real Click Labels	May 13, 2024	Information RetrievalRetrieval	CodeCode Available	3
RAG and RAU: A Survey on Retrieval-Augmented Language Model in Natural Language Processing	Apr 30, 2024	Computational EfficiencyHallucination	CodeCode Available	3
Retrieval Head Mechanistically Explains Long-Context Factuality	Apr 24, 2024	Continual PretrainingHallucination	CodeCode Available	3
From Matching to Generation: A Survey on Generative Information Retrieval	Apr 23, 2024	Incremental LearningInformation Retrieval	CodeCode Available	3
STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases	Apr 19, 2024	BenchmarkingRetrieval	CodeCode Available	3
M3D: Advancing 3D Medical Image Analysis with Multi-Modal Large Language Models	Mar 31, 2024	Image-text RetrievalLanguage Modeling	CodeCode Available	3
MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions	Mar 28, 2024	Image RetrievalImplicit Relations	CodeCode Available	3
Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography	Mar 26, 2024	Anomaly DetectionLarge Language Model	CodeCode Available	3
Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity	Mar 21, 2024	Question AnsweringRAG	CodeCode Available	3
AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework	Mar 19, 2024	BenchmarkingFinancial Analysis	CodeCode Available	3
RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation	Mar 8, 2024	Code GenerationHallucination	CodeCode Available	3
Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context	Mar 8, 2024	1 Image, 2*2 StitchingCode Generation	CodeCode Available	3
Bridging Language and Items for Retrieval and Recommendation	Mar 6, 2024	RetrievalSentence	CodeCode Available	3
PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers	Feb 13, 2024	Question AnsweringRetrieval	CodeCode Available	3
PoisonedRAG: Knowledge Corruption Attacks to Retrieval-Augmented Generation of Large Language Models	Feb 12, 2024	Answer GenerationHallucination	CodeCode Available	3
Can Mamba Learn How to Learn? A Comparative Study on In-Context Learning Tasks	Feb 6, 2024	In-Context LearningLanguage Modeling	CodeCode Available	3
When Large Language Models Meet Vector Databases: A Survey	Jan 30, 2024	HallucinationInformation Retrieval	CodeCode Available	3
CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models	Jan 30, 2024	Knowledge Base ConstructionQuestion Answering	CodeCode Available	3
Corrective Retrieval Augmented Generation	Jan 29, 2024	RAGRetrieval	CodeCode Available	3
MultiHop-RAG: Benchmarking Retrieval-Augmented Generation for Multi-Hop Queries	Jan 27, 2024	BenchmarkingRAG	CodeCode Available	3
INTERS: Unlocking the Power of Large Language Models in Search with Instruction Tuning	Jan 12, 2024	Diversitydocument understanding	CodeCode Available	3
FinanceBench: A New Benchmark for Financial Question Answering	Nov 20, 2023	How to refund a wrong transaction in PhonePeQuestion Answering	CodeCode Available	3
Large Language Model based Long-tail Query Rewriting in Taobao Search	Nov 7, 2023	Contrastive LearningLanguage Modeling	CodeCode Available	3
WebGLM: Towards An Efficient Web-Enhanced Question Answering System with Human Preferences	Jun 13, 2023	Language ModelingLanguage Modelling	CodeCode Available	3
Landmark Attention: Random-Access Infinite Context Length for Transformers	May 25, 2023	Retrieval	CodeCode Available	3
WikiChat: Stopping the Hallucination of Large Language Model Chatbots by Few-Shot Grounding on Wikipedia	May 23, 2023	ChatbotHallucination	CodeCode Available	3
ONE-PEACE: Exploring One General Representation Model Toward Unlimited Modalities	May 18, 2023	1 Image, 2*2 StitchiAction Classification	CodeCode Available	3
AToMiC: An Image/Text Retrieval Test Collection to Support Multimedia Content Creation	Apr 4, 2023	Cross-Modal RetrievalImage-text Retrieval	CodeCode Available	3
Universal Instance Perception as Object Discovery and Retrieval	Mar 12, 2023	Described Object DetectionGeneralized Referring Expression Comprehension	CodeCode Available	3
REPLUG: Retrieval-Augmented Black-Box Language Models	Jan 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	3
Vision-Language Pre-training: Basics, Recent Advances, and Future Trends	Oct 17, 2022	Few-Shot LearningImage Captioning	CodeCode Available	3
A GPU-specialized Inference Parameter Server for Large-Scale Deep Recommendation Models	Oct 17, 2022	CPUGPU	CodeCode Available	3

Show:10 25 50

← PrevPage 4 of 286Next →

All datasets Quora Question Pairs HotpotQA Natural Questions OK-VQA InfoSeek MVK Polyvore PubMedQA PubMedQA corpus with metadata ToolLens คลิปไวรัล!! ไอซ์ ปรีชญา ลืมปิดไลฟ์สดตอนอาบน้ำ ถูกแชร์กระหึ่มเน็ต

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	183.53	—	Unverified
2	Elasticsearch	Queries per second	21.8	—	Unverified
3	BM25-PT	Queries per second	6.49	—	Unverified
4	Rank-BM25	Queries per second	1.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	20.88	—	Unverified
2	Elasticsearch	Queries per second	7.11	—	Unverified
3	Rank-BM25	Queries per second	0.04	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BM25S	Queries per second	41.85	—	Unverified
2	Elasticsearch	Queries per second	12.16	—	Unverified
3	Rank-BM25	Queries per second	0.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FLMR	Recall@5	89.32	—	Unverified
2	RA-VQA	Recall@5	82.84	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PreFLMR	Recall@5	62.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP-KIS	text-to-video Mean Rank	30	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CLIP4Outfit	Recall@5	7.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MetaGen Blended RAG	Accuracy (Top-1)	82.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MetaGen Blended RAG	Accuracy (Top-1)	82.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	COLT	COMP@	84.55	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	hello	0L	1,121,222	—	Unverified