Open-Domain Question Answering

Open-domain question answering is the task of question answering on open-domain datasets such as Wikipedia.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 494 papers

Title	Date	Tasks	Status	Hype
TableRAG: A Retrieval Augmented Generation Framework for Heterogeneous Document Reasoning	Jun 12, 2025	Answer GenerationChunking	CodeCode Available	2
Efficient Context Selection for Long-Context QA: No Tuning, No Iteration, Just Adaptive-k	Jun 10, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
ECoRAG: Evidentiality-guided Compression for Long Context RAG	Jun 5, 2025	Answer GenerationOpen-Domain Question Answering	CodeCode Available	1
GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models	May 26, 2025	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	0
NOVER: Incentive Training for Language Models via Verifier-Free Reinforcement Learning	May 21, 2025	General Reinforcement LearningLogical Reasoning	CodeCode Available	1
Single LLM, Multiple Roles: A Unified Retrieval-Augmented Generation Framework Using Role-Specific Token Optimization	May 21, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Unveiling Knowledge Utilization Mechanisms in LLM-based Retrieval-Augmented Generation	May 17, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Scaling Reasoning can Improve Factuality in Large Language Models	May 16, 2025	Knowledge GraphsLarge Language Model	CodeCode Available	0
Benchmarking LLM-based Relevance Judgment Methods	Apr 17, 2025	BenchmarkingOpen-Domain Question Answering	CodeCode Available	0
Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task	Apr 4, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
CoRAG: Collaborative Retrieval-Augmented Generation	Apr 2, 2025	Few-Shot LearningOpen-Domain Question Answering	—Unverified	0
Dense Passage Retrieval in Conversational Search	Mar 21, 2025	Conversational SearchInformation Retrieval	CodeCode Available	0
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems	Mar 17, 2025	Evidence SelectionLarge Language Model	—Unverified	0
Optimizing open-domain question answering with graph-based retrieval augmented generation	Mar 4, 2025	BenchmarkingLanguage Modeling	—Unverified	0
Beyond Prompting: An Efficient Embedding Framework for Open-Domain Question Answering	Mar 3, 2025	Contrastive LearningOpen-Domain Question Answering	—Unverified	0
WebFAQ: A Multilingual Collection of Natural Q&A Datasets for Dense Retrieval	Feb 28, 2025	Dataset GenerationOpen-Domain Question Answering	—Unverified	0
From Retrieval to Generation: Comparing Different Approaches	Feb 27, 2025	Language ModelingLanguage Modelling	—Unverified	0
Few-Shot Multilingual Open-Domain QA from 5 Examples	Feb 27, 2025	Few-Shot LearningOpen-Domain Question Answering	CodeCode Available	0
RA-MTR: A Retrieval Augmented Multi-Task Reader based Approach for Inspirational Quote Extraction from Long Documents	Feb 17, 2025	ArticlesOpen-Domain Question Answering	CodeCode Available	0
RoseRAG: Robust Retrieval-augmented Generation with Small-scale LLMs via Margin-aware Preference Optimization	Feb 16, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Talk Structurally, Act Hierarchically: A Collaborative Framework for LLM Multi-Agent Systems	Feb 16, 2025	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	2
ASRank: Zero-Shot Re-Ranking with Answer Scent for Document Retrieval	Jan 25, 2025	Language ModelingLanguage Modelling	—Unverified	0
Passage Segmentation of Documents for Extractive Question Answering	Jan 17, 2025	ChunkingExtractive Question-Answering	—Unverified	0
Parallel Key-Value Cache Fusion for Position Invariant RAG	Jan 13, 2025	DecoderOpen-Domain Question Answering	—Unverified	0
WebWalker: Benchmarking LLMs in Web Traversal	Jan 13, 2025	BenchmarkingOpen-Domain Question Answering	CodeCode Available	11
Improving Generated and Retrieved Knowledge Combination Through Zero-shot Generation	Dec 25, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Accelerating Manufacturing Scale-Up from Material Discovery Using Agentic Web Navigation and Retrieval-Augmented AI for Process Engineering Schematics Design	Dec 8, 2024	Knowledge GraphsOpen-Domain Question Answering	—Unverified	0
DynRank: Improving Passage Retrieval with Dynamic Zero-Shot Prompting Based on Question Classification	Nov 30, 2024	Open-Domain Question AnsweringPassage Retrieval	—Unverified	0
Context Awareness Gate For Retrieval Augmented Generation	Nov 25, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Do LLMs Understand Ambiguity in Text? A Case Study in Open-world Question Answering	Nov 19, 2024	Fact CheckingOpen-Domain Question Answering	—Unverified	0
Invar-RAG: Invariant LLM-aligned Retrieval for Better Generation	Nov 11, 2024	HallucinationInformation Retrieval	—Unverified	0
JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking	Oct 31, 2024	Code CompletionOpen-Domain Question Answering	—Unverified	0
Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering	Oct 21, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	2
Improve Dense Passage Retrieval with Entailment Tuning	Oct 21, 2024	Open-Domain Question AnsweringPassage Retrieval	—Unverified	0
BRIEF: Bridging Retrieval and Inference for Multi-hop Reasoning via Compression	Oct 20, 2024	In-Context LearningLong-Context Understanding	CodeCode Available	1
Advancing Large Language Model Attribution through Self-Improving	Oct 17, 2024	Language ModelingLanguage Modelling	—Unverified	0
Open Domain Question Answering with Conflicting Contexts	Oct 16, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
BanglaQuAD: A Bengali Open-domain Question Answering Dataset	Oct 14, 2024	ArticlesOpen-Domain Question Answering	—Unverified	0
LoRE: Logit-Ranked Retriever Ensemble for Enhancing Open-Domain Question Answering	Oct 13, 2024	Answer GenerationLanguage Modeling	—Unverified	0
Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation	Oct 11, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	2
Does RAG Introduce Unfairness in LLMs? Evaluating Fairness in Retrieval-Augmented Generation Systems	Sep 29, 2024	FairnessOpen-Domain Question Answering	CodeCode Available	0
Detecting Temporal Ambiguity in Questions	Sep 25, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Exploring Hint Generation Approaches in Open-Domain Question Answering	Sep 24, 2024	Hint GenerationOpen-Domain Question Answering	CodeCode Available	1
A Multimodal Dense Retrieval Approach for Speech-Based Open-Domain Question Answering	Sep 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
A Statistical Framework for Data-dependent Retrieval-Augmented Models	Aug 27, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering	Aug 24, 2024	knowledge editingOpen-Domain Question Answering	—Unverified	0
W-RAG: Weakly Supervised Dense Retrieval in RAG for Open-domain Question Answering	Aug 15, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
FastFiD: Improve Inference Efficiency of Open Domain Question Answering via Sentence Selection	Aug 12, 2024	Answer GenerationDecoder	CodeCode Available	1
Enhancing Robustness of Retrieval-Augmented Language Models with In-Context Learning	Aug 8, 2024	In-Context LearningMachine Reading Comprehension	—Unverified	0
Adaptive Contrastive Decoding in Retrieval-Augmented Generation for Handling Noisy Contexts	Aug 2, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 1 of 10Next →

All datasets KILT: ELI5 KILT: Natural Questions KILT: TriviaQA KILT: HotpotQA SearchQA ELI5 QUASAR Natural Questions SQuAD1.1 dev WebQuestions SQuAD1.1 DuReader

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	somebody	KILT-RL	2.62	—	Unverified
2	Wikipedia	KILT-RL	2.46	—	Unverified
3	arxiv.org/abs/2103.06332	KILT-RL	2.36	—	Unverified
4	BART + DPR	KILT-RL	1.9	—	Unverified
5	RAG	KILT-RL	1.69	—	Unverified
6	T5-base	KILT-RL	0	—	Unverified
7	GENRE	KILT-RL	0	—	Unverified
8	Multi-task DPR	KILT-RL	0	—	Unverified
9	BART	KILT-RL	0	—	Unverified
10	Training Set Retrieval (top 1)	KILT-RL	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Re2G	KILT-EM	43.56	—	Unverified
2	intersect	KILT-EM	38.78	—	Unverified
3	KGI_0	KILT-EM	36.36	—	Unverified
4	Wikipedia	KILT-EM	35.32	—	Unverified
5	RAG	KILT-EM	32.69	—	Unverified
6	BERT + DPR	KILT-EM	31.99	—	Unverified
7	BART + DPR	KILT-EM	30.06	—	Unverified
8	Multitask DPR + BART	KILT-EM	29.09	—	Unverified
9	Sphere	KILT-EM	0	—	Unverified
10	T5-base	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Re2G	KILT-EM	57.91	—	Unverified
2	intersect	KILT-EM	50.56	—	Unverified
3	Wikipedia	KILT-EM	45.55	—	Unverified
4	KGI_0	KILT-EM	42.85	—	Unverified
5	Multitask DPR + BART	KILT-EM	42.36	—	Unverified
6	RAG	KILT-EM	38.13	—	Unverified
7	BERT + DPR	KILT-EM	34.48	—	Unverified
8	BART + DPR	KILT-EM	31.4	—	Unverified
9	Multi-task DPR	KILT-EM	0	—	Unverified
10	Sphere	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	intersect	KILT-EM	18.06	—	Unverified
2	Wikipedia	KILT-EM	11.71	—	Unverified
3	Multitask DPR + BART	KILT-EM	9.53	—	Unverified
4	RAG	KILT-EM	3.21	—	Unverified
5	BART + DPR	KILT-EM	1.96	—	Unverified
6	BERT + DPR	KILT-EM	0.74	—	Unverified
7	Sphere	KILT-EM	0	—	Unverified
8	Multi-task DPR	KILT-EM	0	—	Unverified
9	GENRE	KILT-EM	0	—	Unverified
10	chriskuei	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpanBERT	F1	84.8	—	Unverified
2	Cluster-Former (#C=512)	EM	68	—	Unverified
3	Locality-Sensitive Hashing	EM	66	—	Unverified
4	Multi-passage BERT	EM	65.1	—	Unverified
5	Sparse Attention	EM	64.7	—	Unverified
6	DECAPROP	EM	62.2	—	Unverified
7	Bi-Attention + DCU-LSTM	N-gram F1	59.5	—	Unverified
8	Denoising QA	EM	58.8	—	Unverified
9	DecaProp	EM	56.8	—	Unverified
10	AMANDA	N-gram F1	56.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fourier Transformer	Rouge-L	26.9	—	Unverified
2	QG	Rouge-L	26.4	—	Unverified
3	BART	Rouge-L	24.3	—	Unverified
4	E-MCA	Rouge-L	24	—	Unverified
5	Transformer Multitask + LayerDrop	Rouge-L	23.4	—	Unverified
6	Multi-Inrerleave	Rouge-L	14.63	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evidence Aggregation via R^3 Re-Ranking	EM (Quasar-T)	42.3	—	Unverified
2	Denoising QA	EM (Quasar-T)	42.2	—	Unverified
3	DecaProp	EM (Quasar-T)	38.6	—	Unverified
4	R^3	EM (Quasar-T)	35.3	—	Unverified
5	GA	EM (Quasar-T)	26.4	—	Unverified
6	BiDAF	EM (Quasar-T)	25.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FiE	Exact Match	58.4	—	Unverified
2	R2-D2 HN-DPR	Exact Match	55.9	—	Unverified
3	UniK-QA	Exact Match	54.9	—	Unverified
4	UnitedQA (Hybrid)	Exact Match	54.7	—	Unverified
5	BPR (linear scan; l=1000)	Exact Match	41.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPARTA	EM	59.3	—	Unverified
2	Blended RAG	EM	57.63	—	Unverified
3	BERTserini	EM	50.2	—	Unverified
4	BERTserini	EM	38.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniK-QA	Exact Match	57.7	—	Unverified
2	FiE+PAQ	Exact Match	56.3	—	Unverified
3	FiE	Exact Match	52.4	—	Unverified
4	EMDR2	Exact Match	48.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQA	EM	70	—	Unverified
2	DCN	EM	66.2	—	Unverified
3	MPCM	EM	65.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ERNIE 2.0 Large	EM	64.2	—	Unverified
2	ERNIE 2.0 Base	EM	61.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniK-QA	Exact Match	65.5	—	Unverified
2	BPR (linear scan; l=1000)	Exact Match	56.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EMDR2	Exact Match	52.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedQA (Hybrid)	Exact Match	70.5	—	Unverified