Open-Domain Question Answering

Open-domain question answering is the task of question answering on open-domain datasets such as Wikipedia.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 494 papers

Title	Date	Tasks	Status	Hype
CFMatch: Aligning Automated Answer Equivalence Evaluation with Expert Judgments For Open-Domain Question Answering	Jan 24, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Can AI Assistants Know What They Don't Know?	Jan 24, 2024	MathOpen-Domain Question Answering	CodeCode Available	2
Narrowing the Knowledge Evaluation Gap: Open-Domain Question Answering with Multi-Granularity Answers	Jan 9, 2024	InformativenessOpen-Domain Question Answering	—Unverified	0
Mitigating the Impact of False Negatives in Dense Retrieval with Contrastive Confidence Regularization	Dec 30, 2023	Answer GenerationContrastive Learning	CodeCode Available	1
Dynamic Retrieval-Augmented Generation	Dec 14, 2023	abstractive question answeringCode Generation	—Unverified	0
Learning to Filter Context for Retrieval-Augmented Generation	Nov 14, 2023	Extractive Question-AnsweringFact Verification	CodeCode Available	2
Hint-enhanced In-Context Learning wakes Large Language Models up for knowledge-intensive tasks	Nov 3, 2023	In-Context LearningOpen-Domain Question Answering	—Unverified	0
DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text	Oct 31, 2023	Information RetrievalKnowledge Graphs	—Unverified	0
Knowledge Corpus Error in Question Answering	Oct 27, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Detrimental Contexts in Open-Domain Question Answering	Oct 27, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Improving Zero-shot Reader by Reducing Distractions from Irrelevant Documents in Open-Domain Question Answering	Oct 26, 2023	Answer SelectionNegation	—Unverified	0
Tree of Clarifications: Answering Ambiguous Questions with Retrieval-Augmented Large Language Models	Oct 23, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Strong and Efficient Baselines for Open Domain Conversational Question Answering	Oct 23, 2023	Conversational Question AnsweringDecoder	—Unverified	0
Dual-Feedback Knowledge Retrieval for Task-Oriented Dialogue Systems	Oct 23, 2023	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Merging Generated and Retrieved Knowledge for Open-Domain QA	Oct 22, 2023	DecoderOpen-Domain Question Answering	CodeCode Available	1
Self-prompted Chain-of-Thought on Large Language Models for Open-domain Multi-hop Reasoning	Oct 20, 2023	In-Context LearningMulti-hop Question Answering	CodeCode Available	1
MoqaGPT : Zero-Shot Multi-modal Open-domain Question Answering with Large Language Model	Oct 20, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks	Oct 19, 2023	HallucinationHallucination Evaluation	—Unverified	0
Dual-Encoders for Extreme Multi-Label Classification	Oct 16, 2023	ClassificationExtreme Multi-Label Classification	CodeCode Available	0
Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators	Oct 11, 2023	Information RetrievalInformativeness	CodeCode Available	1
RECOMP: Improving Retrieval-Augmented LMs with Compression and Selective Augmentation	Oct 6, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Making Retrieval-Augmented Language Models Robust to Irrelevant Context	Oct 2, 2023	Language ModellingNatural Language Inference	CodeCode Available	1
RA-DIT: Retrieval-Augmented Dual Instruction Tuning	Oct 2, 2023	Few-Shot LearningOpen-Domain Question Answering	—Unverified	0
Retrieving Supporting Evidence for Generative Question Answering	Sep 20, 2023	Generative Question AnsweringOpen-Domain Question Answering	—Unverified	0
Monolingual or Multilingual Instruction Tuning: Which Makes a Better Alpaca	Sep 16, 2023	Instruction FollowingLarge Language Model	CodeCode Available	0
Silver Retriever: Advancing Neural Passage Retrieval for Polish Question Answering	Sep 15, 2023	Open-Domain Question AnsweringPassage Retrieval	—Unverified	0
AVATAR: Robust Voice Search Engine Leveraging Autoregressive Document Retrieval and Contrastive Learning	Sep 4, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Modeling Uncertainty and Using Post-fusion as Fallback Improves Retrieval Augmented Generation with LLMs	Aug 24, 2023	Answer GenerationOpen-Domain Question Answering	—Unverified	0
Knowledge Graph Prompting for Multi-Document Question Answering	Aug 22, 2023	graph constructionOpen-Domain Question Answering	CodeCode Available	2
RAVEN: In-Context Learning with Retrieval-Augmented Encoder-Decoder Language Models	Aug 15, 2023	DecoderIn-Context Learning	CodeCode Available	0
Building Interpretable and Reliable Open Information Retriever for New Domains Overnight	Aug 9, 2023	Information RetrievalOpen-Domain Question Answering	—Unverified	0
MythQA: Query-Based Large-Scale Check-Worthy Claim Detection through Multi-Answer Open-Domain Question Answering	Jul 21, 2023	Fact CheckingMisinformation	CodeCode Available	0
Generator-Retriever-Generator Approach for Open-Domain Question Answering	Jul 21, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation	Jul 20, 2023	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Answering Ambiguous Questions via Iterative Prompting	Jul 8, 2023	DiversityOpen-Domain Question Answering	CodeCode Available	1
TRAQ: Trustworthy Retrieval Augmented Question Answering via Conformal Prediction	Jul 7, 2023	Bayesian OptimizationChatbot	CodeCode Available	0
Retrieving Supporting Evidence for LLMs Generated Answers	Jun 23, 2023	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Conformal Language Modeling	Jun 16, 2023	Conformal PredictionLanguage Modeling	CodeCode Available	1
When to Read Documents or QA History: On Unified and Selective Open-domain QA	Jun 7, 2023	Natural QuestionsOpen-Domain Question Answering	—Unverified	0
Question-Context Alignment and Answer-Context Dependencies for Effective Answer Sentence Selection	Jun 3, 2023	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
GripRank: Bridging the Gap between Retrieval and Generation via the Generative Knowledge Improved Passage Ranking	May 29, 2023	Answer GenerationDialogue Generation	—Unverified	0
Exploiting Abstract Meaning Representation for Open-Domain Question Answering	May 26, 2023	Abstract Meaning RepresentationDiversity	CodeCode Available	1
Expand, Rerank, and Retrieve: Query Reranking for Open-Domain Question Answering	May 26, 2023	Open-Domain Question AnsweringPassage Retrieval	CodeCode Available	1
RFiD: Towards Rational Fusion-in-Decoder for Open-Domain Question Answering	May 26, 2023	DecoderNatural Questions	CodeCode Available	0
The Dangers of trusting Stochastic Parrots: Faithfulness and Trust in Open-domain Conversational Question Answering	May 25, 2023	Conversational Question AnsweringOpen-Domain Question Answering	—Unverified	0
Fourier Transformer: Fast Long Range Modeling by Removing Sequence Redundancy with FFT Operator	May 24, 2023	Abstractive Text SummarizationDocument Summarization	CodeCode Available	1
Allies: Prompting Large Language Model with Beam Search	May 24, 2023	Language ModelingLanguage Modelling	—Unverified	0
Exploring Contrast Consistency of Open-Domain Question Answering Systems on Minimally Edited Questions	May 23, 2023	Data AugmentationLanguage Modeling	CodeCode Available	0
On the Risk of Misinformation Pollution with Large Language Models	May 23, 2023	MisinformationOpen-Domain Question Answering	CodeCode Available	1
IfQA: A Dataset for Open-domain Question Answering under Counterfactual Presuppositions	May 23, 2023	counterfactualCounterfactual Reasoning	—Unverified	0

Show:10 25 50

← PrevPage 3 of 10Next →

All datasets KILT: ELI5 KILT: Natural Questions KILT: TriviaQA KILT: HotpotQA SearchQA ELI5 QUASAR Natural Questions SQuAD1.1 dev WebQuestions SQuAD1.1 DuReader

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	somebody	KILT-RL	2.62	—	Unverified
2	Wikipedia	KILT-RL	2.46	—	Unverified
3	arxiv.org/abs/2103.06332	KILT-RL	2.36	—	Unverified
4	BART + DPR	KILT-RL	1.9	—	Unverified
5	RAG	KILT-RL	1.69	—	Unverified
6	Training Set Retrieval (top 1)	KILT-RL	0	—	Unverified
7	T5-base	KILT-RL	0	—	Unverified
8	Input Copying	KILT-RL	0	—	Unverified
9	Sphere	KILT-RL	0	—	Unverified
10	Random Training Set Answer	KILT-RL	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Re2G	KILT-EM	43.56	—	Unverified
2	intersect	KILT-EM	38.78	—	Unverified
3	KGI_0	KILT-EM	36.36	—	Unverified
4	Wikipedia	KILT-EM	35.32	—	Unverified
5	RAG	KILT-EM	32.69	—	Unverified
6	BERT + DPR	KILT-EM	31.99	—	Unverified
7	BART + DPR	KILT-EM	30.06	—	Unverified
8	Multitask DPR + BART	KILT-EM	29.09	—	Unverified
9	Multi-task DPR	KILT-EM	0	—	Unverified
10	Sphere	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Re2G	KILT-EM	57.91	—	Unverified
2	intersect	KILT-EM	50.56	—	Unverified
3	Wikipedia	KILT-EM	45.55	—	Unverified
4	KGI_0	KILT-EM	42.85	—	Unverified
5	Multitask DPR + BART	KILT-EM	42.36	—	Unverified
6	RAG	KILT-EM	38.13	—	Unverified
7	BERT + DPR	KILT-EM	34.48	—	Unverified
8	BART + DPR	KILT-EM	31.4	—	Unverified
9	TABi	KILT-EM	0	—	Unverified
10	T5-base	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	intersect	KILT-EM	18.06	—	Unverified
2	Wikipedia	KILT-EM	11.71	—	Unverified
3	Multitask DPR + BART	KILT-EM	9.53	—	Unverified
4	RAG	KILT-EM	3.21	—	Unverified
5	BART + DPR	KILT-EM	1.96	—	Unverified
6	BERT + DPR	KILT-EM	0.74	—	Unverified
7	Sphere	KILT-EM	0	—	Unverified
8	Multi-task DPR	KILT-EM	0	—	Unverified
9	GENRE	KILT-EM	0	—	Unverified
10	chriskuei	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpanBERT	F1	84.8	—	Unverified
2	Cluster-Former (#C=512)	EM	68	—	Unverified
3	Locality-Sensitive Hashing	EM	66	—	Unverified
4	Multi-passage BERT	EM	65.1	—	Unverified
5	Sparse Attention	EM	64.7	—	Unverified
6	DECAPROP	EM	62.2	—	Unverified
7	Bi-Attention + DCU-LSTM	N-gram F1	59.5	—	Unverified
8	Denoising QA	EM	58.8	—	Unverified
9	DecaProp	EM	56.8	—	Unverified
10	AMANDA	N-gram F1	56.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fourier Transformer	Rouge-L	26.9	—	Unverified
2	QG	Rouge-L	26.4	—	Unverified
3	BART	Rouge-L	24.3	—	Unverified
4	E-MCA	Rouge-L	24	—	Unverified
5	Transformer Multitask + LayerDrop	Rouge-L	23.4	—	Unverified
6	Multi-Inrerleave	Rouge-L	14.63	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evidence Aggregation via R^3 Re-Ranking	EM (Quasar-T)	42.3	—	Unverified
2	Denoising QA	EM (Quasar-T)	42.2	—	Unverified
3	DecaProp	EM (Quasar-T)	38.6	—	Unverified
4	R^3	EM (Quasar-T)	35.3	—	Unverified
5	GA	EM (Quasar-T)	26.4	—	Unverified
6	BiDAF	EM (Quasar-T)	25.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FiE	Exact Match	58.4	—	Unverified
2	R2-D2 HN-DPR	Exact Match	55.9	—	Unverified
3	UniK-QA	Exact Match	54.9	—	Unverified
4	UnitedQA (Hybrid)	Exact Match	54.7	—	Unverified
5	BPR (linear scan; l=1000)	Exact Match	41.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPARTA	EM	59.3	—	Unverified
2	Blended RAG	EM	57.63	—	Unverified
3	BERTserini	EM	50.2	—	Unverified
4	BERTserini	EM	38.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniK-QA	Exact Match	57.7	—	Unverified
2	FiE+PAQ	Exact Match	56.3	—	Unverified
3	FiE	Exact Match	52.4	—	Unverified
4	EMDR2	Exact Match	48.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQA	EM	70	—	Unverified
2	DCN	EM	66.2	—	Unverified
3	MPCM	EM	65.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ERNIE 2.0 Large	EM	64.2	—	Unverified
2	ERNIE 2.0 Base	EM	61.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniK-QA	Exact Match	65.5	—	Unverified
2	BPR (linear scan; l=1000)	Exact Match	56.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EMDR2	Exact Match	52.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedQA (Hybrid)	Exact Match	70.5	—	Unverified