Open-Domain Question Answering

Open-domain question answering is the task of question answering on open-domain datasets such as Wikipedia.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 494 papers

Title	Date	Tasks	Status	Hype
Entropy-Based Decoding for Retrieval-Augmented Large Language Models	Jun 25, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
QPaug: Question and Passage Augmentation for Open-Domain Question Answering of LLMs	Jun 20, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Towards Robust Evaluation: A Comprehensive Taxonomy of Datasets and Metrics for Open Domain Question Answering in the Era of Large Language Models	Jun 19, 2024	BenchmarkingOpen-Domain Question Answering	—Unverified	0
RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation	Jun 9, 2024	Document RankingNatural Questions	CodeCode Available	0
CaLM: Contrasting Large and Small Language Models to Verify Grounded Generation	Jun 8, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
SPAGHETTI: Open-Domain Question Answering from Heterogeneous Data Sources with Retrieval and Semantic Parsing	Jun 1, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Passage-specific Prompt Tuning for Passage Reranking in Question Answering with Large Language Models	May 31, 2024	Open-Domain Question AnsweringPassage Reranking	CodeCode Available	0
Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models	May 31, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Conv-CoA: Improving Open-domain Question Answering in Large Language Models via Conversational Chain-of-Action	May 28, 2024	Conversational Question AnsweringHallucination	—Unverified	0
Accurate and Nuanced Open-QA Evaluation Through Textual Entailment	May 26, 2024	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available	0
AGRaME: Any-Granularity Ranking with Multi-Vector Embeddings	May 23, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Large Language Models Can Self-Correct with Key Condition Verification	May 23, 2024	Arithmetic ReasoningMath	—Unverified	0
TANQ: An open domain dataset of table answered questions	May 13, 2024	MathOpen-Domain Question Answering	CodeCode Available	1
Improving Long Text Understanding with Knowledge Distilled from Summarization Model	May 8, 2024	Abstractive Text SummarizationDocument Classification	—Unverified	0
Compressing Long Context for Enhancing RAG with AMR-based Concept Distillation	May 6, 2024	Abstract Meaning RepresentationOpen-Domain Question Answering	—Unverified	0
Stochastic RAG: End-to-End Retrieval-Augmented Generation through Expected Utility Maximization	May 5, 2024	Fact VerificationOpen-Domain Question Answering	—Unverified	0
Enhancing Contextual Understanding in Large Language Models through Contrastive Decoding	May 4, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Semi-Parametric Retrieval via Binary Bag-of-Tokens Index	May 3, 2024	Information RetrievalOpen-Domain Question Answering	CodeCode Available	0
When to Retrieve: Teaching LLMs to Utilize Information Retrieval Effectively	Apr 30, 2024	Information RetrievalOpen-Domain Question Answering	CodeCode Available	0
Towards a Search Engine for Machines: Unified Ranking for Multiple Retrieval-Augmented Large Language Models	Apr 30, 2024	Entity LinkingFact Verification	CodeCode Available	0
Spiral of Silence: How is Large Language Model Killing Information Retrieval? -- A Case Study on Open Domain Question Answering	Apr 16, 2024	Information RetrievalLanguage Modeling	CodeCode Available	1
Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval	Apr 15, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
KazQAD: Kazakh Open-Domain Question Answering Dataset	Apr 6, 2024	Information RetrievalMachine Translation	CodeCode Available	0
Multi-Granularity Guided Fusion-in-Decoder	Apr 3, 2024	DecoderMulti-Task Learning	CodeCode Available	1
Improving Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts	Apr 2, 2024	In-Context LearningLanguage Modeling	CodeCode Available	0
Towards Better Generalization in Open-Domain Question Answering by Mitigating Context Memorization	Apr 2, 2024	MemorizationOpen-Domain Question Answering	—Unverified	0
Denoising Table-Text Retrieval for Open-Domain Question Answering	Mar 26, 2024	DenoisingOpen-Domain Question Answering	CodeCode Available	0
ArabicaQA: A Comprehensive Dataset for Arabic Question Answering	Mar 26, 2024	BenchmarkingMachine Reading Comprehension	CodeCode Available	1
Blended RAG: Improving RAG (Retriever-Augmented Generation) Accuracy with Semantic Search and Hybrid Query-Based Retrievers	Mar 22, 2024	Information Retrieval	CodeCode Available	2
Awakening Augmented Generation: Learning to Awaken Internal Knowledge of Large Language Models for Question Answering	Mar 22, 2024	Open-Domain Question AnsweringOut-of-Distribution Generalization	CodeCode Available	0
FIT-RAG: Black-Box RAG with Factual Information and Token Reduction	Mar 21, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Context Quality Matters in Training Fusion-in-Decoder for Extractive Open-Domain Question Answering	Mar 21, 2024	DecoderLanguage Modeling	—Unverified	0
DESIRE-ME: Domain-Enhanced Supervised Information REtrieval using Mixture-of-Experts	Mar 20, 2024	Information RetrievalMixture-of-Experts	CodeCode Available	0
Beyond Memorization: The Challenge of Random Memory Access in Language Models	Mar 12, 2024	MemorizationOpen-Domain Question Answering	CodeCode Available	1
Harnessing Multi-Role Capabilities of Large Language Models for Open-Domain Question Answering	Mar 8, 2024	Answer GenerationOpen-Domain Question Answering	CodeCode Available	1
To Generate or to Retrieve? On the Effectiveness of Artificial Contexts for Medical Open-Domain Question Answering	Mar 4, 2024	MedQAMMLU	CodeCode Available	1
Answerability in Retrieval-Augmented Open-Domain Question Answering	Mar 3, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Automatic Question-Answer Generation for Long-Tail Knowledge	Mar 3, 2024	Answer GenerationKnowledge Graphs	—Unverified	0
Reasoning in Conversation: Solving Subjective Tasks through Dialogue Simulation for Large Language Models	Feb 27, 2024	Dark Humor DetectionDialogue Generation	—Unverified	0
REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering	Feb 27, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Pre-training Cross-lingual Open Domain Question Answering with Large-scale Synthetic Supervision	Feb 26, 2024	Answer GenerationCross-Lingual Question Answering	CodeCode Available	0
RetrievalQA: Assessing Adaptive Retrieval-Augmented Generation for Short-form Open-Domain Question Answering	Feb 26, 2024	FormOpen-Domain Question Answering	CodeCode Available	2
Self-DC: When to Reason and When to Act? Self Divide-and-Conquer for Compositional Unknown Questions	Feb 21, 2024	Binary ClassificationOpen-Domain Question Answering	—Unverified	0
PEDANTS: Cheap but Effective and Interpretable Answer Equivalence	Feb 17, 2024	BenchmarkingForm	CodeCode Available	2
BlendFilter: Advancing Retrieval-Augmented Large Language Models via Query Generation Blending and Knowledge Filtering	Feb 16, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL	Feb 16, 2024	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
A Dataset of Open-Domain Question Answering with Multiple-Span Answers	Feb 15, 2024	DescriptiveOpen-Domain Question Answering	—Unverified	0
ITINERA: Integrating Spatial Optimization with Large Language Models for Open-domain Urban Itinerary Planning	Feb 11, 2024	LLM real-life tasksOpen-Domain Question Answering	CodeCode Available	2
VerAs: Verify then Assess STEM Lab Reports	Feb 7, 2024	Automated Essay ScoringOpen-Domain Question Answering	CodeCode Available	0
A Chain-of-Thought Is as Strong as Its Weakest Link: A Benchmark for Verifiers of Reasoning Chains	Feb 1, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 2 of 10Next →

All datasets KILT: ELI5 KILT: Natural Questions KILT: TriviaQA KILT: HotpotQA SearchQA ELI5 QUASAR Natural Questions SQuAD1.1 dev WebQuestions SQuAD1.1 DuReader

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	somebody	KILT-RL	2.62	—	Unverified
2	Wikipedia	KILT-RL	2.46	—	Unverified
3	arxiv.org/abs/2103.06332	KILT-RL	2.36	—	Unverified
4	BART + DPR	KILT-RL	1.9	—	Unverified
5	RAG	KILT-RL	1.69	—	Unverified
6	Training Set Retrieval (top 1)	KILT-RL	0	—	Unverified
7	T5-base	KILT-RL	0	—	Unverified
8	Input Copying	KILT-RL	0	—	Unverified
9	Sphere	KILT-RL	0	—	Unverified
10	Random Training Set Answer	KILT-RL	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Re2G	KILT-EM	43.56	—	Unverified
2	intersect	KILT-EM	38.78	—	Unverified
3	KGI_0	KILT-EM	36.36	—	Unverified
4	Wikipedia	KILT-EM	35.32	—	Unverified
5	RAG	KILT-EM	32.69	—	Unverified
6	BERT + DPR	KILT-EM	31.99	—	Unverified
7	BART + DPR	KILT-EM	30.06	—	Unverified
8	Multitask DPR + BART	KILT-EM	29.09	—	Unverified
9	Multi-task DPR	KILT-EM	0	—	Unverified
10	Sphere	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Re2G	KILT-EM	57.91	—	Unverified
2	intersect	KILT-EM	50.56	—	Unverified
3	Wikipedia	KILT-EM	45.55	—	Unverified
4	KGI_0	KILT-EM	42.85	—	Unverified
5	Multitask DPR + BART	KILT-EM	42.36	—	Unverified
6	RAG	KILT-EM	38.13	—	Unverified
7	BERT + DPR	KILT-EM	34.48	—	Unverified
8	BART + DPR	KILT-EM	31.4	—	Unverified
9	TABi	KILT-EM	0	—	Unverified
10	T5-base	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	intersect	KILT-EM	18.06	—	Unverified
2	Wikipedia	KILT-EM	11.71	—	Unverified
3	Multitask DPR + BART	KILT-EM	9.53	—	Unverified
4	RAG	KILT-EM	3.21	—	Unverified
5	BART + DPR	KILT-EM	1.96	—	Unverified
6	BERT + DPR	KILT-EM	0.74	—	Unverified
7	Sphere	KILT-EM	0	—	Unverified
8	Multi-task DPR	KILT-EM	0	—	Unverified
9	GENRE	KILT-EM	0	—	Unverified
10	chriskuei	KILT-EM	0	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SpanBERT	F1	84.8	—	Unverified
2	Cluster-Former (#C=512)	EM	68	—	Unverified
3	Locality-Sensitive Hashing	EM	66	—	Unverified
4	Multi-passage BERT	EM	65.1	—	Unverified
5	Sparse Attention	EM	64.7	—	Unverified
6	DECAPROP	EM	62.2	—	Unverified
7	Bi-Attention + DCU-LSTM	N-gram F1	59.5	—	Unverified
8	Denoising QA	EM	58.8	—	Unverified
9	DecaProp	EM	56.8	—	Unverified
10	AMANDA	N-gram F1	56.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Fourier Transformer	Rouge-L	26.9	—	Unverified
2	QG	Rouge-L	26.4	—	Unverified
3	BART	Rouge-L	24.3	—	Unverified
4	E-MCA	Rouge-L	24	—	Unverified
5	Transformer Multitask + LayerDrop	Rouge-L	23.4	—	Unverified
6	Multi-Inrerleave	Rouge-L	14.63	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evidence Aggregation via R^3 Re-Ranking	EM (Quasar-T)	42.3	—	Unverified
2	Denoising QA	EM (Quasar-T)	42.2	—	Unverified
3	DecaProp	EM (Quasar-T)	38.6	—	Unverified
4	R^3	EM (Quasar-T)	35.3	—	Unverified
5	GA	EM (Quasar-T)	26.4	—	Unverified
6	BiDAF	EM (Quasar-T)	25.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FiE	Exact Match	58.4	—	Unverified
2	R2-D2 HN-DPR	Exact Match	55.9	—	Unverified
3	UniK-QA	Exact Match	54.9	—	Unverified
4	UnitedQA (Hybrid)	Exact Match	54.7	—	Unverified
5	BPR (linear scan; l=1000)	Exact Match	41.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SPARTA	EM	59.3	—	Unverified
2	Blended RAG	EM	57.63	—	Unverified
3	BERTserini	EM	50.2	—	Unverified
4	BERTserini	EM	38.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniK-QA	Exact Match	57.7	—	Unverified
2	FiE+PAQ	Exact Match	56.3	—	Unverified
3	FiE	Exact Match	52.4	—	Unverified
4	EMDR2	Exact Match	48.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DrQA	EM	70	—	Unverified
2	DCN	EM	66.2	—	Unverified
3	MPCM	EM	65.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ERNIE 2.0 Large	EM	64.2	—	Unverified
2	ERNIE 2.0 Base	EM	61.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UniK-QA	Exact Match	65.5	—	Unverified
2	BPR (linear scan; l=1000)	Exact Match	56.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EMDR2	Exact Match	52.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedQA (Hybrid)	Exact Match	70.5	—	Unverified