Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3021–3030 of 10817 papers

Title	Date	Tasks	Status
Biomedical Question Answering via Weighted Neural Network Passage Retrieval	Jan 9, 2018	Passage RetrievalQuestion Answering	—Unverified
A Question Answering Framework for Decontextualizing User-facing Snippets from Scientific Documents	May 24, 2023	Question AnsweringQuestion Generation	—Unverified
Evaluating Answer Reranking Strategies in Time-sensitive Question Answering	Mar 6, 2025	Answer SelectionInformation Retrieval	—Unverified
Biomedical Question Answering via Multi-Level Summarization on a Local Knowledge Graph	Apr 2, 2025	Language ModelingLanguage Modelling	—Unverified
Biomedical Question Answering: A Survey of Approaches and Challenges	Feb 10, 2021	Information RetrievalMachine Reading Comprehension	—Unverified
Answer Candidate Type Selection: Text-to-Text Language Model for Closed Book Question Answering Meets Knowledge Graphs	Oct 10, 2023	Graph Question AnsweringKnowledge Graphs	—Unverified
Answer, Assemble, Ace: Understanding How Transformers Answer Multiple Choice Questions	Jul 21, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
Biomedical Multi-hop Question Answering Using Knowledge Graph Embeddings and Language Models	Nov 10, 2022	Knowledge Graph EmbeddingsKnowledge Graphs	—Unverified
A General FOFE-net Framework for Simple and Effective Question Answering over Knowledge Bases	Mar 29, 2019	Question AnsweringRelation	—Unverified
1-PAGER: One Pass Answer Generation and Evidence Retrieval	Oct 25, 2023	Answer GenerationQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 303 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified