Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5301–5325 of 10817 papers

Title	Date	Tasks	Status
Learning Representations for Zero-Shot Retrieval over Structured Data	Oct 29, 2021	Passage RetrievalQuestion Answering	—Unverified
Learning Representations from Imperfect Time Series Data via Tensor Rank Regularization	Jul 1, 2019	Question AnsweringSentiment Analysis	—Unverified
AttackQA: Development and Adoption of a Dataset for Assisting Cybersecurity Operations using Fine-tuned and Open-Source LLMs	Nov 1, 2024	Question AnsweringRAG	—Unverified
Improved Representation Learning for Question Answer Matching	Aug 1, 2016	Answer SelectionNatural Language Inference	—Unverified
Knowledge Guided Named Entity Recognition for BioMedical Text	Nov 10, 2019	named-entity-recognitionNamed Entity Recognition	—Unverified
Learning Question-Guided Video Representation for Multi-Turn Video Question Answering	Jul 31, 2019	NavigateQuestion Answering	—Unverified
Improved Recognition and Normalisation of Polish Temporal Expressions	Sep 1, 2017	BIG-bench Machine LearningQuestion Answering	—Unverified
A Deep Network Model for Paraphrase Detection in Short Text Messages	Dec 7, 2017	Question AnsweringSentence	—Unverified
Learning Rank Functionals: An Empirical Study	Jul 23, 2014	Information RetrievalLearning-To-Rank	—Unverified
KnowledgeHub: An end-to-end Tool for Assisted Scientific Discovery	May 16, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Improved Neural Relation Detection for Knowledge Base Question Answering	Apr 20, 2017	Entity LinkingKnowledge Base Question Answering	—Unverified
Knowledge Informed Semantic Parsing for Conversational Question Answering	Aug 1, 2021	Conversational Question AnsweringDecoder	—Unverified
Improved LLM Agents for Financial Document Question Answering	Jun 10, 2025	Question Answering	—Unverified
Coreference Resolution for the Basque Language with BART	Jun 1, 2016	Chunkingcoreference-resolution	—Unverified
Improved Lexically Constrained Decoding for Translation and Monolingual Rewriting	Jun 1, 2019	Data AugmentationMachine Translation	—Unverified
KnowledgeNavigator: Leveraging Large Language Models for Enhanced Reasoning over Knowledge Graph	Dec 26, 2023	HallucinationLanguage Modeling	—Unverified
Improve Dense Passage Retrieval with Entailment Tuning	Oct 21, 2024	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Knowledge Proxy Intervention for Deconfounded Video Question Answering	Jan 1, 2023	Question AnsweringVideo Question Answering	—Unverified
Knowledge Pyramid: A Novel Hierarchical Reasoning Structure for Generalized Knowledge Augmentation and Inference	Jan 17, 2024	Decision MakingInformation Retrieval	—Unverified
Knowledge Reasoning via Jointly Modeling Knowledge Graphs and Soft Rules	Jan 7, 2023	Knowledge Graph CompletionKnowledge Graph Embeddings	—Unverified
Knowledge Representation and Extraction at Scale	Aug 1, 2018	ArticlesGeneral Knowledge	—Unverified
Coreference Resolution for Swedish and German using Distant Supervision	May 1, 2017	coreference-resolutionCoreference Resolution	—Unverified
Knowledge Retrieval Based on Generative AI	Jan 8, 2025	Large Language ModelMultiple-choice	—Unverified
Delving Deep into Extractive Question Answering Data	Nov 16, 2021	Extractive Question-AnsweringQuestion Answering	—Unverified
Analysis of Wikipedia-based Corpora for Question Answering	Jan 6, 2018	Question AnsweringRetrieval	—Unverified

Show:10 25 50

← PrevPage 213 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified