Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6951–6975 of 10817 papers

Title	Date	Tasks	Status
A View From the Crowd: Evaluation Challenges for Time-Offset Interaction Applications	Apr 1, 2021	Question Answering	—Unverified
No Need to Pay Attention: Simple Recurrent Neural Networks Work!	Sep 1, 2017	Question Answering	—Unverified
No Need to Pay Attention: Simple Recurrent Neural Networks Work! (for Answering "Simple" Questions)	Jun 16, 2016	Question Answering	—Unverified
Non-monotonic Logical Reasoning Guiding Deep Learning for Explainable Visual Question Answering	Sep 23, 2019	Inductive LearningLogical Reasoning	—Unverified
No Noun Phrase Left Behind: Detecting and Typing Unlinkable Entities	Jul 1, 2012	Entity LinkingNamed Entity Recognition (NER)	—Unverified
Knowledge Graph Papers @ ICLR 2021	Jan 17, 2022	Complex Query AnsweringEntity Linking	—Unverified
Knowledge Graph-extended Retrieval Augmented Generation for Question Answering	Apr 11, 2025	In-Context LearningInformation Retrieval	—Unverified
Knowledge Graph Embedding with Hierarchical Relation Structure	Oct 1, 2018	Graph EmbeddingInformation Retrieval	—Unverified
A Vietnamese Text-Based Conversational Agent	Nov 26, 2019	Question Answering	—Unverified
An Encoder Attribution Analysis for Dense Passage Retriever in Open-Domain Question Answering	Jul 1, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified
Knowledge Graph - Deep Learning: A Case Study in Question Answering in Aviation Safety Domain	May 31, 2022	Natural Language QueriesPassage Retrieval	—Unverified
Knowledge Graph Curation: A Practical Framework	Aug 17, 2022	Knowledge GraphsMissing Values	—Unverified
DeepPurple: Lexical, String and Affective Feature Fusion for Sentence-Level Semantic Similarity Estimation	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
A Vietnamese Question Answering System	Nov 26, 2019	Question Answering	—Unverified
DeepPurple: Estimating Sentence Semantic Similarity using N-gram Regression Models and Web Snippets	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Knowledge Graph and Corpus Driven Segmentation and Answer Inference for Telegraphic Entity-seeking Queries	Oct 1, 2014	Information RetrievalKnowledge Graphs	—Unverified
DeepPavlov: Open-Source Library for Dialogue Systems	Jul 1, 2018	General Classificationintent-classification	—Unverified
A Vietnamese Dataset for Evaluating Machine Reading Comprehension	Dec 1, 2020	ArticlesMachine Reading Comprehension	—Unverified
An Encoder Attribution Analysis for Dense Passage Retriever in Open-Domain Question Answering	Jan 16, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified
Advancing Surgical VQA with Scene Graph Knowledge	Dec 15, 2023	Question AnsweringVisual Question Answering	—Unverified
Knowledge Fusion and Semantic Knowledge Ranking for Open Domain Question Answering	Apr 7, 2020	Information RetrievalOpen-Domain Question Answering	—Unverified
Not to Overfit or Underfit the Source Domains? An Empirical Study of Domain Generalization in Question Answering	May 15, 2022	Domain GeneralizationKnowledge Distillation	—Unverified
Knowledge Extraction and Joint Inference Using Tractable Markov Logic	Jun 1, 2012	Decision MakingQuestion Answering	—Unverified
Knowledge-Enhanced Named Entity Disambiguation for Short Text	Dec 1, 2020	Entity DisambiguationInformation Retrieval	—Unverified
A Vietnamese Dataset for Evaluating Machine Reading Comprehension	Sep 30, 2020	ArticlesMachine Reading Comprehension	—Unverified

Show:10 25 50

← PrevPage 279 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified