Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9376–9400 of 10817 papers

Title	Date	Tasks	Status
Interpretable Multi-Step Reasoning with Knowledge Extraction on Complex Healthcare Question Answering	Aug 6, 2020	Multiple-choiceQuestion Answering	—Unverified
Interpretable Neural Computation for Real-World Compositional Visual Question Answering	Oct 10, 2020	Question AnsweringVisual Question Answering	—Unverified
Interpretable Proof Generation via Iterative Backward Reasoning	Jan 16, 2022	PredictionQuestion Answering	—Unverified
Interpretable Question Answering on Knowledge Bases and Text	Jun 26, 2019	Question Answering	—Unverified
Interpretable Traces, Unexpected Outcomes: Investigating the Disconnect in Trace-Based Knowledge Distillation	May 20, 2025	Information RetrievalKnowledge Distillation	—Unverified
Interpretable Visual Question Answering Referring to Outside Knowledge	Mar 8, 2023	DiversityImage Captioning	—Unverified
Interpretable Visual Question Answering by Reasoning on Dependency Trees	Sep 6, 2018	Question Answeringvalid	—Unverified
Interpretable Visual Question Answering by Visual Grounding from Attention Supervision Mining	Aug 1, 2018	Question AnsweringVisual Grounding	—Unverified
Interpretable Visual Question Answering via Reasoning Supervision	Sep 7, 2023	Common Sense ReasoningQuestion Answering	—Unverified
Interpretable Visual Reasoning via Probabilistic Formulation under Natural Supervision	Aug 1, 2020	Question AnsweringVisual Question Answering	—Unverified
Interpretation of Natural Language Rules in Conversational Machine Reading	Aug 28, 2018	Question AnsweringReading Comprehension	—Unverified
Interpreting Anaphoric Shell Nouns using Antecedents of Cataphoric Shell Nouns as Training Data	Oct 1, 2013	Question AnsweringText Summarization	—Unverified
Interpreting Attention Models with Human Visual Attention in Machine Reading Comprehension	Jun 3, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified
Interpreting Consumer Health Questions: The Role of Anaphora and Ellipsis	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Interpreting Questions with a Log-Linear Ranking Model in a Virtual Patient Dialogue System	Jun 1, 2015	Question AnsweringSemantic Parsing	—Unverified
Inter-Weighted Alignment Network for Sentence Pair Modeling	Sep 1, 2017	Machine TranslationNatural Language Inference	—Unverified
In-the-Wild Video Question Answering	Oct 1, 2022	Evidence SelectionQuestion Answering	—Unverified
Intrinsic Self-correction for Enhanced Morality: An Analysis of Internal Mechanisms and the Superficial Hypothesis	Jul 21, 2024	Question AnsweringText Generation	—Unverified
Introducing "Forecast Utterance" for Conversational Data Science	Sep 7, 2023	PredictionQuestion Answering	—Unverified
Introducing RezoJDM16k: a French KnowledgeGraph DataSet for Link Prediction	Jun 1, 2022	16kBenchmarking	—Unverified
Introducing Semantics into Speech Encoders	Nov 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Introduction method for argumentative dialogue using paired question-answering interchange about personality	Jul 1, 2018	Decision MakingQuestion Answering	—Unverified
Introduction of a Probabilistic Language Model to Non-Factoid Question Answering Using Example Q\&A Pairs	Nov 1, 2012	Language ModelingLanguage Modelling	—Unverified
Introduction to Neural Network based Approaches for Question Answering over Knowledge Graphs	Jul 22, 2019	Knowledge GraphsQuestion Answering	—Unverified
Invar-RAG: Invariant LLM-aligned Retrieval for Better Generation	Nov 11, 2024	HallucinationInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 376 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified