Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8276–8300 of 10817 papers

Title	Date	Tasks	Status
Generating Natural Language Inference Chains	Jun 4, 2016	Machine TranslationNatural Language Inference	—Unverified
Combining LLMs and Knowledge Graphs to Reduce Hallucinations in Question Answering	Sep 6, 2024	HallucinationKnowledge Graphs	—Unverified
Aspect Sentiment Classification Towards Question-Answering with Reinforced Bidirectional Attention Network	Jul 1, 2019	General ClassificationQuestion Answering	—Unverified
AdaSwitch: Adaptive Switching between Small and Large Agents for Effective Cloud-Local Collaborative Learning	Oct 17, 2024	Mathematical ReasoningQuestion Answering	—Unverified
Generating Natural Language Explanations for Visual Question Answering using Scene Graphs and Visual Attention	Feb 15, 2019	Explanation GenerationLanguage Modeling	—Unverified
Generating Natural Answers by Incorporating Copying and Retrieving Mechanisms in Sequence-to-Sequence Learning	Jul 1, 2017	DecoderQuestion Answering	—Unverified
Combining Lexical and Syntactic Features for Detecting Content-dense Texts in News	Apr 3, 2017	ArticlesQuestion Answering	—Unverified
Generating multiple-choice questions for medical question answering with distractors and cue-masking	Mar 13, 2023	Language ModelingLanguage Modelling	—Unverified
Generating Lexicalization Patterns for Linked Open Data	Sep 1, 2015	Open Information ExtractionQuestion Answering	—Unverified
Combining Lexical and Semantic-based Features for Answer Sentence Selection	Dec 1, 2016	Feature EngineeringOpen-Domain Question Answering	—Unverified
Aspect-oriented Consumer Health Answer Summarization	May 10, 2024	Abstractive Text SummarizationCommunity Question Answering	—Unverified
Generating Justifications in a Spatial Question-Answering Dialogue System for a Blocks World	Oct 1, 2021	Question Answering	—Unverified
Generating High Quality Proposition Banks for Multilingual Semantic Role Labeling	Jul 1, 2015	Question AnsweringSemantic Role Labeling	—Unverified
Combining Knowledge Graph and LLMs for Enhanced Zero-shot Visual Question Answering	Jan 22, 2025	Knowledge GraphsQuestion Answering	—Unverified
Generating Followup Questions for Interpretable Multi-hop Question Answering	Feb 27, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
Generating Fact Checking Briefs	Nov 10, 2020	Fact CheckingQuestion Answering	—Unverified
Combining Intra- and Multi-sentential Rhetorical Parsing for Document-level Discourse Analysis	Aug 1, 2013	Question AnsweringSentence Compression	—Unverified
Aspect Classification for Legal Depositions	Sep 9, 2020	ClassificationGeneral Classification	—Unverified
Robust Training for Conversational Question Answering Models with Reinforced Reformulation Generation	Oct 20, 2023	Conversational Question AnsweringDeep Reinforcement Learning	—Unverified
Generating Extractive Summaries of Scientific Paradigms	Feb 4, 2014	ArticlesCommunity Detection	—Unverified
Generating Explanations in Medical Question-Answering by Expectation Maximization Inference over Evidence	Oct 2, 2023	Explanation GenerationMedical Question Answering	—Unverified
Combining Impression Feature Representation for Multi-turn Conversational Question Answering	Oct 1, 2020	Conversational Question Answeringfeature selection	—Unverified
Generating Dialogue Agents via Automated Planning	Feb 2, 2019	Question Answering	—Unverified
Combining Heterogeneous Models for Measuring Relational Similarity	Jun 1, 2013	Question Answering	—Unverified
``Look, some Green Circles!'': Learning to Quantify from Images	Aug 1, 2016	Question AnsweringVisual Question Answering (VQA)	—Unverified

Show:10 25 50

← PrevPage 332 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified