Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5226–5250 of 10817 papers

Title	Date	Tasks	Status
Improving Data Augmentation in Low-resource Question Answering with Active Learning in Multiple Stages	Jan 16, 2022	Active LearningAnswer Generation	—Unverified
Generating and Evaluating Explanations of Attended and Error-Inducing Input Regions for VQA Models	Mar 26, 2021	Question AnsweringVisual Question Answering	—Unverified
Knowing Where to Look? Analysis on Attention of Visual Question Answering System	Oct 9, 2018	Question AnsweringVisual Question Answering	—Unverified
KnowIT VQA: Answering Knowledge-Based Questions about Videos	Oct 23, 2019	Question AnsweringVideo Question Answering	—Unverified
Improving Data Augmentation for Robust Visual Question Answering with Effective Curriculum Learning	Jan 28, 2024	Data AugmentationQuestion Answering	—Unverified
Correction of Faulty Background Knowledge based on Condition Aware and Revise Transformer for Question Answering	Jun 30, 2020	Missing ValuesQuestion Answering	—Unverified
Improving Cross-Modal Understanding in Visual Dialog via Contrastive Learning	Apr 15, 2022	Contrastive LearningQuestion Answering	—Unverified
Knowledge-Aided Open-Domain Question Answering	Jun 9, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Knowledge AI: Fine-tuning NLP Models for Facilitating Scientific Knowledge Extraction and Understanding	Aug 4, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Improving Cross-lingual Representation for Semantic Retrieval with Code-switching	Mar 3, 2024	Question AnsweringRetrieval	—Unverified
Analyzing and Characterizing User Intent in Information-seeking Conversations	Apr 23, 2018	Conversational SearchQuestion Answering	—Unverified
Accurate Supervised and Semi-Supervised Machine Reading for Long Documents	Sep 1, 2017	DecoderQuestion Answering	—Unverified
Knowledge-Augmented Language Models Interpreting Structured Chest X-Ray Findings	May 3, 2025	Question AnsweringVisual Question Answering	—Unverified
LEAF: Learning and Evaluation Augmented by Fact-Checking to Improve Factualness in Large Language Models	Oct 31, 2024	Fact CheckingMedical Question Answering	—Unverified
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems	Mar 17, 2025	Evidence SelectionLarge Language Model	—Unverified
Knowledge-Aware Language Model Pretraining	Jun 29, 2020	Knowledge ProbingLanguage Modeling	—Unverified
Knowledge-Aware Reasoning over Multimodal Semi-structured Tables	Aug 25, 2024	Multimodal ReasoningQuestion Answering	—Unverified
Corpus-Driven Thematic Hierarchy Induction	Oct 1, 2018	Machine TranslationQuestion Answering	—Unverified
Knowledge-based Conversational Search	Dec 14, 2019	Conversational SearchQuestion Answering	—Unverified
Improving Contextual Faithfulness of Large Language Models via Retrieval Heads-Induced Optimization	Jan 23, 2025	Long Form Question AnsweringQuestion Answering	—Unverified
Knowledge Based Machine Reading Comprehension	Sep 12, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
Corpus-Based Paraphrase Detection Experiments and Review	May 31, 2021	Authorship AttributionDeep Learning	—Unverified
Improving Conditioning in Context-Aware Sequence to Sequence Models	Nov 21, 2019	abstractive question answeringData Augmentation	—Unverified
Attention-based Aspect Reasoning for Knowledge Base Question Answering on Clinical Notes	Aug 1, 2021	Knowledge Base Question AnsweringMachine Reading Comprehension	—Unverified
LazyLLM: Dynamic Token Pruning for Efficient Long Context LLM Inference	Jul 19, 2024	Question Answering	—Unverified

Show:10 25 50

← PrevPage 210 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified