Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7051–7075 of 10817 papers

Title	Date	Tasks	Status
One vs. Many QA Matching with both Word-level and Sentence-level Attention Network	Aug 1, 2018	Question AnsweringReading Comprehension	—Unverified
On Generality and Knowledge Transferability in Cross-Domain Duplicate Question Detection for Heterogeneous Community Question Answering	Nov 15, 2018	Community Question AnsweringDomain Adaptation	—Unverified
On Generating Characteristic-rich Question Sets for QA Evaluation	Nov 1, 2016	Question Answering	—Unverified
On Incorporating Semantic Prior Knowlegde in Deep Learning Through Embedding-Space Constraints	Sep 25, 2019	Data AugmentationQuestion Answering	—Unverified
On Incorporating Semantic Prior Knowledge in Deep Learning Through Embedding-Space Constraints	Sep 30, 2019	Data AugmentationQuestion Answering	—Unverified
On Knowledge distillation from complex networks for response prediction	Jun 1, 2019	Knowledge DistillationQuestion Answering	—Unverified
Online Continual Knowledge Learning for Language Models	Nov 16, 2023	Continual LearningFact Checking	—Unverified
An Empirical Study on Leveraging Scene Graphs for Visual Question Answering	Jul 28, 2019	Knowledge GraphsQuestion Answering	—Unverified
On Making Reading Comprehension More Comprehensive	Nov 1, 2019	Machine Reading ComprehensionQuestion Answering	—Unverified
On Measuring Social Biases in Prompt-Based Learning	Jan 16, 2022	FormLanguage Modelling	—Unverified
Advancing Question Answering on Handwritten Documents: A State-of-the-Art Recognition-Based Model for HW-SQuAD	Jun 25, 2024	Question AnsweringRetrieval	—Unverified
On Mechanistic Circuits for Extractive Question-Answering	Feb 12, 2025	Extractive Question-AnsweringLanguage Modeling	—Unverified
2nd Place Solution to the GQA Challenge 2019	Jul 16, 2019	Question AnsweringVisual Question Answering	—Unverified
Knowledge Based Machine Reading Comprehension	Sep 12, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
Knowledge-Based Counterfactual Queries for Visual Question Answering	Mar 5, 2023	counterfactualDecision Making	—Unverified
Knowledge-based Conversational Search	Dec 14, 2019	Conversational SearchQuestion Answering	—Unverified
Knowledge Base Completion using Web-Based Question Answering and Multimodal Fusion	Nov 14, 2022	Knowledge Base CompletionQuestion Answering	—Unverified
deepCybErNet at EmoInt-2017: Deep Emotion Intensities in Tweets	Sep 1, 2017	Emotion ClassificationNatural Language Inference	—Unverified
Knowledge-Aware Reasoning over Multimodal Semi-structured Tables	Aug 25, 2024	Multimodal ReasoningQuestion Answering	—Unverified
On Significance of Subword tokenization for Low Resource and Efficient Named Entity Recognition: A case study in Marathi	Dec 3, 2023	Computational EfficiencyMachine Translation	—Unverified
Knowledge-Aware Language Model Pretraining	Jun 29, 2020	Knowledge ProbingLanguage Modeling	—Unverified
Deep Contextualized Pairwise Semantic Similarity for Arabic Language Questions	Sep 19, 2019	Community Question AnsweringQuestion Answering	—Unverified
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems	Mar 17, 2025	Evidence SelectionLarge Language Model	—Unverified
Knowledge-Aware Diverse Reranking for Cross-Source Question Answering	Jun 25, 2025	Question AnsweringRAG	—Unverified
Deep Contextualized Biomedical Abbreviation Expansion	Jun 8, 2019	Information RetrievalQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 283 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified