Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5876–5900 of 10817 papers

Title	Date	Tasks	Status
Identifying Nuggets of Information in GALE Distillation Evaluation	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Identifying Constant and Unique Relations by using Time-Series Text	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Conversational Question Answering: A Survey	Jun 2, 2021	Conversational Question AnsweringQuestion Answering	—Unverified
A temporal expression recognition system for medical documents by	Dec 1, 2015	Named Entity Recognition (NER)Question Answering	—Unverified
LLMs Meet Long Video: Advancing Long Video Question Answering with An Interactive Visual Adapter in LLMs	Feb 21, 2024	Question AnsweringVideo Question Answering	—Unverified
LLMs' Reading Comprehension Is Affected by Parametric Knowledge and Struggles with Hypothetical Statements	Apr 9, 2024	Natural Language UnderstandingQuestion Answering	—Unverified
LLMs to Support a Domain Specific Knowledge Assistant	Feb 6, 2025	ChatbotMultiple-choice	—Unverified
Identifying Causal Relations Using Parallel Wikipedia Articles	Aug 1, 2016	ArticlesCausal Inference	—Unverified
Identifying and Mitigating Position Bias of Multi-image Vision-Language Models	Mar 18, 2025	PositionQuestion Answering	—Unverified
Conversational Query Reformulation with the Guidance of Retrieved Documents	Jul 17, 2024	Conversational Question AnsweringConversational Search	—Unverified
Identification of Temporal Event Relationships in Biographical Accounts	Jun 1, 2013	Question Answering	—Unverified
Identification of Alias Links among Participants in Narratives	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Conversational QA Dataset Generation with Answer Revision	Sep 23, 2022	Answer GenerationConversational Question Answering	—Unverified
LMSim : Computing Domain-specific Semantic Word Similarities Using a Language Modeling Approach	Dec 1, 2014	Information RetrievalLanguage Modeling	—Unverified
DoQA - Accessing Domain-Specific FAQs via Conversational QA	Jul 1, 2020	Conversational Question AnsweringInformation Retrieval	—Unverified
Towards Efficient Speech-Text Jointly Decoding within One Speech Language Model	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
Local Convergence of Approximate Newton Method for Two Layer Nonlinear Regression	Nov 26, 2023	Question Answeringregression	—Unverified
MCQA: Multimodal Co-attention Based Network for Question Answering	Apr 25, 2020	cross-modal alignmentQuestion Answering	—Unverified
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling	Aug 20, 2021	Data AblationOptical Character Recognition	—Unverified
ICRC-HIT: A Deep Learning based Comment Sequence Labeling System for Answer Selection Challenge	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
A Telecom-Domain Online Customer Service Assistant Based on Question Answering with Word Embedding and Intent Classification	Nov 1, 2017	General ClassificationInformation Retrieval	—Unverified
Do Sentence Transformers Learn Quasi-Geospatial Concepts from General Text?	Apr 5, 2024	Question AnsweringRecommendation Systems	—Unverified
DOSA: A Dataset of Social Artifacts from Different Indian Geographical Subcultures	Feb 23, 2024	Question AnsweringText Generation	—Unverified
Conversational Machine Comprehension: a Literature Review	Jun 1, 2020	Machine Reading ComprehensionNatural Language Understanding	—Unverified
i-Code Studio: A Configurable and Composable Framework for Integrative AI	May 23, 2023	Question AnsweringRetrieval	—Unverified

Show:10 25 50

← PrevPage 236 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified