Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6976–7000 of 10817 papers

Title	Date	Tasks	Status
Knowledge Graph and Corpus Driven Segmentation and Answer Inference for Telegraphic Entity-seeking Queries	Oct 1, 2014	Information RetrievalKnowledge Graphs	—Unverified
DeepPavlov: Open-Source Library for Dialogue Systems	Jul 1, 2018	General Classificationintent-classification	—Unverified
NSURL-2019 Shared Task 8: Semantic Question Similarity in Arabic	Sep 12, 2019	Question AnsweringQuestion Similarity	—Unverified
A Vietnamese Dataset for Evaluating Machine Reading Comprehension	Dec 1, 2020	ArticlesMachine Reading Comprehension	—Unverified
Dodo: Dynamic Contextual Compression for Decoder-only LMs	Oct 3, 2023	DecoderLanguage Modeling	—Unverified
An Encoder Attribution Analysis for Dense Passage Retriever in Open-Domain Question Answering	Jan 16, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified
Advancing Surgical VQA with Scene Graph Knowledge	Dec 15, 2023	Question AnsweringVisual Question Answering	—Unverified
Knowledge Fusion and Semantic Knowledge Ranking for Open Domain Question Answering	Apr 7, 2020	Information RetrievalOpen-Domain Question Answering	—Unverified
Knowledge Extraction and Joint Inference Using Tractable Markov Logic	Jun 1, 2012	Decision MakingQuestion Answering	—Unverified
Knowledge-Enhanced Named Entity Disambiguation for Short Text	Dec 1, 2020	Entity DisambiguationInformation Retrieval	—Unverified
A Vietnamese Dataset for Evaluating Machine Reading Comprehension	Sep 30, 2020	ArticlesMachine Reading Comprehension	—Unverified
Knowledge-enhanced Iterative Instruction Generation and Reasoning for Knowledge Base Question Answering	Sep 7, 2022	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Knowledge Enhanced Hybrid Neural Network for Text Matching	Nov 15, 2016	Question AnsweringText Matching	—Unverified
Knowledge-Enhanced Attentive Learning for Answer Selection in Community Question Answering Systems	Dec 17, 2019	Answer SelectionCommunity Question Answering	—Unverified
Knowledge-enhanced Agents for Interactive Text Games	May 8, 2023	Instruction FollowingKnowledge Graphs	—Unverified
Deeply Embedded Knowledge Representation & Reasoning For Natural Language Question Answering: A Practitioner’s Perspective	Nov 1, 2020	Natural Language UnderstandingQuestion Answering	—Unverified
An Empirical Study on the Language Modal in Visual Question Answering	May 17, 2023	Question AnsweringVisual Question Answering	—Unverified
Deep Learning in Semantic Kernel Spaces	Jul 1, 2017	Deep LearningFeature Engineering	—Unverified
Knowledge-driven Natural Language Understanding of English Text and its Applications	Jan 27, 2021	Natural Language UnderstandingQuestion Answering	—Unverified
Deep Learning in Event Detection in Polish	Jul 1, 2019	Deep LearningEvent Detection	—Unverified
Knowledge Distillation of Domain-adapted LLMs for Question-Answering in Telecom	Apr 28, 2025	Domain AdaptationKnowledge Distillation	—Unverified
Knowledge Distillation for Improved Accuracy in Spoken Question Answering	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Knowledge Detection by Relevant Question and Image Attributes in Visual Question Answering	Jun 8, 2023	Question AnsweringRetrieval	—Unverified
Deep learning evaluation using deep linguistic processing	Jun 5, 2017	Deep LearningMultimodal Deep Learning	—Unverified
AviationGPT: A Large Language Model for the Aviation Domain	Nov 29, 2023	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 280 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified