Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6951–7000 of 10817 papers

Title	Date	Tasks	Status
Deep Video Discovery: Agentic Search with Tool Use for Long-form Video Understanding	May 23, 2025	FormQuestion Answering	—Unverified
No Need to Pay Attention: Simple Recurrent Neural Networks Work!	Sep 1, 2017	Question Answering	—Unverified
No Need to Pay Attention: Simple Recurrent Neural Networks Work! (for Answering "Simple" Questions)	Jun 16, 2016	Question Answering	—Unverified
Non-monotonic Logical Reasoning Guiding Deep Learning for Explainable Visual Question Answering	Sep 23, 2019	Inductive LearningLogical Reasoning	—Unverified
No Noun Phrase Left Behind: Detecting and Typing Unlinkable Entities	Jul 1, 2012	Entity LinkingNamed Entity Recognition (NER)	—Unverified
A Vision Centric Remote Sensing Benchmark	Mar 20, 2025	Question AnsweringRepresentation Learning	—Unverified
Knowledge Graphs and Knowledge Networks: The Story in Brief	Mar 7, 2020	Knowledge GraphsLink Prediction	—Unverified
Knowledge Graph Reasoning Based on Attention GCN	Dec 2, 2023	Data IntegrationLink Prediction	—Unverified
Knowledge Graph Question Answering via SPARQL Silhouette Generation	Sep 6, 2021	Graph Question AnsweringKnowledge Graphs	—Unverified
DeepStory: Video Story QA by Deep Embedded Memory Networks	Jul 4, 2017	AI AgentQuestion Answering	—Unverified
AVIS: Autonomous Visual Information Seeking with Large Language Model Agent	Jun 13, 2023	Decision MakingLanguage Modeling	—Unverified
An End-to-end Approach to Learning Semantic Frames with Feedforward Neural Network	Jun 1, 2016	ClusteringDependency Parsing	—Unverified
Knowledge Graph Question Answering for Materials Science (KGQA4MAT): Developing Natural Language Interface for Metal-Organic Frameworks Knowledge Graph (MOF-KG) Using LLM	Sep 20, 2023	Graph Question AnsweringKnowledge Graphs	—Unverified
A View From the Crowd: Evaluation Challenges for Time-Offset Interaction Applications	Apr 1, 2021	Question Answering	—Unverified
Knowledge Graph Papers @ ICLR 2021	Jan 17, 2022	Complex Query AnsweringEntity Linking	—Unverified
Knowledge Graph-extended Retrieval Augmented Generation for Question Answering	Apr 11, 2025	In-Context LearningInformation Retrieval	—Unverified
Knowledge Graph Embedding with Hierarchical Relation Structure	Oct 1, 2018	Graph EmbeddingInformation Retrieval	—Unverified
A Vietnamese Text-Based Conversational Agent	Nov 26, 2019	Question Answering	—Unverified
An Encoder Attribution Analysis for Dense Passage Retriever in Open-Domain Question Answering	Jul 1, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified
Knowledge Graph - Deep Learning: A Case Study in Question Answering in Aviation Safety Domain	May 31, 2022	Natural Language QueriesPassage Retrieval	—Unverified
Knowledge Graph Curation: A Practical Framework	Aug 17, 2022	Knowledge GraphsMissing Values	—Unverified
Not to Overfit or Underfit the Source Domains? An Empirical Study of Domain Generalization in Question Answering	May 15, 2022	Domain GeneralizationKnowledge Distillation	—Unverified
DeepPurple: Lexical, String and Affective Feature Fusion for Sentence-Level Semantic Similarity Estimation	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
A Vietnamese Question Answering System	Nov 26, 2019	Question Answering	—Unverified
DeepPurple: Estimating Sentence Semantic Similarity using N-gram Regression Models and Web Snippets	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Knowledge Graph and Corpus Driven Segmentation and Answer Inference for Telegraphic Entity-seeking Queries	Oct 1, 2014	Information RetrievalKnowledge Graphs	—Unverified
DeepPavlov: Open-Source Library for Dialogue Systems	Jul 1, 2018	General Classificationintent-classification	—Unverified
NSURL-2019 Shared Task 8: Semantic Question Similarity in Arabic	Sep 12, 2019	Question AnsweringQuestion Similarity	—Unverified
A Vietnamese Dataset for Evaluating Machine Reading Comprehension	Dec 1, 2020	ArticlesMachine Reading Comprehension	—Unverified
Dodo: Dynamic Contextual Compression for Decoder-only LMs	Oct 3, 2023	DecoderLanguage Modeling	—Unverified
An Encoder Attribution Analysis for Dense Passage Retriever in Open-Domain Question Answering	Jan 16, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified
Advancing Surgical VQA with Scene Graph Knowledge	Dec 15, 2023	Question AnsweringVisual Question Answering	—Unverified
Knowledge Fusion and Semantic Knowledge Ranking for Open Domain Question Answering	Apr 7, 2020	Information RetrievalOpen-Domain Question Answering	—Unverified
Knowledge Extraction and Joint Inference Using Tractable Markov Logic	Jun 1, 2012	Decision MakingQuestion Answering	—Unverified
Knowledge-Enhanced Named Entity Disambiguation for Short Text	Dec 1, 2020	Entity DisambiguationInformation Retrieval	—Unverified
A Vietnamese Dataset for Evaluating Machine Reading Comprehension	Sep 30, 2020	ArticlesMachine Reading Comprehension	—Unverified
Knowledge-enhanced Iterative Instruction Generation and Reasoning for Knowledge Base Question Answering	Sep 7, 2022	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Knowledge Enhanced Hybrid Neural Network for Text Matching	Nov 15, 2016	Question AnsweringText Matching	—Unverified
Knowledge-Enhanced Attentive Learning for Answer Selection in Community Question Answering Systems	Dec 17, 2019	Answer SelectionCommunity Question Answering	—Unverified
Knowledge-enhanced Agents for Interactive Text Games	May 8, 2023	Instruction FollowingKnowledge Graphs	—Unverified
Deeply Embedded Knowledge Representation & Reasoning For Natural Language Question Answering: A Practitioner’s Perspective	Nov 1, 2020	Natural Language UnderstandingQuestion Answering	—Unverified
An Empirical Study on the Language Modal in Visual Question Answering	May 17, 2023	Question AnsweringVisual Question Answering	—Unverified
Deep Learning in Semantic Kernel Spaces	Jul 1, 2017	Deep LearningFeature Engineering	—Unverified
Knowledge-driven Natural Language Understanding of English Text and its Applications	Jan 27, 2021	Natural Language UnderstandingQuestion Answering	—Unverified
Deep Learning in Event Detection in Polish	Jul 1, 2019	Deep LearningEvent Detection	—Unverified
Knowledge Distillation of Domain-adapted LLMs for Question-Answering in Telecom	Apr 28, 2025	Domain AdaptationKnowledge Distillation	—Unverified
Knowledge Distillation for Improved Accuracy in Spoken Question Answering	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Knowledge Detection by Relevant Question and Image Attributes in Visual Question Answering	Jun 8, 2023	Question AnsweringRetrieval	—Unverified
Deep learning evaluation using deep linguistic processing	Jun 5, 2017	Deep LearningMultimodal Deep Learning	—Unverified
AviationGPT: A Large Language Model for the Aviation Domain	Nov 29, 2023	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 140 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified