Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7101–7125 of 10817 papers

Title	Date	Tasks	Status
AutoRev: Automatic Peer Review System for Academic Research Papers	May 20, 2025	Question AnsweringReview Generation	—Unverified
Exploring the Robustness of Language Models for Tabular Question Answering via Attention Analysis	Jun 18, 2024	In-Context LearningQuestion Answering	—Unverified
Knowledge-Augmented Language Models Interpreting Structured Chest X-Ray Findings	May 3, 2025	Question AnsweringVisual Question Answering	—Unverified
Knowledge-Augmented Language Model Prompting for Zero-Shot Knowledge Graph Question Answering	Jun 7, 2023	Graph Question AnsweringLanguage Modeling	—Unverified
Knowledge as A Bridge: Improving Cross-domain Answer Selection with External Knowledge	Aug 1, 2018	Answer SelectionInformation Retrieval	—Unverified
Deep Cognitive Reasoning Network for Multi-hop Question Answering over Knowledge Graphs	Aug 1, 2021	Knowledge GraphsMulti-hop Question Answering	—Unverified
Knowledge AI: Fine-tuning NLP Models for Facilitating Scientific Knowledge Extraction and Understanding	Aug 4, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
On the Transferability of Minimal Prediction Preserving Inputs in Question Answering	Sep 17, 2020	Adversarial RobustnessQuestion Answering	—Unverified
Knowledge-Aided Open-Domain Question Answering	Jun 9, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
On the Value of Out-of-Distribution Testing: An Example of Goodhart's Law	May 19, 2020	Model SelectionQuestion Answering	—Unverified
Knowledge Acquisition for Visual Question Answering via Iterative Querying	Jul 1, 2017	Question AnsweringVisual Question Answering	—Unverified
OntoLearn Reloaded: A Graph-Based Algorithm for Taxonomy Induction	Jan 1, 2013	Information RetrievalQuestion Answering	—Unverified
Deep Bayesian Natural Language Processing	Jul 1, 2019	Caption GenerationClustering	—Unverified
Ontology-Aware RAG for Improved Question-Answering in Cybersecurity Education	Dec 10, 2024	Question AnsweringRAG	—Unverified
Deep Bayesian Learning and Understanding	Aug 1, 2018	Document SummarizationMachine Translation	—Unverified
Ontology-based question answering over corporate structured data	Nov 8, 2021	Natural Language UnderstandingQuestion Answering	—Unverified
Ontology-Based Retrieval \& Neural Approaches for BioASQ Ideal Answer Generation	Nov 1, 2018	Abstractive Text SummarizationAnswer Generation	—Unverified
Advancing Multimodal Medical Capabilities of Gemini	May 6, 2024	Computed Tomography (CT)image-classification	—Unverified
KnowIT VQA: Answering Knowledge-Based Questions about Videos	Oct 23, 2019	Question AnsweringVideo Question Answering	—Unverified
Deep Bayesian Active Learning for Multiple Correct Outputs	Dec 2, 2019	Active LearningAnswer Generation	—Unverified
Knowing Where to Look? Analysis on Attention of Visual Question Answering System	Oct 9, 2018	Question AnsweringVisual Question Answering	—Unverified
OODTE: A Differential Testing Engine for the ONNX Optimizer	May 3, 2025	object-detectionObject Detection	—Unverified
Generating and Evaluating Explanations of Attended and Error-Inducing Input Regions for VQA Models	Mar 26, 2021	Question AnsweringVisual Question Answering	—Unverified
Deep Attentive Sentence Ordering Network	Oct 1, 2018	Concept-To-Text GenerationDocument Summarization	—Unverified
AutoPrep: Natural Language Question-Aware Data Preparation with a Multi-Agent Framework	Dec 10, 2024	Code GenerationLarge Language Model	—Unverified

Show:10 25 50

← PrevPage 285 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified