Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10226–10250 of 10817 papers

Title	Date	Tasks	Status
Structured Learning for Taxonomy Induction with Belief Propagation	Jun 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Structured List-Grounded Question Answering	Oct 4, 2024	Question Answering	—Unverified
Structured Memory Mechanisms for Stable Context Representation in Large Language Models	May 28, 2025	Question AnsweringText Generation	—Unverified
Structured Outputs Enable General-Purpose LLMs to be Medical Experts	Mar 5, 2025	Clinical KnowledgeMedical Question Answering	—Unverified
Structured Two-stream Attention Network for Video Question Answering	Jun 2, 2022	Question AnsweringVideo Question Answering	—Unverified
Structure Guided Multi-modal Pre-trained Transformer for Knowledge Graph Reasoning	Jul 6, 2023	Knowledge GraphsQuestion Answering	—Unverified
Structure Learning for Neural Module Networks	May 27, 2019	Question AnsweringVisual Question Answering	—Unverified
Structuring an unordered text document	Jan 29, 2019	Document SummarizationQuestion Answering	—Unverified
STRUDEL: Structured Dialogue Summarization for Dialogue Comprehension	Dec 24, 2022	Abstractive Dialogue SummarizationGraph Neural Network	—Unverified
StruEdit: Structured Outputs Enable the Fast and Accurate Knowledge Editing for Large Language Models	Sep 16, 2024	knowledge editingQuestion Answering	—Unverified
Studio Ousia's Quiz Bowl Question Answering System	Mar 23, 2018	BIG-bench Machine LearningInformation Retrieval	—Unverified
Studying Strategically: Learning to Mask for Closed-book QA	Dec 31, 2020	Language ModelingLanguage Modelling	—Unverified
Studying the Role of Input-Neighbor Overlap in Retrieval-Augmented Language Models Training Efficiency	May 20, 2025	Language ModelingLanguage Modelling	—Unverified
Study of Similarity Measures as Features in Classification for Answer Sentence Selection Task in Hindi Question Answering: Language-Specific v/s Other Measures	Nov 1, 2021	Question AnsweringSentence	—Unverified
SubGen: Token Generation in Sublinear Time and Memory	Feb 8, 2024	ClusteringOnline Clustering	—Unverified
Subgraph Retrieval Enhanced by Graph-Text Alignment for Commonsense Question Answering	Nov 11, 2024	Contrastive LearningQuestion Answering	—Unverified
Submodular Minimax Optimization: Finding Effective Sets	May 26, 2023	dialog state trackingPrompt Engineering	—Unverified
Subspace Approximation for Approximate Nearest Neighbor Search in NLP	Aug 25, 2017	Machine TranslationQuestion Answering	—Unverified
Subtopic Annotation in a Corpus of News Texts: Steps Towards Automatic Subtopic Segmentation	Jan 1, 2013	Information RetrievalQuestion Answering	—Unverified
Successive Prompting for Decomposing Complex Questions	Dec 8, 2022	Question Answering	—Unverified
SUGAR: Leveraging Contextual Confidence for Smarter Retrieval	Jan 9, 2025	Question AnsweringRAG	—Unverified
SUKHSANDESH: An Avatar Therapeutic Question Answering Platform for Sexual Education in Rural India	May 3, 2024	Information RetrievalQuestion Answering	—Unverified
Summarizing Community-based Question-Answer Pairs	Nov 17, 2022	Abstractive Text SummarizationQuestion Answering	—Unverified
Summarizing Lengthy Questions	Nov 1, 2017	Abstractive Text SummarizationCommunity Question Answering	—Unverified
SUNAR: Semantic Uncertainty based Neighborhood Aware Retrieval for Complex QA	Mar 23, 2025	Question AnsweringRetrieval	—Unverified

Show:10 25 50

← PrevPage 410 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified