Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10201–10250 of 10817 papers

Title	Date	Tasks	Status
STOC-TOT: Stochastic Tree-of-Thought with Constrained Decoding for Complex Reasoning in Multi-Hop Question Answering	Jul 4, 2024	HallucinationMulti-hop Question Answering	—Unverified
Story Comprehension for Predicting What Happens Next	Sep 1, 2017	Common Sense ReasoningNatural Language Understanding	—Unverified
Story Generation from Visual Inputs: Techniques, Related Tasks, and Challenges	Jun 4, 2024	Question AnsweringStory Generation	—Unverified
StoryQA: Story Grounded Question Answering Dataset	Jan 16, 2022	Question Answering	—Unverified
Straight to the Facts: Learning Knowledge Base Retrieval for Factual Visual Question Answering	Sep 4, 2018	Factual Visual Question AnsweringGeneral Knowledge	—Unverified
Streaming Long Video Understanding with Large Language Models	May 25, 2024	Question AnsweringVideo Understanding	—Unverified
Streamlining Biomedical Research with Specialized LLMs	Apr 15, 2025	Decision MakingDialogue Generation	—Unverified
STREET: A Multi-Task Structured Reasoning and Explanation Benchmark	Feb 13, 2023	Question Answering	—Unverified
StressTest: Can YOUR Speech LM Handle the Stress?	May 28, 2025	Question AnsweringSentence	—Unverified
Stress Test Evaluation of Transformer-based Models in Natural Language Understanding Tasks	Feb 14, 2020	Natural Language InferenceNatural Language Understanding	—Unverified
Strong and Efficient Baselines for Open Domain Conversational Question Answering	Oct 23, 2023	Conversational Question AnsweringDecoder	—Unverified
Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Networks	Dec 5, 2017	Entity LinkingKnowledge Graphs	—Unverified
StructBERT: Incorporating Language Structures into Pre-training for Deep Language Understanding	Aug 13, 2019	Language ModelingLanguage Modelling	—Unverified
Structural analysis of an all-purpose question answering model	Apr 13, 2021	AllQuestion Answering	—Unverified
Structural Embedding of Syntactic Trees for Machine Comprehension	Mar 2, 2017	Question AnsweringReading Comprehension	—Unverified
Structural Encoding and Pre-training Matter: Adapting BERT for Table-Based Fact Verification	Apr 1, 2021	Fact VerificationGraph Neural Network	—Unverified
StructuralLM: Structural Pre-training for Form Understanding	May 24, 2021	document-image-classificationDocument Image Classification	—Unverified
Structural Representations for Learning Relations between Pairs of Texts	Jul 1, 2015	Feature EngineeringNatural Language Inference	—Unverified
Structure Causal Models and LLMs Integration in Medical Visual Question Answering	May 5, 2025	Causal InferenceMedical Visual Question Answering	—Unverified
Structured Alignment Networks for Matching Sentences	Oct 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
Structured and Logical Representations of Assamese Text for Question-Answering System	Dec 1, 2012	Question Answering	—Unverified
Structured Attention Networks	Feb 3, 2017	Machine TranslationNatural Language Inference	—Unverified
Structured Context and High-Coverage Grammar for Conversational Question Answering over Knowledge Graphs	Sep 1, 2021	Conversational Question AnsweringKnowledge Graphs	—Unverified
Structured Event Retrieval over Microblog Archives	Jun 1, 2012	Question AnsweringRetrieval	—Unverified
Structured Learning for Taxonomy Induction with Belief Propagation	Jun 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Structured List-Grounded Question Answering	Oct 4, 2024	Question Answering	—Unverified
Structured Memory Mechanisms for Stable Context Representation in Large Language Models	May 28, 2025	Question AnsweringText Generation	—Unverified
Structured Outputs Enable General-Purpose LLMs to be Medical Experts	Mar 5, 2025	Clinical KnowledgeMedical Question Answering	—Unverified
Structured Two-stream Attention Network for Video Question Answering	Jun 2, 2022	Question AnsweringVideo Question Answering	—Unverified
Structure Guided Multi-modal Pre-trained Transformer for Knowledge Graph Reasoning	Jul 6, 2023	Knowledge GraphsQuestion Answering	—Unverified
Structure Learning for Neural Module Networks	May 27, 2019	Question AnsweringVisual Question Answering	—Unverified
Structuring an unordered text document	Jan 29, 2019	Document SummarizationQuestion Answering	—Unverified
STRUDEL: Structured Dialogue Summarization for Dialogue Comprehension	Dec 24, 2022	Abstractive Dialogue SummarizationGraph Neural Network	—Unverified
StruEdit: Structured Outputs Enable the Fast and Accurate Knowledge Editing for Large Language Models	Sep 16, 2024	knowledge editingQuestion Answering	—Unverified
Studio Ousia's Quiz Bowl Question Answering System	Mar 23, 2018	BIG-bench Machine LearningInformation Retrieval	—Unverified
Studying Strategically: Learning to Mask for Closed-book QA	Dec 31, 2020	Language ModelingLanguage Modelling	—Unverified
Studying the Role of Input-Neighbor Overlap in Retrieval-Augmented Language Models Training Efficiency	May 20, 2025	Language ModelingLanguage Modelling	—Unverified
Study of Similarity Measures as Features in Classification for Answer Sentence Selection Task in Hindi Question Answering: Language-Specific v/s Other Measures	Nov 1, 2021	Question AnsweringSentence	—Unverified
SubGen: Token Generation in Sublinear Time and Memory	Feb 8, 2024	ClusteringOnline Clustering	—Unverified
Subgraph Retrieval Enhanced by Graph-Text Alignment for Commonsense Question Answering	Nov 11, 2024	Contrastive LearningQuestion Answering	—Unverified
Submodular Minimax Optimization: Finding Effective Sets	May 26, 2023	dialog state trackingPrompt Engineering	—Unverified
Subspace Approximation for Approximate Nearest Neighbor Search in NLP	Aug 25, 2017	Machine TranslationQuestion Answering	—Unverified
Subtopic Annotation in a Corpus of News Texts: Steps Towards Automatic Subtopic Segmentation	Jan 1, 2013	Information RetrievalQuestion Answering	—Unverified
Successive Prompting for Decomposing Complex Questions	Dec 8, 2022	Question Answering	—Unverified
SUGAR: Leveraging Contextual Confidence for Smarter Retrieval	Jan 9, 2025	Question AnsweringRAG	—Unverified
SUKHSANDESH: An Avatar Therapeutic Question Answering Platform for Sexual Education in Rural India	May 3, 2024	Information RetrievalQuestion Answering	—Unverified
Summarizing Community-based Question-Answer Pairs	Nov 17, 2022	Abstractive Text SummarizationQuestion Answering	—Unverified
Summarizing Lengthy Questions	Nov 1, 2017	Abstractive Text SummarizationCommunity Question Answering	—Unverified
SUNAR: Semantic Uncertainty based Neighborhood Aware Retrieval for Complex QA	Mar 23, 2025	Question AnsweringRetrieval	—Unverified
Sunny and Dark Outside?! Improving Answer Consistency in VQA through Entailed Question Generation	Sep 10, 2019	Common Sense ReasoningData Augmentation	—Unverified

Show:10 25 50

← PrevPage 205 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified