Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10301–10325 of 10817 papers

Title	Date	Tasks	Status
Synergizing LLMs and Knowledge Graphs: A Novel Approach to Software Repository-Related Question Answering	Dec 5, 2024	Knowledge GraphsQuestion Answering	—Unverified
Syntactically Aware Neural Architectures for Definition Extraction	Jun 1, 2018	BenchmarkingBinary Classification	—Unverified
Syntactic Dependencies and Distributed Word Representations for Analogy Detection and Mining	Sep 1, 2015	Information RetrievalMachine Translation	—Unverified
Syntactic Parsing of Web Queries with Question Intent	Jun 1, 2016	Community Question AnsweringDomain Adaptation	—Unverified
Syntactic Semantic Correspondence in Dependency Grammar	Jan 1, 2017	Question AnsweringSemantic correspondence	—Unverified
Syntax-based Deep Matching of Short Texts	Mar 9, 2015	Machine TranslationQuestion Answering	—Unverified
Syntax-informed Question Answering with Heterogeneous Graph Transformer	Apr 1, 2022	Language ModelingLanguage Modelling	—Unverified
Syntax Tree Constrained Graph Network for Visual Question Answering	Sep 17, 2023	Question AnsweringVisual Question Answering	—Unverified
Synthesize Step-by-Step: Tools, Templates and LLMs as Data Generators for Reasoning-Based Chart VQA	Mar 25, 2024	Chart Question AnsweringData Augmentation	—Unverified
Synthesize Step-by-Step: Tools Templates and LLMs as Data Generators for Reasoning-Based Chart VQA	Jan 1, 2024	Chart Question AnsweringData Augmentation	—Unverified
Synthesizing Conversations from Unlabeled Documents using Automatic Response Segmentation	Jun 6, 2024	Conversational Question AnsweringQuestion Answering	—Unverified
Synthetic Clarification and Correction Dialogues about Data-Centric Tasks -- A Teacher-Student Approach	Mar 18, 2025	Question AnsweringTable-based Question Answering	—Unverified
Synthetic Data Augmentation for Zero-Shot Cross-Lingual Question Answering	Oct 23, 2020	Cross-Lingual Question AnsweringData Augmentation	—Unverified
Synthetic Data Generation for Multilingual Domain-Adaptable Question Answering Systems	Jun 1, 2022	Question AnsweringSynthetic Data Generation	—Unverified
Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use	Apr 7, 2025	GSM8KMath	—Unverified
Synthetic Data Generation Using Large Language Models: Advances in Text and Code	Mar 18, 2025	Code TranslationPrompt Engineering	—Unverified
Synthetic Function Demonstrations Improve Generation in Low-Resource Programming Languages	Mar 24, 2025	Question AnsweringRAG	—Unverified
Synthetic Multimodal Question Generation	Jul 2, 2024	Language ModelingLanguage Modelling	—Unverified
Synthetic Question Value Estimation for Domain Adaptation of Question Answering	Nov 16, 2021	Domain AdaptationQuestion Answering	—Unverified
Synthetic Target Domain Supervision for Open Retrieval QA	Apr 20, 2022	Passage RetrievalQuestion Answering	—Unverified
Systematic Assessment of Factual Knowledge in Large Language Models	Oct 18, 2023	Knowledge GraphsQuestion Answering	—Unverified
Systematic Error Analysis of the Stanford Question Answering Dataset	Jul 1, 2018	Common Sense ReasoningMachine Reading Comprehension	—Unverified
Systems' Agreements and Disagreements in Temporal Processing: An Extensive Error Analysis of the TempEval-3 Task	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified
T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts	Dec 5, 2024	BenchmarkingImage Generation	—Unverified
T3: A Novel Zero-shot Transfer Learning Framework Iteratively Training on an Assistant Task for a Target Task	Sep 26, 2024	Question AnsweringSemantic Similarity	—Unverified

Show:10 25 50

← PrevPage 413 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified