Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6851–6875 of 10817 papers

Title	Date	Tasks	Status
Neural Compositional Denotational Semantics for Question Answering	Aug 29, 2018	Question AnsweringSemantic Parsing	—Unverified
Neural Contextual Conversation Learning with Labeled Question-Answering Pairs	Jul 20, 2016	Question Answering	—Unverified
An End-to-End Framework for Cold Question Routing in Community Question Answering Services	Nov 22, 2019	Community Question AnsweringGraph Embedding	—Unverified
AdvCodec: Towards A Unified Framework for Adversarial Text Generation	Sep 25, 2019	Adversarial TextQuestion Answering	—Unverified
Knowledge Retrieval Based on Generative AI	Jan 8, 2025	Large Language ModelMultiple-choice	—Unverified
Neural Event Extraction from Movies Description	Jun 1, 2018	Event ExtractionMachine Translation	—Unverified
Delving Deep into Extractive Question Answering Data	Nov 16, 2021	Extractive Question-AnsweringQuestion Answering	—Unverified
Neural Joint Learning for Classifying Wikipedia Articles into Fine-grained Named Entity Types	Oct 1, 2016	ArticlesEntity Linking	—Unverified
Neural Knowledge Bank for Pretrained Transformers	Jul 31, 2022	Language ModelingLanguage Modelling	—Unverified
AVSS: Layer Importance Evaluation in Large Language Models via Activation Variance-Sparsity Analysis	Nov 4, 2024	Language ModelingLanguage Modelling	—Unverified
Knowledge Representation and Extraction at Scale	Aug 1, 2018	ArticlesGeneral Knowledge	—Unverified
Knowledge Reasoning via Jointly Modeling Knowledge Graphs and Soft Rules	Jan 7, 2023	Knowledge Graph CompletionKnowledge Graph Embeddings	—Unverified
Knowledge Pyramid: A Novel Hierarchical Reasoning Structure for Generalized Knowledge Augmentation and Inference	Jan 17, 2024	Decision MakingInformation Retrieval	—Unverified
Neural Models for Key Phrase Extraction and Question Generation	Jul 1, 2018	Question AnsweringQuestion Generation	—Unverified
Delusions of Large Language Models	Mar 9, 2025	Question AnsweringRetrieval-augmented Generation	—Unverified
A VSM-based Statistical Model for the Semantic Relation Interpretation of Noun-Modifier Pairs	Sep 1, 2015	Question AnsweringRelation	—Unverified
An End-to-End Evaluation of Two Situated Dialog Systems	Jul 1, 2012	Question AnsweringVocal Bursts Valence Prediction	—Unverified
Knowledge Proxy Intervention for Deconfounded Video Question Answering	Jan 1, 2023	Question AnsweringVideo Question Answering	—Unverified
Knowledge Portability with Semantic Expansion of Ontology Labels	Jul 1, 2015	Information RetrievalMachine Translation	—Unverified
KnowledgeNavigator: Leveraging Large Language Models for Enhanced Reasoning over Knowledge Graph	Dec 26, 2023	HallucinationLanguage Modeling	—Unverified
DelucionQA: Detecting Hallucinations in Domain-specific Question Answering	Dec 8, 2023	HallucinationInformation Retrieval	—Unverified
Knowledge Models for Cancer Clinical Practice Guidelines : Construction, Management and Usage in Question Answering	Jul 23, 2024	ManagementQuestion Answering	—Unverified
Knowledge Informed Semantic Parsing for Conversational Question Answering	Aug 1, 2021	Conversational Question AnsweringDecoder	—Unverified
Neural Program Planner for Structured Predictions	Mar 23, 2019	Machine TranslationProgram Synthesis	—Unverified
Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language Models	Oct 28, 2022	Common Sense ReasoningCoreference Resolution	—Unverified

Show:10 25 50

← PrevPage 275 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified