Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2326–2350 of 10817 papers

Title	Date	Tasks	Status
A Brain-inspired Memory Transformation based Differentiable Neural Computer for Reasoning-based Question Answering	Jan 7, 2023	Question Answering	—Unverified
Discrete Cosine Transform as Universal Sentence Encoder	Jun 2, 2021	Question AnsweringSentence	—Unverified
Disentangling Online Chats with DAG-Structured LSTMs	Jun 16, 2021	Conversation DisentanglementDisentanglement	—Unverified
Distraction-free Embeddings for Robust VQA	Aug 31, 2023	Question AnsweringVideo Question Answering	—Unverified
ClimaText: A Dataset for Climate Change Topic Detection	Dec 1, 2020	Fact CheckingQuestion Answering	—Unverified
A Semi-supervised learning approach to enhance health care Community-based Question Answering: A case study in alcoholism	Jul 4, 2016	Information RetrievalQuestion Answering	—Unverified
Alignment, Mining and Fusion: Representation Alignment with Hard Negative Mining and Selective Knowledge Fusion for Medical Visual Question Answering	Jan 1, 2025	Contrastive LearningMedical Visual Question Answering	—Unverified
Climate-Eval: A Comprehensive Benchmark for NLP Tasks Related to Climate Change	May 24, 2025	News ClassificationQuestion Answering	—Unverified
ClimateBERT-NetZero: Detecting and Assessing Net Zero and Reduction Targets	Oct 12, 2023	Question Answering	—Unverified
A Semi-Supervised BERT Approach for Arabic Named Entity Recognition	Dec 1, 2020	Information RetrievalMachine Translation	—Unverified
Discovering Implicit Discourse Relations Through Brown Cluster Pair Representation and Coreference Patterns	Apr 1, 2014	Coreference ResolutionImplicit Discourse Relation Classification	—Unverified
A Semantics-aware Transformer Model of Relation Linking for Knowledge Base Question Answering	Aug 1, 2021	Knowledge Base Question AnsweringQuestion Answering	—Unverified
A Semiparametric Gaussian Copula Regression Model for Predicting Financial Risks from Earnings Calls	Jun 1, 2014	Question Answeringregression	—Unverified
Alignment-Augmented Speculative Decoding with Alignment Sampling and Conditional Verification	May 19, 2025	Code CompletionQuestion Answering	—Unverified
CLICKER: Attention-Based Cross-Lingual Commonsense Knowledge Transfer	Feb 26, 2023	Question AnsweringTransfer Learning	—Unverified
Discovering Fine-Grained Semantics in Knowledge Graph Relations	Feb 17, 2022	Knowledge Graph CompletionKnowledge Graphs	—Unverified
Clickbait Classification and Spoiling Using Natural Language Processing	Jun 16, 2023	ArticlesClassification	—Unverified
CLEVR-POC: Reasoning-Intensive Visual Question Answering in Partially Observable Environments	Mar 5, 2024	Language ModellingLarge Language Model	—Unverified
Discovering Better Model Architectures for Medical Query Understanding	Jun 1, 2021	modelNatural Language Inference	—Unverified
A Search Task Dataset for German Textual Entailment	Mar 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Discourse Parsing with Attention-based Hierarchical Neural Networks	Nov 1, 2016	Discourse ParsingDocument Summarization	—Unverified
CLEVRER-Humans: Describing Physical and Causal Events the Human Way	Oct 5, 2023	Causal JudgmentData Augmentation	—Unverified
Align, Mask and Select: A Simple Method for Incorporating Commonsense Knowledge into Language Representation Models	Aug 19, 2019	Common Sense ReasoningNatural Language Inference	—Unverified
Discourse-sensitive Automatic Identification of Generic Expressions	Jul 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Discovering Bias in Latent Space: An Unsupervised Debiasing Approach	Jun 5, 2024	Question Answering	—Unverified

Show:10 25 50

← PrevPage 94 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified