Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2350 of 10817 papers

Title	Date	Tasks	Status
A Simple Approach to Jointly Rank Passages and Select Relevant Sentences in the OBQA Context	Sep 22, 2021	Passage RankingQuestion Answering	—Unverified
A Simple and Effective Approach to the Story Cloze Test	Mar 15, 2018	Cloze TestFeature Engineering	—Unverified
A Brief History of Named Entity Recognition	Nov 7, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
DiscreteSLU: A Large Language Model with Self-Supervised Discrete Speech Units for Spoken Language Understanding	Jun 13, 2024	Instruction FollowingLanguage Modeling	—Unverified
Disentangling Knowledge-based and Visual Reasoning by Question Decomposition in KB-VQA	Jun 27, 2024	General KnowledgeQuestion Answering	—Unverified
CL-MoE: Enhancing Multimodal Large Language Model with Dual Momentum Mixture-of-Experts for Continual Visual Question Answering	Mar 1, 2025	Continual LearningLanguage Modeling	—Unverified
CliqueParcel: An Approach For Batching LLM Prompts That Jointly Optimizes Efficiency And Faithfulness	Feb 17, 2024	Question AnsweringReading Comprehension	—Unverified
CLIP-UP: CLIP-Based Unanswerable Problem Detection for Visual Question Answering	Jan 2, 2025	Multiple-choiceQuestion Answering	—Unverified
CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks	Jan 15, 2022	Question AnsweringVisual Commonsense Reasoning	—Unverified
A Short Survey on Taxonomy Learning from Text Corpora: Issues, Resources and Recent Advances	Sep 1, 2017	Question Answering	—Unverified
AlignVE: Visual Entailment Recognition Based on Alignment Relations	Nov 16, 2022	Question AnsweringRelation	—Unverified
CLIP-Powered TASS: Target-Aware Single-Stream Network for Audio-Visual Question Answering	May 13, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified
CLIP Models are Few-shot Learners: Empirical Studies on VQA and Visual Entailment	Mar 14, 2022	parameter-efficient fine-tuningQuestion Answering	—Unverified
A Shared Task on Multimodal Machine Translation and Crosslingual Image Description	Aug 1, 2016	Image DescriptionImage Retrieval	—Unverified
A Shallow Discourse Parsing System Based On Maximum Entropy Model	Jul 1, 2015	Discourse ParsingOpinion Mining	—Unverified
Adaptive Clustering for Coreference Resolution with Deterministic Rules and Web-Based Language Models	Jul 1, 2012	Clusteringcoreference-resolution	—Unverified
Cost-Effective Hallucination Detection for LLMs	Jul 31, 2024	Decision MakingFact Checking	—Unverified
CLINIQA: A Machine Intelligence Based Clinical Question Answering System	May 15, 2018	Answer SelectionInformation Retrieval	—Unverified
ASGen: Answer-containing Sentence Generation to Pre-Train Question Generator for Scale-up Data in Question Answering	Sep 25, 2019	Language ModelingLanguage Modelling	—Unverified
Clinical Reading Comprehension with Encoder-Decoder Models Enhanced by Direct Preference Optimization	Jul 19, 2024	DecoderExtractive Question-Answering	—Unverified
As Firm As Their Foundations: Can open-sourced foundation models be used to create adversarial examples for downstream tasks?	Mar 19, 2024	Adversarial AttackImage Captioning	—Unverified
AlignNet: Self-supervised Alignment Module	Sep 25, 2019	ObjectQuestion Answering	—Unverified
ClinicalGPT: Large Language Models Finetuned with Diverse Medical Data and Comprehensive Evaluation	Jun 16, 2023	DiagnosticLanguage Modeling	—Unverified
ClinBench-HPB: A Clinical Benchmark for Evaluating LLMs in Hepato-Pancreato-Biliary Diseases	May 30, 2025	Medical Question AnsweringMultiple-choice	—Unverified
A Sequence Modelling Approach to Question Answering in Text-Based Games	Jul 1, 2022	Question Answeringtext-based games	—Unverified
A Brain-inspired Memory Transformation based Differentiable Neural Computer for Reasoning-based Question Answering	Jan 7, 2023	Question Answering	—Unverified
Discrete Cosine Transform as Universal Sentence Encoder	Jun 2, 2021	Question AnsweringSentence	—Unverified
Disentangling Online Chats with DAG-Structured LSTMs	Jun 16, 2021	Conversation DisentanglementDisentanglement	—Unverified
Distraction-free Embeddings for Robust VQA	Aug 31, 2023	Question AnsweringVideo Question Answering	—Unverified
ClimaText: A Dataset for Climate Change Topic Detection	Dec 1, 2020	Fact CheckingQuestion Answering	—Unverified
A Semi-supervised learning approach to enhance health care Community-based Question Answering: A case study in alcoholism	Jul 4, 2016	Information RetrievalQuestion Answering	—Unverified
Alignment, Mining and Fusion: Representation Alignment with Hard Negative Mining and Selective Knowledge Fusion for Medical Visual Question Answering	Jan 1, 2025	Contrastive LearningMedical Visual Question Answering	—Unverified
Climate-Eval: A Comprehensive Benchmark for NLP Tasks Related to Climate Change	May 24, 2025	News ClassificationQuestion Answering	—Unverified
ClimateBERT-NetZero: Detecting and Assessing Net Zero and Reduction Targets	Oct 12, 2023	Question Answering	—Unverified
A Semi-Supervised BERT Approach for Arabic Named Entity Recognition	Dec 1, 2020	Information RetrievalMachine Translation	—Unverified
Discovering Implicit Discourse Relations Through Brown Cluster Pair Representation and Coreference Patterns	Apr 1, 2014	Coreference ResolutionImplicit Discourse Relation Classification	—Unverified
A Semantics-aware Transformer Model of Relation Linking for Knowledge Base Question Answering	Aug 1, 2021	Knowledge Base Question AnsweringQuestion Answering	—Unverified
A Semiparametric Gaussian Copula Regression Model for Predicting Financial Risks from Earnings Calls	Jun 1, 2014	Question Answeringregression	—Unverified
Alignment-Augmented Speculative Decoding with Alignment Sampling and Conditional Verification	May 19, 2025	Code CompletionQuestion Answering	—Unverified
CLICKER: Attention-Based Cross-Lingual Commonsense Knowledge Transfer	Feb 26, 2023	Question AnsweringTransfer Learning	—Unverified
Discovering Fine-Grained Semantics in Knowledge Graph Relations	Feb 17, 2022	Knowledge Graph CompletionKnowledge Graphs	—Unverified
Clickbait Classification and Spoiling Using Natural Language Processing	Jun 16, 2023	ArticlesClassification	—Unverified
CLEVR-POC: Reasoning-Intensive Visual Question Answering in Partially Observable Environments	Mar 5, 2024	Language ModellingLarge Language Model	—Unverified
Discovering Better Model Architectures for Medical Query Understanding	Jun 1, 2021	modelNatural Language Inference	—Unverified
A Search Task Dataset for German Textual Entailment	Mar 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Discourse Parsing with Attention-based Hierarchical Neural Networks	Nov 1, 2016	Discourse ParsingDocument Summarization	—Unverified
CLEVRER-Humans: Describing Physical and Causal Events the Human Way	Oct 5, 2023	Causal JudgmentData Augmentation	—Unverified
Align, Mask and Select: A Simple Method for Incorporating Commonsense Knowledge into Language Representation Models	Aug 19, 2019	Common Sense ReasoningNatural Language Inference	—Unverified
Discourse-sensitive Automatic Identification of Generic Expressions	Jul 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Discovering Bias in Latent Space: An Unsupervised Debiasing Approach	Jun 5, 2024	Question Answering	—Unverified

Show:10 25 50

← PrevPage 47 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified