Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3101–3125 of 10817 papers

Title	Date	Tasks	Status
Evidence Contextualization and Counterfactual Attribution for Conversational QA over Heterogeneous Data with RAG Systems	Dec 13, 2024	Answer GenerationConversational Question Answering	—Unverified
E-ViLM: Efficient Video-Language Model via Masked Video Modeling with Semantic Vector-Quantized Tokenizer	Nov 28, 2023	Language ModelingLanguage Modelling	—Unverified
Dynamic Multistep Reasoning based on Video Scene Graph for Video Question Answering	Jul 1, 2022	Question AnsweringVideo Question Answering	—Unverified
Effectiveness of Deep Networks in NLP using BiDAF as an example architecture	Aug 31, 2021	Language ModelingLanguage Modelling	—Unverified
Effective Search of Logical Forms for Weakly Supervised Knowledge-Based Question Answering	Sep 6, 2019	Question AnsweringSemantic Parsing	—Unverified
Effective shared representations with Multitask Learning for Community Question Answering	Apr 1, 2017	Community Question AnsweringDocument Ranking	—Unverified
DynamicMind: A Tri-Mode Thinking System for Large Language Models	Jun 6, 2025	Computational EfficiencyPrompt Engineering	—Unverified
Effect of Non-linear Deep Architecture in Sequence Labeling	Oct 1, 2013	ChunkingNamed Entity Recognition (NER)	—Unverified
BioMedBERT: A Pre-trained Biomedical Language Model for QA and IR	Dec 10, 2020	ArticlesInformation Retrieval	—Unverified
Effects of Prompt Length on Domain-specific Tasks for Large Language Models	Feb 20, 2025	Machine TranslationPrompt Engineering	—Unverified
An Overview of Distant Supervision for Relation Extraction with a Focus on Denoising and Pre-training Methods	Jul 17, 2022	DenoisingKnowledge Graph Completion	—Unverified
Dynamic Knowledge Integration for Enhanced Vision-Language Reasoning	Jan 15, 2025	Question AnsweringVisual Question Answering	—Unverified
Efficiency in Focus: LayerNorm as a Catalyst for Fine-tuning Medical Visual Language Pre-trained Models	Apr 25, 2024	Medical Visual Question Answeringparameter-efficient fine-tuning	—Unverified
Efficient and Expressive Knowledge Base Completion Using Subgraph Feature Extraction	Sep 1, 2015	Knowledge Base CompletionLink Prediction	—Unverified
A Novel Word Sense Disambiguation Approach Using WordNet Knowledge Graph	Jan 8, 2021	ClusteringInformation Retrieval	—Unverified
Efficient and Interpretable Neural Models for Entity Tracking	Aug 30, 2022	Coreference ResolutionLanguage Modeling	—Unverified
Dynamic Neuro-Symbolic Knowledge Graph Construction for Zero-shot Commonsense Question Answering	Nov 10, 2019	graph constructionKnowledge Graphs	—Unverified
Dynamic Knowledge-Base Alignment for Coreference Resolution	Aug 1, 2013	coreference-resolutionCoreference Resolution	—Unverified
Efficient Bilinear Attention-based Fusion for Medical Visual Question Answering	Oct 28, 2024	Computational EfficiencyDecision Making	—Unverified
Efficient Context Selection for Long-Context QA: No Tuning, No Iteration, Just Adaptive-k	Jun 10, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified
BioInstruct: Instruction Tuning of Large Language Models for Biomedical Natural Language Processing	Oct 30, 2023	Language ModellingMulti-Task Learning	—Unverified
A Fully Coreference-annotated Corpus of Scholarly Papers from the ACL Anthology	Dec 1, 2012	Coreference ResolutionQuestion Answering	—Unverified
Dynamic-KGQA: A Scalable Framework for Generating Adaptive Question Answering Datasets	Mar 6, 2025	BenchmarkingDataset Generation	—Unverified
Blocks as Probes: Dissecting Categorization Ability of Large Multimodal Models	Sep 3, 2024	Question AnsweringVisual Question Answering	—Unverified
A novel knowledge graph development for industry design: A case study on indirect coal liquefaction process	Nov 27, 2021	Question Answering	—Unverified

Show:10 25 50

← PrevPage 125 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified