Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5851–5875 of 10817 papers

Title	Date	Tasks	Status
MATE: Multi-view Attention for Table Transformer Efficiency	Sep 9, 2021	Inductive BiasQuestion Answering	—Unverified
Mathematical Information Retrieval: Search and Question Answering	Aug 21, 2024	Information RetrievalMath	—Unverified
LLaVA-Ultra: Large Chinese Language and Vision Assistant for Ultrasound	Oct 19, 2024	Instruction FollowingKnowledge Distillation	—Unverified
M-CNER: A Corpus for Chinese Named Entity Recognition in Multi-Domains	May 1, 2018	Chinese Named Entity Recognitionnamed-entity-recognition	—Unverified
Identifying Purpose Behind Electoral Tweets	Nov 5, 2013	Question Answering	—Unverified
Identifying Participation of Individual Verbs or VerbNet Classes in the Causative Alternation	Jan 1, 2019	Question Answering	—Unverified
Conversational Question Answering in Low Resource Scenarios: A Dataset and Case Study for Basque	May 1, 2020	Conversational Question AnsweringCross-Lingual Transfer	—Unverified
Domain-Transferable Method for Named Entity Recognition Task	Nov 24, 2020	Knowledge Graphsnamed-entity-recognition	—Unverified
LLM-based Discriminative Reasoning for Knowledge Graph Question Answering	Dec 17, 2024	Graph Question AnsweringQuestion Answering	—Unverified
LLM-based Extraction of Contradictions from Patents	Mar 21, 2024	Language ModellingLarge Language Model	—Unverified
Identifying Nuggets of Information in GALE Distillation Evaluation	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
LLM-Based Multi-Hop Question Answering with Knowledge Graph Integration in Evolving Environments	Aug 28, 2024	knowledge editingKnowledge Graphs	—Unverified
Identifying Constant and Unique Relations by using Time-Series Text	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Conversational Question Answering: A Survey	Jun 2, 2021	Conversational Question AnsweringQuestion Answering	—Unverified
LLM Distillation for Efficient Few-Shot Multiple Choice Question Answering	Dec 13, 2024	Few-Shot LearningKnowledge Distillation	—Unverified
LLM Enhancer: Merged Approach using Vector Embedding for Reducing Large Language Model Hallucinations with External Knowledge	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
A temporal expression recognition system for medical documents by	Dec 1, 2015	Named Entity Recognition (NER)Question Answering	—Unverified
Identifying Causal Relations Using Parallel Wikipedia Articles	Aug 1, 2016	ArticlesCausal Inference	—Unverified
LLM Guided Inductive Inference for Solving Compositional Problems	Sep 20, 2023	Problem DecompositionQuestion Answering	—Unverified
LLMI3D: Empowering LLM with 3D Perception from a Single 2D Image	Aug 14, 2024	Autonomous DrivingLogical Reasoning	—Unverified
Identifying and Mitigating Position Bias of Multi-image Vision-Language Models	Mar 18, 2025	PositionQuestion Answering	—Unverified
LLM-MedQA: Enhancing Medical Question Answering through Case Studies in Large Language Models	Dec 31, 2024	Medical Question AnsweringMedQA	—Unverified
Do not let the history haunt you: Mitigating Compounding Errors in Conversational Question Answering	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction	Aug 22, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Conversational Query Reformulation with the Guidance of Retrieved Documents	Jul 17, 2024	Conversational Question AnsweringConversational Search	—Unverified

Show:10 25 50

← PrevPage 235 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified