Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5901–5950 of 10817 papers

Title	Date	Tasks	Status
Identifying Constant and Unique Relations by using Time-Series Text	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Locate Then Generate: Bridging Vision and Language with Bounding Box for Scene-Text VQA	Apr 4, 2023	Answer GenerationLanguage Modelling	—Unverified
Conversational Question Answering: A Survey	Jun 2, 2021	Conversational Question AnsweringQuestion Answering	—Unverified
A temporal expression recognition system for medical documents by	Dec 1, 2015	Named Entity Recognition (NER)Question Answering	—Unverified
Identifying Causal Relations Using Parallel Wikipedia Articles	Aug 1, 2016	ArticlesCausal Inference	—Unverified
Identifying and Mitigating Position Bias of Multi-image Vision-Language Models	Mar 18, 2025	PositionQuestion Answering	—Unverified
Conversational Query Reformulation with the Guidance of Retrieved Documents	Jul 17, 2024	Conversational Question AnsweringConversational Search	—Unverified
Identification of Temporal Event Relationships in Biographical Accounts	Jun 1, 2013	Question Answering	—Unverified
Identification of Alias Links among Participants in Narratives	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Double Retrieval and Ranking for Accurate Question Answering	Jan 16, 2022	Answer SelectionQuestion Answering	—Unverified
Logical Inference on Dependency-based Compositional Semantics	Jun 1, 2014	Question Answering	—Unverified
Logically Consistent Loss for Visual Question Answering	Nov 19, 2020	Multi-Task LearningQuestion Answering	—Unverified
Logical Parsing from Natural Language Based on a Neural Translation Model	May 9, 2017	Question AnsweringSemantic Parsing	—Unverified
Logical Story Representations via FrameNet + Semantic Parsing	Jan 16, 2022	Formal LogicQuestion Answering	—Unverified
Conversational QA Dataset Generation with Answer Revision	Sep 23, 2022	Answer GenerationConversational Question Answering	—Unverified
Towards Efficient Speech-Text Jointly Decoding within One Speech Language Model	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
MKRAG: Medical Knowledge Retrieval Augmented Generation for Medical Question Answering	Sep 27, 2023	In-Context LearningMedical Question Answering	—Unverified
Logic-in-Frames: Dynamic Keyframe Search via Visual Semantic-Logical Verification for Long Video Understanding	Mar 17, 2025	AttributeMME	—Unverified
ICRC-HIT: A Deep Learning based Comment Sequence Labeling System for Answer Selection Challenge	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
An Online Question Answering System based on Sub-graph Searching	Jul 29, 2021	Answer GenerationKnowledge Graphs	—Unverified
LOIS: Looking Out of Instance Semantics for Visual Question Answering	Jul 26, 2023	Question AnsweringVisual Question Answering	—Unverified
A Telecom-Domain Online Customer Service Assistant Based on Question Answering with Word Embedding and Intent Classification	Nov 1, 2017	General ClassificationInformation Retrieval	—Unverified
Conversational Machine Comprehension: a Literature Review	Jun 1, 2020	Machine Reading ComprehensionNatural Language Understanding	—Unverified
LLMs May Perform MCQA by Selecting the Least Incorrect Option	Feb 2, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
i-Code Studio: A Configurable and Composable Framework for Integrative AI	May 23, 2023	Question AnsweringRetrieval	—Unverified
ICL00 at SemEval-2016 Task 3: Translation-Based Method for CQA System	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
Do You Know What You Are Talking About? Characterizing Query-Knowledge Relevance For Reliable Retrieval Augmented Generation	Oct 10, 2024	MisinformationQuestion Answering	—Unverified
Conversational Knowledge Teaching Agent that uses a Knowledge Base	Sep 1, 2015	Grammatical Error CorrectionKnowledge Base Question Answering	—Unverified
ICE: Idiom and Collocation Extractor for Research and Education	Apr 1, 2017	POSQuestion Answering	—Unverified
Long-form Question Answering: An Iterative Planning-Retrieval-Generation Approach	Nov 15, 2023	FormLong Form Question Answering	—Unverified
Conversational Information Seeking	Jan 21, 2022	Conversational Question AnsweringConversational Recommendation	—Unverified
MedExpQA: Multilingual Benchmarking of Large Language Models for Medical Question Answering	Apr 8, 2024	BenchmarkingMedical Question Answering	—Unverified
longhorns at DADC 2022: How many linguists does it take to fool a Question Answering model? A systematic approach to adversarial attacks	Jun 29, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified
longhorns at DADC 2022: How many linguists does it take to fool a Question Answering model? A systematic approach to adversarial attacks.	Jul 1, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified
ICDAR 2019 Competition on Scene Text Visual Question Answering	Jun 30, 2019	Question AnsweringVisual Question Answering	—Unverified
Conversational Exploratory Search via Interactive Storytelling	Sep 15, 2017	Conversational SearchNavigate	—Unverified
A Taxonomy for Data Contamination in Large Language Models	Jul 11, 2024	Question Answering	—Unverified
A Talker Ensemble: the University of Wrocław's Entry to the NIPS 2017 Conversational Intelligence Challenge	May 21, 2018	ChatbotQuestion Answering	—Unverified
Conversational Answer Generation and Factuality for Reading Comprehension Question-Answering	Mar 11, 2021	Answer GenerationPassage Ranking	—Unverified
HySTER: A Hybrid Spatio-Temporal Event Reasoner	Jan 17, 2021	Inductive logic programmingQuestion Answering	—Unverified
Long-Tailed Question Answering in an Open World	May 11, 2023	Knowledge DistillationLanguage Modelling	—Unverified
Long-Term Memory Networks for Question Answering	Jul 6, 2017	Question Answering	—Unverified
Conversational AI : Open Domain Question Answering and Commonsense Reasoning	Sep 18, 2019	Common Sense ReasoningOpen-Domain Question Answering	—Unverified
Gaining Extra Supervision via Multi-task learning for Multi-Modal Video Question Answering	May 28, 2019	Inductive BiasMetric Learning	—Unverified
Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking	Dec 2, 2024	BenchmarkingDecision Making	—Unverified
Hypo3D: Exploring Hypothetical Reasoning in 3D	Feb 2, 2025	Question AnsweringVisual Question Answering	—Unverified
Conv-CoA: Improving Open-domain Question Answering in Large Language Models via Conversational Chain-of-Action	May 28, 2024	Conversational Question AnsweringHallucination	—Unverified
Hyperlink-induced Pre-training for Passage Retrieval of Open-domain Question Answering	Nov 16, 2021	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Drift to Remember	Sep 21, 2024	GPUimage-classification	—Unverified
ControversialQA: Exploring Controversy in Question Answering	Feb 10, 2023	Question Answering	—Unverified

Show:10 25 50

← PrevPage 119 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified