Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5851–5900 of 10817 papers

Title	Date	Tasks	Status
Identifying the Provision of Choices in Privacy Policy Text	Sep 1, 2017	Question Answering	—Unverified
Identifying Supporting Facts for Multi-hop Question Answering with Document Graph Networks	Oct 1, 2019	Multi-hop Question AnsweringQuestion Answering	—Unverified
LLaVA-Ultra: Large Chinese Language and Vision Assistant for Ultrasound	Oct 19, 2024	Instruction FollowingKnowledge Distillation	—Unverified
Identifying Shopping Intent in Product QA for Proactive Recommendations	Apr 9, 2024	FrictionMixture-of-Experts	—Unverified
Conversational Question Answering on Heterogeneous Sources	Apr 25, 2022	Conversational Question AnsweringDecoder	—Unverified
LLM aided semi-supervision for Extractive Dialog Summarization	Nov 19, 2023	Extractive SummarizationQuestion Answering	—Unverified
LLM as A Robotic Brain: Unifying Egocentric Memory and Control	Apr 19, 2023	Embodied Question AnsweringLanguage Modeling	—Unverified
Domain-Transferable Method for Named Entity Recognition Task	Nov 24, 2020	Knowledge Graphsnamed-entity-recognition	—Unverified
LLM-based Discriminative Reasoning for Knowledge Graph Question Answering	Dec 17, 2024	Graph Question AnsweringQuestion Answering	—Unverified
LLM-based Extraction of Contradictions from Patents	Mar 21, 2024	Language ModellingLarge Language Model	—Unverified
A Theoretically Grounded Benchmark for Evaluating Machine Commonsense	Mar 23, 2022	Generative Question AnsweringMultiple-choice	—Unverified
LLM-Based Multi-Hop Question Answering with Knowledge Graph Integration in Evolving Environments	Aug 28, 2024	knowledge editingKnowledge Graphs	—Unverified
A Deep Cascade Model for Multi-Document Reading Comprehension	Nov 28, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
Measuring Machine Intelligence Through Visual Question Answering	Aug 31, 2016	Image CaptioningQuestion Answering	—Unverified
LLM Distillation for Efficient Few-Shot Multiple Choice Question Answering	Dec 13, 2024	Few-Shot LearningKnowledge Distillation	—Unverified
LLM Enhancer: Merged Approach using Vector Embedding for Reducing Large Language Model Hallucinations with External Knowledge	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
LLM Evaluation Based on Aerospace Manufacturing Expertise: Automated Generation and Multi-Model Question Answering	Jan 25, 2025	Information RetrievalMultiple-choice	—Unverified
Identifying Purpose Behind Electoral Tweets	Nov 5, 2013	Question Answering	—Unverified
LLM Guided Inductive Inference for Solving Compositional Problems	Sep 20, 2023	Problem DecompositionQuestion Answering	—Unverified
LLMI3D: Empowering LLM with 3D Perception from a Single 2D Image	Aug 14, 2024	Autonomous DrivingLogical Reasoning	—Unverified
Identifying Participation of Individual Verbs or VerbNet Classes in the Causative Alternation	Jan 1, 2019	Question Answering	—Unverified
LLM-MedQA: Enhancing Medical Question Answering through Case Studies in Large Language Models	Dec 31, 2024	Medical Question AnsweringMedQA	—Unverified
Do not let the history haunt you: Mitigating Compounding Errors in Conversational Question Answering	May 1, 2020	Conversational Question AnsweringQuestion Answering	—Unverified
LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction	Aug 22, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Conversational Question Answering in Low Resource Scenarios: A Dataset and Case Study for Basque	May 1, 2020	Conversational Question AnsweringCross-Lingual Transfer	—Unverified
Identifying Nuggets of Information in GALE Distillation Evaluation	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Identifying Constant and Unique Relations by using Time-Series Text	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Conversational Question Answering: A Survey	Jun 2, 2021	Conversational Question AnsweringQuestion Answering	—Unverified
A temporal expression recognition system for medical documents by	Dec 1, 2015	Named Entity Recognition (NER)Question Answering	—Unverified
LLMs Meet Long Video: Advancing Long Video Question Answering with An Interactive Visual Adapter in LLMs	Feb 21, 2024	Question AnsweringVideo Question Answering	—Unverified
LLMs' Reading Comprehension Is Affected by Parametric Knowledge and Struggles with Hypothetical Statements	Apr 9, 2024	Natural Language UnderstandingQuestion Answering	—Unverified
LLMs to Support a Domain Specific Knowledge Assistant	Feb 6, 2025	ChatbotMultiple-choice	—Unverified
Identifying Causal Relations Using Parallel Wikipedia Articles	Aug 1, 2016	ArticlesCausal Inference	—Unverified
Identifying and Mitigating Position Bias of Multi-image Vision-Language Models	Mar 18, 2025	PositionQuestion Answering	—Unverified
Conversational Query Reformulation with the Guidance of Retrieved Documents	Jul 17, 2024	Conversational Question AnsweringConversational Search	—Unverified
Identification of Temporal Event Relationships in Biographical Accounts	Jun 1, 2013	Question Answering	—Unverified
Identification of Alias Links among Participants in Narratives	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Conversational QA Dataset Generation with Answer Revision	Sep 23, 2022	Answer GenerationConversational Question Answering	—Unverified
LMSim : Computing Domain-specific Semantic Word Similarities Using a Language Modeling Approach	Dec 1, 2014	Information RetrievalLanguage Modeling	—Unverified
DoQA - Accessing Domain-Specific FAQs via Conversational QA	Jul 1, 2020	Conversational Question AnsweringInformation Retrieval	—Unverified
Towards Efficient Speech-Text Jointly Decoding within One Speech Language Model	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
Local Convergence of Approximate Newton Method for Two Layer Nonlinear Regression	Nov 26, 2023	Question Answeringregression	—Unverified
MCQA: Multimodal Co-attention Based Network for Question Answering	Apr 25, 2020	cross-modal alignmentQuestion Answering	—Unverified
Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling	Aug 20, 2021	Data AblationOptical Character Recognition	—Unverified
ICRC-HIT: A Deep Learning based Comment Sequence Labeling System for Answer Selection Challenge	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
A Telecom-Domain Online Customer Service Assistant Based on Question Answering with Word Embedding and Intent Classification	Nov 1, 2017	General ClassificationInformation Retrieval	—Unverified
Do Sentence Transformers Learn Quasi-Geospatial Concepts from General Text?	Apr 5, 2024	Question AnsweringRecommendation Systems	—Unverified
DOSA: A Dataset of Social Artifacts from Different Indian Geographical Subcultures	Feb 23, 2024	Question AnsweringText Generation	—Unverified
Conversational Machine Comprehension: a Literature Review	Jun 1, 2020	Machine Reading ComprehensionNatural Language Understanding	—Unverified
i-Code Studio: A Configurable and Composable Framework for Integrative AI	May 23, 2023	Question AnsweringRetrieval	—Unverified

Show:10 25 50

← PrevPage 118 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified