Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3001–3050 of 10817 papers

Title	Date	Tasks	Status
Answer Generation for Questions With Multiple Information Sources in E-Commerce	Nov 27, 2021	Answer GenerationQuestion Answering	—Unverified
BiQuAD: Towards QA based on deeper text understanding	Aug 1, 2021	Question AnsweringReading Comprehension	—Unverified
BioTABQA: Instruction Learning for Biomedical Table Question Answering	Jul 6, 2022	Question Answering	—Unverified
Answer-focused and Position-aware Neural Question Generation	Oct 1, 2018	Machine Reading ComprehensionPosition	—Unverified
A Generative Approach to Question Answering	Nov 16, 2017	DecoderGenerative Question Answering	—Unverified
A Corpus and Cloze Evaluation for Deeper Understanding of Commonsense Stories	Jun 1, 2016	Question AnsweringText Summarization	—Unverified
A Generate-Validate Approach to Answering Questions about Qualitative Relationships	Aug 9, 2019	FormQuestion Answering	—Unverified
AnswerFact: Fact Checking in Product Question Answering	Nov 1, 2020	Fact CheckingMisinformation	—Unverified
100 Things You Always Wanted to Know about Linguistics But Were Afraid to Ask*	Jun 1, 2012	Question AnsweringSentiment Analysis	—Unverified
Answer Extraction by Recursive Parse Tree Descent	Aug 1, 2013	Language ModellingQuestion Answering	—Unverified
Evaluating Recognizing Question Entailment Methods for a Portuguese Community Question-Answering System about Diabetes Mellitus	Sep 1, 2021	Community Question AnsweringInformation Retrieval	—Unverified
BioMol-MQA: A Multi-Modal Question Answering Dataset For LLM Reasoning Over Bio-Molecular Interactions	Jun 6, 2025	Information RetrievalQuestion Answering	—Unverified
BioMistral-NLU: Towards More Generalizable Medical Language Understanding through Instruction Tuning	Oct 24, 2024	Instruction FollowingNatural Language Understanding	—Unverified
Answer Extraction as Sequence Tagging with Tree Edit Distance	Jun 1, 2013	Dependency ParsingNamed Entity Recognition (NER)	—Unverified
BioMegatron: Larger Biomedical Domain Language Model	Oct 12, 2020	Language ModelingLanguage Modelling	—Unverified
A Copy-Augmented Generative Model for Open-Domain Question Answering	May 1, 2022	Natural QuestionsOpen-Domain Question Answering	—Unverified
Evaluating Self-Generated Documents for Enhancing Retrieval-Augmented Generation with Large Language Models	Oct 17, 2024	Language ModellingLarge Language Model	—Unverified
Evaluating Span Extraction in Generative Paradigm: A Reflection on Aspect-Based Sentiment Analysis	Apr 17, 2024	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified
Evaluating the Representational Hub of Language and Vision Models	Apr 12, 2019	DiagnosticQuestion Answering	—Unverified
Evaluation for Partial Event Coreference	Jun 1, 2014	Coreference ResolutionNatural Language Inference	—Unverified
Evaluation Paradigms in Question Answering	Nov 1, 2021	PositionQuestion Answering	—Unverified
Experimenting with Legal AI Solutions: The Case of Question-Answering for Access to Justice	Sep 12, 2024	Question AnsweringRetrieval	—Unverified
Exploring the BERT Cross-Lingual Transferability: a Case Study in Reading Comprehension	Jun 17, 2020	NERPOS	—Unverified
A Copy-Augmented Generative Model for Open-Domain Question Answering	Oct 16, 2021	Natural QuestionsOpen-Domain Question Answering	—Unverified
Answer-checking in Context: A Multi-modal FullyAttention Network for Visual Question Answering	Oct 17, 2020	Question AnsweringVisual Question Answering	—Unverified
Biomedical Question Answering via Weighted Neural Network Passage Retrieval	Jan 9, 2018	Passage RetrievalQuestion Answering	—Unverified
A Question Answering Framework for Decontextualizing User-facing Snippets from Scientific Documents	May 24, 2023	Question AnsweringQuestion Generation	—Unverified
Evaluating Machine Reading Systems through Comprehension Tests	May 1, 2012	Answer SelectionMultiple-choice	—Unverified
Biomedical Question Answering via Multi-Level Summarization on a Local Knowledge Graph	Apr 2, 2025	Language ModelingLanguage Modelling	—Unverified
Biomedical Question Answering: A Survey of Approaches and Challenges	Feb 10, 2021	Information RetrievalMachine Reading Comprehension	—Unverified
Answer Candidate Type Selection: Text-to-Text Language Model for Closed Book Question Answering Meets Knowledge Graphs	Oct 10, 2023	Graph Question AnsweringKnowledge Graphs	—Unverified
Answer, Assemble, Ace: Understanding How Transformers Answer Multiple Choice Questions	Jul 21, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
Biomedical Multi-hop Question Answering Using Knowledge Graph Embeddings and Language Models	Nov 10, 2022	Knowledge Graph EmbeddingsKnowledge Graphs	—Unverified
A General FOFE-net Framework for Simple and Effective Question Answering over Knowledge Bases	Mar 29, 2019	Question AnsweringRelation	—Unverified
1-PAGER: One Pass Answer Generation and Evidence Retrieval	Oct 25, 2023	Answer GenerationQuestion Answering	—Unverified
Biomedical Large Languages Models Seem not to be Superior to Generalist Models on Unseen Medical Data	Aug 25, 2024	Document SummarizationGeneral Knowledge	—Unverified
Answerable or Not: Devising a Dataset for Extending Machine Reading Comprehension	Aug 1, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
Evaluating LLMs Capabilities Towards Understanding Social Dynamics	Nov 20, 2024	Prompt EngineeringQuestion Answering	—Unverified
Answerability in Retrieval-Augmented Open-Domain Question Answering	Mar 3, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
Dynamic Uncertainty Ranking: Enhancing In-Context Learning for Long-Tail Knowledge in LLMs	Oct 31, 2024	In-Context LearningMemorization	—Unverified
Dynamic-TinyBERT: Boost TinyBERT's Inference Efficiency by Dynamic Sequence Length	Nov 18, 2021	Computational EfficiencyHyperparameter Optimization	—Unverified
Biomedical Entity Linking with Triple-aware Pre-Training	Aug 28, 2023	Entity LinkingQuestion Answering	—Unverified
A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching	Mar 5, 2024	ChatbotCommunity Question Answering	—Unverified
Evaluating LLMs on Document-Based QA: Exact Answer Selection and Numerical Extraction using Cogtale dataset	Nov 14, 2023	Answer SelectionInformation Retrieval	—Unverified
Answerability Fields: Answerable Location Estimation via Diffusion Models	Jul 26, 2024	Question AnsweringScene Understanding	—Unverified
Dynamic Strategy Planning for Efficient Question Answering with Large Language Models	Oct 30, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
An Overview Of Temporal Commonsense Reasoning and Acquisition	Jul 28, 2023	Common Sense ReasoningLanguage Modelling	—Unverified
Dynamic Stochastic Decoding Strategy for Open-Domain Dialogue Generation	Jun 12, 2024	Dialogue GenerationDiversity	—Unverified
DynamicVL: Benchmarking Multimodal Large Language Models for Dynamic City Understanding	May 27, 2025	BenchmarkingChange Detection	—Unverified
Biomedical Document Retrieval for Clinical Decision Support System	Jul 1, 2018	Information RetrievalLearning-To-Rank	—Unverified

Show:10 25 50

← PrevPage 61 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified