Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8351–8400 of 10817 papers

Title	Date	Tasks	Status
Science Question Answering using Instructional Materials	Feb 13, 2016	Question AnsweringScience Question Answering	—Unverified
RiddleSense: Reasoning about Riddle Questions Featuring Linguistic Creativity and Commonsense Knowledge	Jan 2, 2021	counterfactualCounterfactual Reasoning	—Unverified
Generating Syntactic Paraphrases	Oct 1, 2018	Data-to-Text GenerationMachine Translation	—Unverified
Robust Question Answering Through Sub-part Alignment	Apr 30, 2020	Question Answering	—Unverified
Robust Training for Conversational Question Answering Models with Reinforced Reformulation Generation	Oct 20, 2023	Conversational Question AnsweringDeep Reinforcement Learning	—Unverified
Robust Visual Question Answering: Datasets, Methods, and Future Challenges	Jul 21, 2023	Question AnsweringVisual Question Answering	—Unverified
Robust Visual Reasoning via Language Guided Neural Module Networks	Dec 1, 2021	Question AnsweringReferring Expression	—Unverified
Rich Knowledge Sources Bring Complex Knowledge Conflicts: Recalibrating Models to Reflect Conflicting Evidence	Oct 25, 2022	Language ModelingLanguage Modelling	—Unverified
RocketQA: An Optimized Training Approach to Dense Passage Retrieval for Open-Domain Question Answering	Oct 16, 2020	Data AugmentationNatural Questions	—Unverified
Role play-based question-answering by real users for building chatbots with consistent personalities	Jul 1, 2018	ChatbotQuestion Answering	—Unverified
Romanian TimeBank: An Annotated Parallel Corpus for Temporal Information	May 1, 2012	Information RetrievalMachine Translation	—Unverified
Generating Extractive Summaries of Scientific Paradigms	Feb 4, 2014	ArticlesCommunity Detection	—Unverified
RoseRAG: Robust Retrieval-augmented Generation with Small-scale LLMs via Margin-aware Preference Optimization	Feb 16, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified
Rhetorical relations markers in Russian RST Treebank	Sep 1, 2017	Coreference ResolutionQuestion Answering	—Unverified
RGAR: Recurrence Generation-augmented Retrieval for Factual-aware Medical Question Answering	Feb 19, 2025	Decision MakingLanguage Modeling	—Unverified
ALS at IJCNLP-2017 Task 5: Answer Localization System for Multi-Choice Question Answering in Exams	Dec 1, 2017	Question Answering	—Unverified
Generating Explanations in Medical Question-Answering by Expectation Maximization Inference over Evidence	Oct 2, 2023	Explanation GenerationMedical Question Answering	—Unverified
Combining Impression Feature Representation for Multi-turn Conversational Question Answering	Oct 1, 2020	Conversational Question Answeringfeature selection	—Unverified
ReXVQA: A Large-scale Visual Question Answering Benchmark for Generalist Chest X-ray Understanding	Jun 4, 2025	NegationNegation Detection	—Unverified
``Look, some Green Circles!'': Learning to Quantify from Images	Aug 1, 2016	Question AnsweringVisual Question Answering (VQA)	—Unverified
Generating Dialogue Agents via Automated Planning	Feb 2, 2019	Question Answering	—Unverified
Rewriting Conversational Utterances with Instructed Large Language Models	Oct 10, 2024	Conversational SearchQuestion Answering	—Unverified
RS-MoE: Mixture of Experts for Remote Sensing Image Captioning and Visual Question Answering	Nov 3, 2024	DescriptiveImage Captioning	—Unverified
RS-RAG: Bridging Remote Sensing Imagery and Comprehensive Knowledge with a Multi-Modal Dataset and Retrieval-Augmented Generation Model	Apr 7, 2025	Image Captioningimage-classification	—Unverified
Combining Heterogeneous Models for Measuring Relational Similarity	Jun 1, 2013	Question Answering	—Unverified
ReWind: Understanding Long Videos with Instructed Learnable Memory	Nov 23, 2024	Large Language ModelQuestion Answering	—Unverified
Revolutionizing Retrieval-Augmented Generation with Enhanced PDF Structure Recognition	Jan 23, 2024	Question AnsweringRAG	—Unverified
RSVQA: Visual Question Answering for Remote Sensing Data	Mar 16, 2020	Land Cover ClassificationObject Counting	—Unverified
Combining dependency information and generalization in a pattern-based approach to the classification of lexical-semantic relation instances	May 1, 2014	ClassificationGeneral Classification	—Unverified
Generating clickbait spoilers with an ensemble of large language models	May 25, 2024	Passage RetrievalQuestion Answering	—Unverified
Ask Your Neurons: A Neural-based Approach to Answering Questions about Images	May 5, 2015	Question Answering	—Unverified
Generating Answering Patterns from Factoid Arabic Questions	Sep 1, 2017	Information RetrievalQuestion Answering	—Unverified
Combining Deep Neural Reranking and Unsupervised Extraction for Multi-Query Focused Summarization	Feb 2, 2023	DiversityExtractive Summarization	—Unverified
Revisiting the Superficial Alignment Hypothesis	Sep 27, 2024	Instruction FollowingMath	—Unverified
Revisiting the Primacy of English in Zero-shot Cross-lingual Transfer	Jun 30, 2021	Cross-Lingual TransferQuestion Answering	—Unverified
RubyStar: A Non-Task-Oriented Mixture Model Dialog System	Nov 8, 2017	Question AnsweringResponse Generation	—Unverified
Rule-Based Semantic Tagging. An Application Undergoing Dictionary Glosses	May 16, 2013	Information RetrievalQuestion Answering	—Unverified
Rule Extraction for Tree-to-Tree Transducers by Cost Minimization	Nov 1, 2016	Machine TranslationNatural Language Inference	—Unverified
Generating Answer Candidates for Quizzes and Answer-Aware Question Generators	Aug 29, 2021	Question AnsweringQuestion Generation	—Unverified
SberQuAD -- Russian Reading Comprehension Dataset: Description and Analysis	Dec 20, 2019	Question AnsweringReading Comprehension	—Unverified
Ruminating Reader: Reasoning with Gated Multi-Hop Attention	Apr 24, 2017	Question AnsweringReading Comprehension	—Unverified
Generative Long-form Question Answering: Relevance, Faithfulness and Succinctness	Nov 15, 2022	FormLong Form Question Answering	—Unverified
Scalable Neural Theorem Proving on Knowledge Bases and Natural Language	May 1, 2019	Automated Theorem ProvingLink Prediction	—Unverified
Revisiting the Open-Domain Question Answering Pipeline	Sep 2, 2020	Information RetrievalMachine Reading Comprehension	—Unverified
Revisiting the Evaluation of Theory of Mind through Question Answering	Nov 1, 2019	Question Answering	—Unverified
Development of an Extractive Clinical Question Answering Dataset with Multi-Answer and Multi-Focus Questions	Jan 7, 2022	Extractive Question-AnsweringQuestion Answering	—Unverified
Generate, Transform, Answer: Question Specific Tool Synthesis for Tabular Data	Mar 17, 2023	Question Answering	—Unverified
Revisiting the Evaluation for Cross Document Event Coreference	Dec 1, 2016	Document SummarizationMulti-Document Summarization	—Unverified
Generate then Select: Open-ended Visual Question Answering Guided by World Knowledge	May 30, 2023	Answer SelectionQuestion Answering	—Unverified
Combined Distributional and Logical Semantics	Jan 1, 2013	ClusteringQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 168 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified