Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8051–8100 of 10817 papers

Title	Date	Tasks	Status
Recent Progress in Deep Learning for NLP	Jun 1, 2016	Deep LearningMachine Translation	—Unverified
Recent, rapid advancement in visual question answering architecture: a review	Mar 2, 2022	Question AnsweringVisual Question Answering	—Unverified
Receptivity of an AI Cognitive Assistant by the Radiology Community: A Report on Data Collected at RSNA	Sep 13, 2020	Multiple-choiceQuestion Answering	—Unverified
RECIPE: Applying Open Domain Question Answering to Privacy Policies	Jul 1, 2018	DescriptiveOpen-Domain Question Answering	—Unverified
Recipe Instruction Semantics Corpus (RISeC): Resolving Semantic Structure and Zero Anaphora in Recipes	Dec 1, 2020	Question AnsweringReading Comprehension	—Unverified
Reciprocal Attention Fusion for Visual Question Answering	May 11, 2018	ObjectQuestion Answering	—Unverified
RelTextRank: An Open Source Framework for Building Relational Syntactic-Semantic Text Pair Representations	Jul 1, 2017	Community Question AnsweringNatural Language Inference	—Unverified
RELLY: Inferring Hypernym Relationships Between Relational Phrases	Sep 1, 2015	Open Information ExtractionProbabilistic Programming	—Unverified
Comparing Word Representations for Implicit Discourse Relation Classification	Sep 1, 2015	ClassificationFeature Engineering	—Unverified
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving	Jun 9, 2025	Autonomous DrivingImitation Learning	—Unverified
RelNet: End-to-End Modeling of Entities & Relations	Jun 22, 2017	Question AnsweringRelational Reasoning	—Unverified
Recognition of Polish Temporal Expressions	Sep 1, 2015	Question Answering	—Unverified
GlossBoot: Bootstrapping Multilingual Domain Glossaries from the Web	Aug 1, 2013	Question AnsweringWord Sense Disambiguation	—Unverified
Comparing Recurrent and Convolutional Architectures for English-Hindi Neural Machine Translation	Nov 1, 2017	DecoderImage Captioning	—Unverified
Recognizing Implied Predicate-Argument Relationships in Textual Inference	Jun 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Recognizing Multimodal Entailment	Aug 1, 2021	Graph LearningQuestion Answering	—Unverified
Assessing the Robustness of Visual Question Answering Models	Nov 30, 2019	Question AnsweringVisual Question Answering	—Unverified
Recognizing Textual Entailment Using Probabilistic Inference	Sep 1, 2015	Information RetrievalNatural Language Inference	—Unverified
From Easy to Hard: Two-stage Selector and Reader for Multi-hop Question Answering	May 24, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified
Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models	Jan 10, 2023	ManagementQuestion Answering	—Unverified
ReLoop: "Seeing Twice and Thinking Backwards" via Closed-loop Training to Mitigate Hallucinations in Multimodal understanding	Jul 7, 2025	HallucinationQuestion Answering	—Unverified
GLoMo: Unsupervised Learning of Transferable Relational Graphs	Dec 1, 2018	image-classificationImage Classification	—Unverified
RECONSIDER: Improved Re-Ranking using Span-Focused Cross-Attention for Open Domain Question Answering	Jun 1, 2021	Machine Reading ComprehensionNatural Questions	—Unverified
Global Thread-Level Inference for Comment Classification in Community Question Answering	Nov 20, 2019	Community Question AnsweringGeneral Classification	—Unverified
Recovering Question Answering Errors via Query Revision	Sep 1, 2017	Question AnsweringSemantic Parsing	—Unverified
Recurrent and Contextual Models for Visual Question Answering	Mar 23, 2017	DiversityMultiple-choice	—Unverified
From 'F' to 'A' on the N.Y. Regents Science Exams: An Overview of the Aristo Project	Sep 4, 2019	Multiple-choiceQuestion Answering	—Unverified
A Case Study Towards Turkish Paraphrase Alignment	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Recurrent Neural Network Encoder with Attention for Community Question Answering	Mar 23, 2016	Community Question AnsweringInformation Retrieval	—Unverified
Recurrent One-Hop Predictions for Reasoning over Knowledge Graphs	Jun 12, 2018	Knowledge Base CompletionKnowledge Graphs	—Unverified
From Images to Textual Prompts: Zero-Shot Visual Question Answering With Frozen Large Language Models	Jan 1, 2023	Question AnsweringVisual Question Answering	—Unverified
Recursively Summarizing Books with Human Feedback	Sep 22, 2021	Abstractive Text SummarizationQuestion Answering	—Unverified
Assessing the Robustness of Retrieval-Augmented Generation Systems in K-12 Educational Question Answering with Knowledge Discrepancies	Dec 12, 2024	Question AnsweringRAG	—Unverified
Recursive Tree-Structured Self-Attention for Answer Sentence Selection	Aug 1, 2021	Community Question AnsweringQuestion Answering	—Unverified
From Image to Language: A Critical Analysis of Visual Question Answering (VQA) Approaches, Challenges, and Opportunities	Nov 1, 2023	NavigateQuestion Answering	—Unverified
Global Inference to Chinese Temporal Relation Extraction	Dec 1, 2016	Question AnsweringRelation	—Unverified
Red Dragon AI at TextGraphs 2020 Shared Task: LIT : LSTM-Interleaved Transformer for Multi-Hop Explanation Ranking	Dec 28, 2020	Question AnsweringRe-Ranking	—Unverified
Red Dragon AI at TextGraphs 2020 Shared Task : LIT : LSTM-Interleaved Transformer for Multi-Hop Explanation Ranking	Dec 1, 2020	Question AnsweringRe-Ranking	—Unverified
ReDecode Framework for Iterative Improvement in Paraphrase Generation	Nov 11, 2018	DecoderInformation Retrieval	—Unverified
Redefining Information Retrieval of Structured Database via Large Language Models	May 9, 2024	Information RetrievalQuestion Answering	—Unverified
From Known to the Unknown: Transferring Knowledge to Answer Questions about Novel Visual and Semantic Concepts	Nov 30, 2018	Novel ConceptsQuestion Answering	—Unverified
RedStone: Curating General, Code, Math, and QA Data for Large Language Models	Dec 4, 2024	Domain AdaptationMath	—Unverified
Reliable, Adaptable, and Attributable Language Models with Retrieval	Mar 5, 2024	Question AnsweringRetrieval	—Unverified
Reducing Hallucinations: Enhancing VQA for Flood Disaster Damage Assessment with Visual Contexts	Dec 21, 2023	HallucinationQuestion Answering	—Unverified
Assessing The Potential Of Mid-Sized Language Models For Clinical QA	Apr 24, 2024	MedQAQuestion Answering	—Unverified
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks	Jun 14, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Comparative Analysis of Retrieval Systems in the Real World	May 3, 2024	Information RetrievalQuestion Answering	—Unverified
Generating Question Relevant Captions to Aid Visual Question Answering	Jun 3, 2019	General KnowledgeImage Captioning	—Unverified
Redundancy Localization for the Conversationalization of Unstructured Responses	Aug 1, 2017	Passage RetrievalQuestion Answering	—Unverified
GLaM: Efficient Scaling of Language Models with Mixture-of-Experts	Dec 13, 2021	Common Sense ReasoningIn-Context Learning	—Unverified

Show:10 25 50

← PrevPage 162 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified