Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8301–8350 of 10817 papers

Title	Date	Tasks	Status
Generating Fact Checking Briefs	Nov 10, 2020	Fact CheckingQuestion Answering	—Unverified
Combining Intra- and Multi-sentential Rhetorical Parsing for Document-level Discourse Analysis	Aug 1, 2013	Question AnsweringSentence Compression	—Unverified
SAIL: Search-Augmented Instruction Learning	May 24, 2023	DenoisingFact Checking	—Unverified
SALMONN-omni: A Codec-free LLM for Full-duplex Speech Understanding and Generation	Nov 27, 2024	Question AnsweringSpeech Enhancement	—Unverified
Sanity Check: A Strong Alignment and Information Retrieval Baseline for Question Answering	Jul 5, 2018	ARCInformation Retrieval	—Unverified
Rich Knowledge Sources Bring Complex Knowledge Conflicts: Recalibrating Models to Reflect Conflicting Evidence	Oct 25, 2022	Language ModelingLanguage Modelling	—Unverified
Generating Extractive Summaries of Scientific Paradigms	Feb 4, 2014	ArticlesCommunity Detection	—Unverified
Rhetorical relations markers in Russian RST Treebank	Sep 1, 2017	Coreference ResolutionQuestion Answering	—Unverified
RGAR: Recurrence Generation-augmented Retrieval for Factual-aware Medical Question Answering	Feb 19, 2025	Decision MakingLanguage Modeling	—Unverified
Generating Explanations in Medical Question-Answering by Expectation Maximization Inference over Evidence	Oct 2, 2023	Explanation GenerationMedical Question Answering	—Unverified
Combining Impression Feature Representation for Multi-turn Conversational Question Answering	Oct 1, 2020	Conversational Question Answeringfeature selection	—Unverified
ReXVQA: A Large-scale Visual Question Answering Benchmark for Generalist Chest X-ray Understanding	Jun 4, 2025	NegationNegation Detection	—Unverified
``Look, some Green Circles!'': Learning to Quantify from Images	Aug 1, 2016	Question AnsweringVisual Question Answering (VQA)	—Unverified
Generating Dialogue Agents via Automated Planning	Feb 2, 2019	Question Answering	—Unverified
Rewriting Conversational Utterances with Instructed Large Language Models	Oct 10, 2024	Conversational SearchQuestion Answering	—Unverified
Combining Heterogeneous Models for Measuring Relational Similarity	Jun 1, 2013	Question Answering	—Unverified
S2LPP: Small-to-Large Prompt Prediction across LLMs	May 26, 2025	Natural Language InferencePrediction	—Unverified
RiddleSense: Reasoning about Riddle Questions Featuring Linguistic Creativity and Commonsense Knowledge	Jan 2, 2021	counterfactualCounterfactual Reasoning	—Unverified
ReWind: Understanding Long Videos with Instructed Learnable Memory	Nov 23, 2024	Large Language ModelQuestion Answering	—Unverified
Revolutionizing Retrieval-Augmented Generation with Enhanced PDF Structure Recognition	Jan 23, 2024	Question AnsweringRAG	—Unverified
Right-truncatable Neural Word Embeddings	Jun 1, 2016	Dependency ParsingMachine Translation	—Unverified
RikiNet: Reading Wikipedia Pages for Natural Question Answering	Apr 30, 2020	Natural Language UnderstandingNatural Questions	—Unverified
Ripple Down Rules for Question Answering	Dec 12, 2014	Question Answering	—Unverified
Generating High Quality Proposition Banks for Multilingual Semantic Role Labeling	Jul 1, 2015	Question AnsweringSemantic Role Labeling	—Unverified
RiskLabs: Predicting Financial Risk Using Large Language Model based on Multimodal and Multi-Sources Data	Apr 11, 2024	Binary ClassificationLanguage Modeling	—Unverified
Risks and NLP Design: A Case Study on Procedural Document QA	Aug 16, 2024	Language ModelingLanguage Modelling	—Unverified
RJUA-MedDQA: A Multimodal Benchmark for Medical Document Question Answering and Clinical Reasoning	Feb 19, 2024	document understandingMedical Diagnosis	—Unverified
Combining dependency information and generalization in a pattern-based approach to the classification of lexical-semantic relation instances	May 1, 2014	ClassificationGeneral Classification	—Unverified
RLAS-BIABC: A Reinforcement Learning-Based Answer Selection Using the BERT Model Boosted by an Improved ABC Algorithm	Jan 7, 2023	Answer SelectionDecision Making	—Unverified
RL-CSDia: Representation Learning of Computer Science Diagrams	Mar 10, 2021	Question AnsweringRepresentation Learning	—Unverified
R-LLaVA: Improving Med-VQA Understanding through Visual Region of Interest	Oct 27, 2024	Medical Visual Question AnsweringMultiple-choice	—Unverified
RMLVQA: A Margin Loss Approach for Visual Question Answering With Language Biases	Jan 1, 2023	Question AnsweringVisual Question Answering	—Unverified
Generating clickbait spoilers with an ensemble of large language models	May 25, 2024	Passage RetrievalQuestion Answering	—Unverified
RNG-KBQA: Generation Augmented Iterative Ranking for Knowledge Base Question Answering	Nov 16, 2021	Entity LinkingKnowledge Base Question Answering	—Unverified
Ask Your Neurons: A Neural-based Approach to Answering Questions about Images	May 5, 2015	Question Answering	—Unverified
Generating Answering Patterns from Factoid Arabic Questions	Sep 1, 2017	Information RetrievalQuestion Answering	—Unverified
Robo2VLM: Visual Question Answering from Large-Scale In-the-Wild Robot Manipulation Datasets	May 21, 2025	Dataset GenerationDescriptive	—Unverified
Robotic Environmental State Recognition with Pre-Trained Vision-Language Models and Black-Box Optimization	Sep 26, 2024	Image to textImage-to-Text Retrieval	—Unverified
Generating Natural Questions from Images for Multimodal Assistants	Nov 17, 2020	Common Sense ReasoningNatural Questions	—Unverified
Robust Computational Semantics	Dec 1, 2013	Question Answering	—Unverified
Robust Computer Algebra, Theorem Proving, and Oracle AI	Aug 8, 2017	Automated Theorem ProvingQuestion Answering	—Unverified
Robust Coreference Resolution and Entity Linking on Dialogues: Character Identification on TV Show Transcripts	Aug 1, 2017	coreference-resolutionCoreference Resolution	—Unverified
Generating Rationales in Visual Question Answering	Apr 4, 2020	Question AnsweringVisual Question Answering	—Unverified
Robust Domain Adaptation for Relation Extraction via Clustering Consistency	Jun 1, 2014	ClusteringDomain Adaptation	—Unverified
Generating Responses that Reflect Meta Information in User-Generated Question Answer Pairs	May 1, 2020	Question Answering	—Unverified
Robust Few-shot Transfer Learning for Knowledge Base Question Answering with Unanswerable Questions	Jun 20, 2024	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Robustifying Multi-hop QA through Pseudo-Evidentiality Training	Jul 7, 2021	counterfactualMulti-hop Question Answering	—Unverified
Combining Deep Neural Reranking and Unsupervised Extraction for Multi-Query Focused Summarization	Feb 2, 2023	DiversityExtractive Summarization	—Unverified
Robust Machine Comprehension Models via Adversarial Training	Apr 17, 2018	Data AugmentationQuestion Answering	—Unverified
Revisiting the Superficial Alignment Hypothesis	Sep 27, 2024	Instruction FollowingMath	—Unverified

Show:10 25 50

← PrevPage 167 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified