Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8326–8350 of 10817 papers

Title	Date	Tasks	Status
Risks and NLP Design: A Case Study on Procedural Document QA	Aug 16, 2024	Language ModelingLanguage Modelling	—Unverified
RJUA-MedDQA: A Multimodal Benchmark for Medical Document Question Answering and Clinical Reasoning	Feb 19, 2024	document understandingMedical Diagnosis	—Unverified
Combining dependency information and generalization in a pattern-based approach to the classification of lexical-semantic relation instances	May 1, 2014	ClassificationGeneral Classification	—Unverified
RLAS-BIABC: A Reinforcement Learning-Based Answer Selection Using the BERT Model Boosted by an Improved ABC Algorithm	Jan 7, 2023	Answer SelectionDecision Making	—Unverified
RL-CSDia: Representation Learning of Computer Science Diagrams	Mar 10, 2021	Question AnsweringRepresentation Learning	—Unverified
R-LLaVA: Improving Med-VQA Understanding through Visual Region of Interest	Oct 27, 2024	Medical Visual Question AnsweringMultiple-choice	—Unverified
RMLVQA: A Margin Loss Approach for Visual Question Answering With Language Biases	Jan 1, 2023	Question AnsweringVisual Question Answering	—Unverified
Generating clickbait spoilers with an ensemble of large language models	May 25, 2024	Passage RetrievalQuestion Answering	—Unverified
RNG-KBQA: Generation Augmented Iterative Ranking for Knowledge Base Question Answering	Nov 16, 2021	Entity LinkingKnowledge Base Question Answering	—Unverified
Ask Your Neurons: A Neural-based Approach to Answering Questions about Images	May 5, 2015	Question Answering	—Unverified
Generating Answering Patterns from Factoid Arabic Questions	Sep 1, 2017	Information RetrievalQuestion Answering	—Unverified
Robo2VLM: Visual Question Answering from Large-Scale In-the-Wild Robot Manipulation Datasets	May 21, 2025	Dataset GenerationDescriptive	—Unverified
Robotic Environmental State Recognition with Pre-Trained Vision-Language Models and Black-Box Optimization	Sep 26, 2024	Image to textImage-to-Text Retrieval	—Unverified
Generating Natural Questions from Images for Multimodal Assistants	Nov 17, 2020	Common Sense ReasoningNatural Questions	—Unverified
Robust Computational Semantics	Dec 1, 2013	Question Answering	—Unverified
Robust Computer Algebra, Theorem Proving, and Oracle AI	Aug 8, 2017	Automated Theorem ProvingQuestion Answering	—Unverified
Robust Coreference Resolution and Entity Linking on Dialogues: Character Identification on TV Show Transcripts	Aug 1, 2017	coreference-resolutionCoreference Resolution	—Unverified
Generating Rationales in Visual Question Answering	Apr 4, 2020	Question AnsweringVisual Question Answering	—Unverified
Robust Domain Adaptation for Relation Extraction via Clustering Consistency	Jun 1, 2014	ClusteringDomain Adaptation	—Unverified
Generating Responses that Reflect Meta Information in User-Generated Question Answer Pairs	May 1, 2020	Question Answering	—Unverified
Robust Few-shot Transfer Learning for Knowledge Base Question Answering with Unanswerable Questions	Jun 20, 2024	Knowledge Base Question AnsweringQuestion Answering	—Unverified
Robustifying Multi-hop QA through Pseudo-Evidentiality Training	Jul 7, 2021	counterfactualMulti-hop Question Answering	—Unverified
Combining Deep Neural Reranking and Unsupervised Extraction for Multi-Query Focused Summarization	Feb 2, 2023	DiversityExtractive Summarization	—Unverified
Robust Machine Comprehension Models via Adversarial Training	Apr 17, 2018	Data AugmentationQuestion Answering	—Unverified
Revisiting the Superficial Alignment Hypothesis	Sep 27, 2024	Instruction FollowingMath	—Unverified

Show:10 25 50

← PrevPage 334 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified