Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9626–9650 of 10817 papers

Title	Date	Tasks	Status
VISREAS: Complex Visual Reasoning with Unanswerable Questions	Feb 23, 2024	Question AnsweringVisual Question Answering	—Unverified
VisScience: An Extensive Benchmark for Evaluating K12 Educational Multi-modal Scientific Reasoning	Sep 10, 2024	Question AnsweringVisual Question Answering	—Unverified
VISTA-LLAMA: Reducing Hallucination in Video Language Models via Equal Distance to Visual Tokens	Jan 1, 2024	HallucinationPosition	—Unverified
Vista-LLaMA: Reliable Video Narrator via Equal Distance to Visual Tokens	Dec 12, 2023	HallucinationPosition	—Unverified
Visual7W: Grounded Question Answering in Images	Nov 11, 2015	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
Visual Attention Model for Name Tagging in Multimodal Social Media	Jul 1, 2018	Natural Language UnderstandingQuestion Answering	—Unverified
Visual Chain of Thought: Bridging Logical Gaps with Multimodal Infillings	May 3, 2023	Data AugmentationQuestion Answering	—Unverified
Visual Commonsense based Heterogeneous Graph Contrastive Learning	Nov 11, 2023	Contrastive LearningQuestion Answering	—Unverified
Visual Entailment: A Novel Task for Fine-Grained Image Understanding	Jan 20, 2019	Natural Language InferenceQuestion Answering	—Unverified
Visual Entailment Task for Visually-Grounded Language Learning	Nov 26, 2018	Grounded language learningNatural Language Inference	—Unverified
Visual Environment-Interactive Planning for Embodied Complex-Question Answering	Apr 1, 2025	Question AnsweringTask Planning	—Unverified
Visual Explanations from Hadamard Product in Multimodal Deep Networks	Dec 18, 2017	Question AnsweringVisual Question Answering	—Unverified
Visual Graph Question Answering with ASP and LLMs for Language Parsing	Feb 13, 2025	Graph Question AnsweringOptical Character Recognition	—Unverified
Visual Grounding Strategies for Text-Only Natural Language Processing	Mar 25, 2021	Image RetrievalLanguage Modeling	—Unverified
Visual Hallucination: Definition, Quantification, and Prescriptive Remediations	Mar 26, 2024	HallucinationImage Captioning	—Unverified
Visual Instruction Bottleneck Tuning	May 20, 2025	HallucinationObject Hallucination	—Unverified
Visualizing Sentiment Analysis on a User Forum	May 1, 2012	Opinion MiningQuestion Answering	—Unverified
Visually Guided Spatial Relation Extraction from Text	Jun 1, 2018	Activity RecognitionImage Captioning	—Unverified
Visual Madlibs: Fill in the Blank Description Generation and Question Answering	Dec 1, 2015	Multiple-choiceQuestion Answering	—Unverified
Visual Madlibs: Fill in the blank Image Generation and Question Answering	May 31, 2015	Image GenerationMultiple-choice	—Unverified
Visual Perturbation-aware Collaborative Learning for Overcoming the Language Prior Problem	Jul 24, 2022	DiagnosticQuestion Answering	—Unverified
Visual Question Answering as a Meta Learning Task	Nov 22, 2017	Meta-LearningQuestion Answering	—Unverified
Visual Question Answering as a Multi-Task Problem	Jul 3, 2020	Question AnsweringVisual Question Answering	—Unverified
Visual Question Answering as Reading Comprehension	Nov 29, 2018	Common Sense ReasoningGeneral Knowledge	—Unverified
Visual Question Answering: A Survey on Techniques and Common Trends in Recent Literature	May 18, 2023	Question AnsweringVisual Question Answering	—Unverified

Show:10 25 50

← PrevPage 386 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified