Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9601–9650 of 10817 papers

Title	Date	Tasks	Status
Video Question Generation via Cross-Modal Self-Attention Networks Learning	Jul 5, 2019	DiversityQuestion Answering	—Unverified
VideoCoCa: Video-Text Modeling with Zero-Shot Transfer from Contrastive Captioners	Dec 9, 2022	Question AnsweringRetrieval	—Unverified
Video Understanding as Machine Translation	Jun 12, 2020	Machine TranslationMetric Learning	—Unverified
Vietnamese Legal Information Retrieval in Question-Answering System	Sep 5, 2024	HallucinationInformation Retrieval	—Unverified
ViLMedic: a framework for research at the intersection of vision and language in medical AI	May 1, 2022	Medical Visual Question AnsweringQuestion Answering	—Unverified
VilNMN: A Neural Module Network approach to Video-Grounded Language Tasks	Jan 1, 2021	Information RetrievalQuestion Answering	—Unverified
Vi-Mistral-X: Building a Vietnamese Language Model with Advanced Continual Pre-training	Mar 20, 2024	Language ModelingLanguage Modelling	—Unverified
Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese	Aug 22, 2024	Language ModelingLanguage Modelling	—Unverified
VisDoM: Multi-Document QA with Visually Rich Elements Using Multimodal Retrieval-Augmented Generation	Dec 14, 2024	Question AnsweringRAG	—Unverified
Vision-Amplified Semantic Entropy for Hallucination Detection in Medical Visual Question Answering	Mar 26, 2025	DiagnosticHallucination	—Unverified
Vision and Language: from Visual Perception to Content Creation	Dec 26, 2019	DecoderQuestion Answering	—Unverified
Vision and Language Integration: Moving beyond Objects	Jan 1, 2017	Action ClassificationImage Captioning	—Unverified
Vision-and-Language Training Helps Deploy Taxonomic Knowledge but Does Not Fundamentally Alter It	Jul 17, 2025	Question Answering	—Unverified
VisionGPT: Vision-Language Understanding Agent Using Generalized Multimodal Framework	Mar 14, 2024	Language ModelingLanguage Modelling	—Unverified
Vision Language Model for Interpretable and Fine-grained Detection of Safety Compliance in Diverse Workplaces	Aug 13, 2024	AttributeLanguage Modeling	—Unverified
Vision-Language Models as Success Detectors	Mar 13, 2023	Question AnsweringVisual Question Answering	—Unverified
Vision Language Models Can Parse Floor Plan Maps	Sep 19, 2024	Image CaptioningQuestion Answering	—Unverified
Vision-Language Models for Edge Networks: A Comprehensive Survey	Feb 11, 2025	Autonomous VehiclesImage Captioning	—Unverified
Vision-Language Models Struggle to Align Entities across Modalities	Mar 5, 2025	AttributeCode Generation	—Unverified
Vision-Language Pretraining: Current Trends and the Future	May 1, 2022	Question AnsweringRepresentation Learning	—Unverified
Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck	May 30, 2025	Question AnsweringVisual Question Answering	—Unverified
Vision-to-Language Tasks Based on Attributes and Attention Mechanism	May 29, 2019	Image CaptioningQuestion Answering	—Unverified
VisKE: Visual Knowledge Extraction and Question Answering by Visual Verification of Relation Phrases	Jun 1, 2015	Question AnsweringRelation	—Unverified
VisKoP: Visual Knowledge oriented Programming for Interactive Knowledge Base Question Answering	Jul 6, 2023	Knowledge Base Question AnsweringProgram induction	—Unverified
VISREAS: Complex Visual Reasoning with Unanswerable Questions	Feb 23, 2024	Question AnsweringVisual Question Answering	—Unverified
VisScience: An Extensive Benchmark for Evaluating K12 Educational Multi-modal Scientific Reasoning	Sep 10, 2024	Question AnsweringVisual Question Answering	—Unverified
VISTA-LLAMA: Reducing Hallucination in Video Language Models via Equal Distance to Visual Tokens	Jan 1, 2024	HallucinationPosition	—Unverified
Vista-LLaMA: Reliable Video Narrator via Equal Distance to Visual Tokens	Dec 12, 2023	HallucinationPosition	—Unverified
Visual7W: Grounded Question Answering in Images	Nov 11, 2015	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
Visual Attention Model for Name Tagging in Multimodal Social Media	Jul 1, 2018	Natural Language UnderstandingQuestion Answering	—Unverified
Visual Chain of Thought: Bridging Logical Gaps with Multimodal Infillings	May 3, 2023	Data AugmentationQuestion Answering	—Unverified
Visual Commonsense based Heterogeneous Graph Contrastive Learning	Nov 11, 2023	Contrastive LearningQuestion Answering	—Unverified
Visual Entailment: A Novel Task for Fine-Grained Image Understanding	Jan 20, 2019	Natural Language InferenceQuestion Answering	—Unverified
Visual Entailment Task for Visually-Grounded Language Learning	Nov 26, 2018	Grounded language learningNatural Language Inference	—Unverified
Visual Environment-Interactive Planning for Embodied Complex-Question Answering	Apr 1, 2025	Question AnsweringTask Planning	—Unverified
Visual Explanations from Hadamard Product in Multimodal Deep Networks	Dec 18, 2017	Question AnsweringVisual Question Answering	—Unverified
Visual Graph Question Answering with ASP and LLMs for Language Parsing	Feb 13, 2025	Graph Question AnsweringOptical Character Recognition	—Unverified
Visual Grounding Strategies for Text-Only Natural Language Processing	Mar 25, 2021	Image RetrievalLanguage Modeling	—Unverified
Visual Hallucination: Definition, Quantification, and Prescriptive Remediations	Mar 26, 2024	HallucinationImage Captioning	—Unverified
Visual Instruction Bottleneck Tuning	May 20, 2025	HallucinationObject Hallucination	—Unverified
Visualizing Sentiment Analysis on a User Forum	May 1, 2012	Opinion MiningQuestion Answering	—Unverified
Visually Guided Spatial Relation Extraction from Text	Jun 1, 2018	Activity RecognitionImage Captioning	—Unverified
Visual Madlibs: Fill in the Blank Description Generation and Question Answering	Dec 1, 2015	Multiple-choiceQuestion Answering	—Unverified
Visual Madlibs: Fill in the blank Image Generation and Question Answering	May 31, 2015	Image GenerationMultiple-choice	—Unverified
Visual Perturbation-aware Collaborative Learning for Overcoming the Language Prior Problem	Jul 24, 2022	DiagnosticQuestion Answering	—Unverified
Visual Question Answering as a Meta Learning Task	Nov 22, 2017	Meta-LearningQuestion Answering	—Unverified
Visual Question Answering as a Multi-Task Problem	Jul 3, 2020	Question AnsweringVisual Question Answering	—Unverified
Visual Question Answering as Reading Comprehension	Nov 29, 2018	Common Sense ReasoningGeneral Knowledge	—Unverified
Visual Question Answering: A Survey on Techniques and Common Trends in Recent Literature	May 18, 2023	Question AnsweringVisual Question Answering	—Unverified
Visual question answering based evaluation metrics for text-to-image generation	Nov 15, 2024	Image GenerationImage Manipulation	—Unverified

Show:10 25 50

← PrevPage 193 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified