Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9601–9625 of 10817 papers

Title	Date	Tasks	Status
Video Question Answering with Phrases via Semantic Roles	Apr 8, 2021	Question AnsweringVideo Question Answering	—Unverified
Video Question Generation via Cross-Modal Self-Attention Networks Learning	Jul 5, 2019	DiversityQuestion Answering	—Unverified
VideoCoCa: Video-Text Modeling with Zero-Shot Transfer from Contrastive Captioners	Dec 9, 2022	Question AnsweringRetrieval	—Unverified
Video Understanding as Machine Translation	Jun 12, 2020	Machine TranslationMetric Learning	—Unverified
Vietnamese Legal Information Retrieval in Question-Answering System	Sep 5, 2024	HallucinationInformation Retrieval	—Unverified
ViLMedic: a framework for research at the intersection of vision and language in medical AI	May 1, 2022	Medical Visual Question AnsweringQuestion Answering	—Unverified
VilNMN: A Neural Module Network approach to Video-Grounded Language Tasks	Jan 1, 2021	Information RetrievalQuestion Answering	—Unverified
Vi-Mistral-X: Building a Vietnamese Language Model with Advanced Continual Pre-training	Mar 20, 2024	Language ModelingLanguage Modelling	—Unverified
Vintern-1B: An Efficient Multimodal Large Language Model for Vietnamese	Aug 22, 2024	Language ModelingLanguage Modelling	—Unverified
VisDoM: Multi-Document QA with Visually Rich Elements Using Multimodal Retrieval-Augmented Generation	Dec 14, 2024	Question AnsweringRAG	—Unverified
Vision-Amplified Semantic Entropy for Hallucination Detection in Medical Visual Question Answering	Mar 26, 2025	DiagnosticHallucination	—Unverified
Vision and Language: from Visual Perception to Content Creation	Dec 26, 2019	DecoderQuestion Answering	—Unverified
Vision and Language Integration: Moving beyond Objects	Jan 1, 2017	Action ClassificationImage Captioning	—Unverified
Vision-and-Language Training Helps Deploy Taxonomic Knowledge but Does Not Fundamentally Alter It	Jul 17, 2025	Question Answering	—Unverified
VisionGPT: Vision-Language Understanding Agent Using Generalized Multimodal Framework	Mar 14, 2024	Language ModelingLanguage Modelling	—Unverified
Vision Language Model for Interpretable and Fine-grained Detection of Safety Compliance in Diverse Workplaces	Aug 13, 2024	AttributeLanguage Modeling	—Unverified
Vision-Language Models as Success Detectors	Mar 13, 2023	Question AnsweringVisual Question Answering	—Unverified
Vision Language Models Can Parse Floor Plan Maps	Sep 19, 2024	Image CaptioningQuestion Answering	—Unverified
Vision-Language Models for Edge Networks: A Comprehensive Survey	Feb 11, 2025	Autonomous VehiclesImage Captioning	—Unverified
Vision-Language Models Struggle to Align Entities across Modalities	Mar 5, 2025	AttributeCode Generation	—Unverified
Vision-Language Pretraining: Current Trends and the Future	May 1, 2022	Question AnsweringRepresentation Learning	—Unverified
Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck	May 30, 2025	Question AnsweringVisual Question Answering	—Unverified
Vision-to-Language Tasks Based on Attributes and Attention Mechanism	May 29, 2019	Image CaptioningQuestion Answering	—Unverified
VisKE: Visual Knowledge Extraction and Question Answering by Visual Verification of Relation Phrases	Jun 1, 2015	Question AnsweringRelation	—Unverified
VisKoP: Visual Knowledge oriented Programming for Interactive Knowledge Base Question Answering	Jul 6, 2023	Knowledge Base Question AnsweringProgram induction	—Unverified

Show:10 25 50

← PrevPage 385 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified