Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9501–9525 of 10817 papers

Title	Date	Tasks	Status
Kvasir-VQA: A Text-Image Pair GI Tract Dataset	Sep 2, 2024	Image CaptioningImage Generation	CodeCode Available
Kvasir-VQA-x1: A Multimodal Dataset for Medical Reasoning and Robust MedVQA in Gastrointestinal Endoscopy	Jun 11, 2025	Medical Visual Question AnsweringQuestion Answering	CodeCode Available
Adversarial Feature Adaptation for Cross-lingual Relation Classification	Aug 1, 2018	ClassificationDomain Adaptation	CodeCode Available
Gendered Pronoun Resolution using BERT and an extractive question answering formulation	Jun 9, 2019	coreference-resolutionCoreference Resolution	CodeCode Available
Context Independent Term Mapper for European Languages	Sep 1, 2013	Information RetrievalMachine Translation	CodeCode Available
Gated Orthogonal Recurrent Units: On Learning to Forget	Jun 8, 2017	DenoisingQuestion Answering	CodeCode Available
KwaiChat: A Large-Scale Video-Driven Multilingual Mixed-Type Dialogue Corpus	Mar 10, 2025	In-Context LearningQuestion Answering	CodeCode Available
Recurrent Relational Networks	Nov 21, 2017	DiagnosticQuestion Answering	CodeCode Available
Adapting Lightweight Vision Language Models for Radiological Visual Question Answering	Jun 17, 2025	DiagnosticQuestion Answering	CodeCode Available
Gated End-to-End Memory Networks	Oct 13, 2016	dialog state trackingQuestion Answering	CodeCode Available
Gated Convolutional Bidirectional Attention-based Model for Off-topic Spoken Response Detection	Apr 20, 2020	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Context-Driven Index Trimming: A Data Quality Perspective to Enhancing Precision of RALMs	Aug 10, 2024	Question AnsweringRetrieval	CodeCode Available
Are Visual-Linguistic Models Commonsense Knowledge Bases?	Oct 1, 2022	Natural Language UnderstandingQuestion Answering	CodeCode Available
Gated-Attention Readers for Text Comprehension	Jun 5, 2016	Answer SelectionOpen-Domain Question Answering	CodeCode Available
A Benchmark for Generalizable and Interpretable Temporal Question Answering over Knowledge Bases	Jan 15, 2022	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available
Multimodal Hypothetical Summary for Retrieval-based Multi-image Question Answering	Dec 19, 2024	Contrastive LearningLanguage Modeling	CodeCode Available
Russian Web Tables: A Public Corpus of Web Tables for Russian Language Based on Wikipedia	Oct 3, 2022	Knowledge Base ConstructionManagement	CodeCode Available
Game of Sketches: Deep Recurrent Models of Pictionary-style Word Guessing	Jan 29, 2018	Question AnsweringVisual Question Answering	CodeCode Available
FusionNet: Fusing via Fully-Aware Attention with Application to Machine Comprehension	Nov 16, 2017	Question AnsweringReading Comprehension	CodeCode Available
Fully Automated Fact Checking Using External Sources	Oct 1, 2017	Community Question AnsweringFact Checking	CodeCode Available
BERTnesia: Investigating the capture and forgetting of knowledge in BERT	Oct 19, 2020	Knowledge Base CompletionNER	CodeCode Available
BERT Knows Punta Cana is not just beautiful, it's gorgeous: Ranking Scalar Adjectives with Contextualised Representations	Oct 6, 2020	Natural Language UnderstandingQuestion Answering	CodeCode Available
Fully Authentic Visual Question Answering Dataset from Online Communities	Nov 27, 2023	Question AnsweringVisual Question Answering	CodeCode Available
Context-Aware Representations for Knowledge Base Relation Extraction	Sep 1, 2017	Question AnsweringRelation	CodeCode Available
PersoNER: Persian Named-Entity Recognition	Dec 1, 2016	Machine Translationnamed-entity-recognition	CodeCode Available

Show:10 25 50

← PrevPage 381 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified