Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9201–9225 of 10817 papers

Title	Date	Tasks	Status
Is this Change the Answer to that Problem? Correlating Descriptions of Bug and Code Changes for Evaluating Patch Correctness	Aug 8, 2022	Question Answering	CodeCode Available
Q-NL Verifier: Leveraging Synthetic Data for Robust Knowledge Graph Question Answering	Mar 3, 2025	Graph Question AnsweringQuestion Answering	CodeCode Available
A Nil-Aware Answer Extraction Framework for Question Answering	Oct 1, 2018	Question AnsweringReading Comprehension	CodeCode Available
High-Order Attention Models for Visual Question Answering	Nov 12, 2017	Question AnsweringVisual Question Answering	CodeCode Available
BioRead: A New Dataset for Biomedical Reading Comprehension	May 1, 2018	Information RetrievalMachine Reading Comprehension	CodeCode Available
Hierarchical Transformer for Task Oriented Dialog Systems	Oct 24, 2020	Natural Language UnderstandingQuestion Answering	CodeCode Available
A Lightweight Method to Generate Unanswerable Questions in English	Oct 30, 2023	Data AugmentationQuestion Answering	CodeCode Available
Iterative Alternating Neural Attention for Machine Reading	Jun 7, 2016	ArticlesQuestion Answering	CodeCode Available
Cross-Modal Contrastive Learning for Robust Reasoning in VQA	Nov 21, 2022	Contrastive LearningQuestion Answering	CodeCode Available
BioRAGent: A Retrieval-Augmented Generation System for Showcasing Generative Query Expansion and Domain-Specific Search for Scientific Q&A	Dec 16, 2024	Answer GenerationFew-Shot Learning	CodeCode Available
Accurate and Nuanced Open-QA Evaluation Through Textual Entailment	May 26, 2024	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning	Oct 10, 2024	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available
Hierarchical Memory Networks for Answer Selection on Unknown Words	Sep 28, 2016	Answer SelectionQuestion Answering	CodeCode Available
PaniniQA: Enhancing Patient Education Through Interactive Question Answering	Aug 7, 2023	Question Answering	CodeCode Available
Modularized Zero-shot VQA with Pre-trained Models	May 27, 2023	object-detectionObject Detection	CodeCode Available
Cross-Lingual Training for Automatic Question Generation	Jun 6, 2019	Natural Language UnderstandingQuestion Answering	CodeCode Available
BioMedLAT Corpus: Annotation of the Lexical Answer Type for Biomedical Questions	Dec 1, 2016	Part-Of-Speech TaggingQuestion Answering	CodeCode Available
Modulating early visual processing by language	Jul 2, 2017	Question AnsweringVisual Question Answering	CodeCode Available
Biomedical Named Entity Recognition at Scale	Nov 12, 2020	De-identificationEntity Resolution	CodeCode Available
Right this way: Can VLMs Guide Us to See More to Answer Questions?	Nov 1, 2024	Question AnsweringVisual Question Answering	CodeCode Available
Cross-Lingual Text-Rich Visual Comprehension: An Information Theory Perspective	Dec 23, 2024	Question AnsweringVisual Question Answering	CodeCode Available
P NP, at least in Visual Question Answering	Mar 26, 2020	Question AnsweringVisual Question Answering	CodeCode Available
IUCM at SemEval-2018 Task 11: Similar-Topic Texts as a Comprehension Knowledge Source	Jun 1, 2018	ClusteringLemmatization	CodeCode Available
Cross-Lingual Question Answering over Knowledge Base as Reading Comprehension	Feb 26, 2023	Cross-Lingual Question AnsweringMachine Reading Comprehension	CodeCode Available
Biomedical Knowledge Graph Embeddings with Negative Statements	Aug 7, 2023	Graph EmbeddingGraph Representation Learning	CodeCode Available

Show:10 25 50

← PrevPage 369 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified