Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10276–10300 of 10817 papers

Title	Date	Tasks	Status
Propagate-Selector: Detecting Supporting Sentences for Question Answering via Graph Neural Networks	Aug 24, 2019	Answer SelectionGraph Neural Network	CodeCode Available
RepLiQA: A Question-Answering Dataset for Benchmarking LLMs on Unseen Reference Content	Jun 17, 2024	BenchmarkingGeneral Knowledge	CodeCode Available
On-the-fly Denoising for Data Augmentation in Natural Language Understanding	Dec 20, 2022	Data AugmentationDenoising	CodeCode Available
A template-independent approach for information extraction in real estate documents	May 30, 2023	Information RetrievalNatural Language Understanding	CodeCode Available
RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding	May 20, 2025	Image CaptioningQuestion Answering	CodeCode Available
RAVEN: Query-Guided Representation Alignment for Question Answering over Audio, Video, Embedded Sensors, and Natural Language	May 21, 2025	Question Answering	CodeCode Available
RConE: Rough Cone Embedding for Multi-Hop Logical Query Answering on Multi-Modal Knowledge Graphs	Aug 21, 2024	Knowledge GraphsLink Prediction	CodeCode Available
Do Text Simplification Systems Preserve Meaning? A Human Evaluation via Reading Comprehension	Dec 15, 2023	Question AnsweringReading Comprehension	CodeCode Available
Cascading Adaptors to Leverage English Data to Improve Performance of Question Answering for Low-Resource Languages	Dec 18, 2021	Question AnsweringTransfer Learning	CodeCode Available
DO-RAG: A Domain-Specific QA Framework Using Knowledge Graph-Enhanced Retrieval-Augmented Generation	May 15, 2025	graph constructionHallucination	CodeCode Available
Cascaded Mutual Modulation for Visual Reasoning	Sep 6, 2018	Question AnsweringVisual Question Answering	CodeCode Available
Don't Just Assume; Look and Answer: Overcoming Priors for Visual Question Answering	Dec 1, 2017	Question AnsweringVisual Question Answering	CodeCode Available
Do Not Trust the Trolls: Predicting Credibility in Community Question Answering Forums	Sep 1, 2017	Community Question AnsweringInformation Retrieval	CodeCode Available
On the Impact of Speech Recognition Errors in Passage Retrieval for Spoken Question Answering	Sep 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
MedArabiQ: Benchmarking Large Language Models on Arabic Medical Tasks	May 6, 2025	BenchmarkingMultiple-choice	CodeCode Available
Do NLP Models Know Numbers? Probing Numeracy in Embeddings	Sep 17, 2019	Question Answering	CodeCode Available
Do Multi-hop Readers Dream of Reasoning Chains?	Oct 31, 2019	Question Answering	CodeCode Available
On the Importance of Adaptive Data Collection for Extremely Imbalanced Pairwise Tasks	Oct 10, 2020	Active LearningOpen-Domain Question Answering	CodeCode Available
Domino at FinCausal 2020, Task 1 and 2: Causal Extraction System	Dec 1, 2020	Information RetrievalQuestion Answering	CodeCode Available
Domain-Specific Language Model Pretraining for Biomedical Natural Language Processing	Jul 31, 2020	Continual Pretraining	CodeCode Available
Domain-agnostic Question-Answering with Adversarial Training	Oct 21, 2019	Domain GeneralizationQuestion Answering	CodeCode Available
Domain Adaptation for Question Answering via Question Classification	Sep 12, 2022	Domain AdaptationGeneral Classification	CodeCode Available
Alignment Attention by Matching Key and Query Distributions	Oct 25, 2021	Graph AttentionQuestion Answering	CodeCode Available
Answering Questions about Data Visualizations using Efficient Bimodal Fusion	Aug 5, 2019	Chart Question AnsweringOptical Character Recognition	CodeCode Available
MedExQA: Medical Question Answering Benchmark with Multiple Explanations	Jun 10, 2024	Medical Question AnsweringQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 412 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified