Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9651–9675 of 10817 papers

Title	Date	Tasks	Status
PlainQAFact: Automatic Factuality Evaluation Metric for Biomedical Plain Language Summaries Generation	Mar 11, 2025	Question Answering	CodeCode Available
Learning a Cost-Effective Annotation Policy for Question Answering	Oct 7, 2020	Question Answering	CodeCode Available
Learning Action-Effect Dynamics for Hypothetical Vision-Language Reasoning Task	Dec 7, 2022	DecoderGraph Question Answering	CodeCode Available
Plan-and-Refine: Diverse and Comprehensive Retrieval-Augmented Generation	Apr 10, 2025	Question AnsweringRetrieval	CodeCode Available
Comparing Attention-based Convolutional and Recurrent Neural Networks: Success and Limitations in Machine Reading Comprehension	Aug 27, 2018	Machine Reading ComprehensionQuestion Answering	CodeCode Available
Learning a Natural Language Interface with Neural Programmer	Nov 28, 2016	Natural Language QueriesProgram induction	CodeCode Available
A Dual-Attention Learning Network with Word and Sentence Embedding for Medical Visual Question Answering	Oct 1, 2022	Medical Visual Question AnsweringQuestion Answering	CodeCode Available
Multi-step Retriever-Reader Interaction for Scalable Open-domain Question Answering	May 14, 2019	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
Comparative Study of Machine Learning Models and BERT on SQuAD	May 22, 2020	BIG-bench Machine LearningQuestion Answering	CodeCode Available
Analyzing Social Biases in Japanese Large Language Models	Jun 4, 2024	Question Answering	CodeCode Available
Compact Trilinear Interaction for Visual Question Answering	Sep 26, 2019	BenchmarkingKnowledge Distillation	CodeCode Available
Few shot chain-of-thought driven reasoning to prompt LLMs for open ended medical question answering	Mar 7, 2024	Information RetrievalLanguage Modelling	CodeCode Available
Multi-Target Embodied Question Answering	Apr 9, 2019	Embodied Question AnsweringNavigate	CodeCode Available
Multi-Task Dense Retrieval via Model Uncertainty Fusion for Open-Domain Question Answering	Nov 1, 2021	ArticlesOpen-Domain Question Answering	CodeCode Available
p-Laplacian Adaptation for Generative Pre-trained Vision-Language Models	Dec 17, 2023	Image CaptioningQuestion Answering	CodeCode Available
Multi-tasking Dialogue Comprehension with Discourse Parsing	Oct 7, 2021	Discourse ParsingMachine Reading Comprehension	CodeCode Available
Multi-Task Learning for Conversational Question Answering over a Large-Scale Knowledge Base	Oct 11, 2019	Conversational Question AnsweringMulti-Task Learning	CodeCode Available
Learning by Correction: Efficient Tuning Task for Zero-Shot Generative Vision-Language Reasoning	Apr 1, 2024	Image CaptioningInstruction Following	CodeCode Available
Multi-task Learning with Sample Re-weighting for Machine Reading Comprehension	Sep 18, 2018	Machine Reading ComprehensionMachine Translation	CodeCode Available
BEEDS: Large-Scale Biomedical Event Extraction using Distant Supervision and Question Answering	May 1, 2022	Event ExtractionKnowledge Base Population	CodeCode Available
PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable	Oct 17, 2019	Conversational Question AnsweringDialogue Generation	CodeCode Available
Learning Conditioned Graph Structures for Interpretable Visual Question Answering	Jun 19, 2018	Question AnsweringVisual Question Answering	CodeCode Available
Plausible Extractive Rationalization through Semi-Supervised Entailment Signal	Feb 13, 2024	Natural Language InferenceQuestion Answering	CodeCode Available
Learning content and context with language bias for Visual Question Answering	Dec 21, 2020	Question AnsweringVisual Question Answering	CodeCode Available
Multi-Task Learning with Multi-View Attention for Answer Selection and Knowledge Base Question Answering	Dec 6, 2018	Answer SelectionKnowledge Base Question Answering	CodeCode Available

Show:10 25 50

← PrevPage 387 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified