Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7576–7600 of 10817 papers

Title	Date	Tasks	Status
Data Augmentation for Biomedical Factoid Question Answering	Jan 16, 2022	Data AugmentationInformation Retrieval	—Unverified
Proceedings of the 2nd Workshop on Machine Reading for Question Answering	Nov 1, 2019	Question AnsweringReading Comprehension	—Unverified
Proceedings of the 6th BioASQ Workshop A challenge on large-scale biomedical semantic indexing and question answering	Nov 1, 2018	Question Answering	—Unverified
基于多头注意力和BiLSTM改进DAM模型的中文问答匹配方法(Chinese question answering method based on multi-head attention and BiLSTM improved DAM model)	Oct 1, 2020	Deep AttentionQuestion Answering	—Unverified
Proceedings of the Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL)	Jun 1, 2016	Information RetrievalQuestion Answering	—Unverified
Jiangnan at SemEval-2018 Task 11: Deep Neural Network with Attention Method for Machine Comprehension Task	Jun 1, 2018	Machine Reading ComprehensionNamed Entity Recognition (NER)	—Unverified
Proceedings of the Workshop on Human-Computer Question Answering	Jun 1, 2016	Question Answering	—Unverified
Data Augmentation for BERT Fine-Tuning in Open-Domain Question Answering	Apr 14, 2019	Data AugmentationOpen-Domain Question Answering	—Unverified
Proceedings of the Workshop on Question Answering for Complex Domains	Dec 1, 2012	Question Answering	—Unverified
Automatic Claim Review for Climate Science via Explanation Generation	Jul 30, 2021	DecoderExplanation Generation	—Unverified
ProcTag: Process Tagging for Assessing the Efficacy of Document Instruction Data	Jul 17, 2024	Question AnsweringVisual Question Answering	—Unverified
JEEM: Vision-Language Understanding in Four Arabic Dialects	Mar 27, 2025	Image CaptioningQuestion Answering	—Unverified
Product Question Answering in E-Commerce: A Survey	Feb 16, 2023	Question AnsweringSurvey	—Unverified
Programming Language Agnostic Mining of Code and Language Pairs with Sequence Labeling Based Question Answering	Mar 21, 2022	Question Answering	—Unverified
Program Synthesis Benchmark for Visual Programming in XLogoOnline Environment	Jun 17, 2024	Logical ReasoningMath	—Unverified
Progressive Attention Memory Network for Movie Story Question Answering	Apr 18, 2019	Question AnsweringVideo Story QA	—Unverified
JEC-QA: A Legal-Domain Question Answering Dataset	Nov 27, 2019	Question AnsweringReading Comprehension	—Unverified
DARE: Diverse Visual Question Answering with Robustness Evaluation	Sep 26, 2024	image-classificationImage Classification	—Unverified
JAIST: Combining multiple features for Answer Selection in Community Question Answering	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
Jailbreak Attacks and Defenses Against Large Language Models: A Survey	Jul 5, 2024	Code CompletionQuestion Answering	—Unverified
Jaeger: A Concatenation-Based Multi-Transformer VQA Model	Oct 11, 2023	Dimensionality Reductionmodel	—Unverified
Danoliteracy of Generative, Large Language Models	Oct 30, 2024	Question Answering	—Unverified
Projection-based Annotation of a Polish Dependency Treebank	May 1, 2014	ARCDependency Parsing	—Unverified
Automatic Building and Using Parallel Resources for SMT from Comparable Corpora	Apr 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Medical Knowledge Graph QA for Drug-Drug Interaction Prediction based on Multi-hop Machine Reading Comprehension	Dec 19, 2022	Entity EmbeddingsGraph Neural Network	—Unverified

Show:10 25 50

← PrevPage 304 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified