Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5776–5800 of 10817 papers

Title	Date	Tasks	Status
Large-Scale Knowledge Synthesis and Complex Information Retrieval from Biomedical Documents	Feb 14, 2023	Information RetrievalKnowledge Graphs	—Unverified
STREET: A Multi-Task Structured Reasoning and Explanation Benchmark	Feb 13, 2023	Question Answering	—Unverified
Differentiable Outlier Detection Enable Robust Deep Multimodal Analysis	Feb 11, 2023	Image-text RetrievalKnowledge Graphs	CodeCode Available
Informing clinical assessment by contextualizing post-hoc explanations of risk prediction models in type-2 diabetes	Feb 11, 2023	Question Answering	—Unverified
Alloprof: a new French question-answer education dataset and its use in an information retrieval case study	Feb 10, 2023	Information RetrievalQuestion Answering	CodeCode Available
Is Multimodal Vision Supervision Beneficial to Language?	Feb 10, 2023	Image RetrievalNatural Language Understanding	CodeCode Available
Realistic Conversational Question Answering with Answer Selection based on Calibrated Confidence and Uncertainty Measurement	Feb 10, 2023	Answer SelectionConversational Question Answering	CodeCode Available
ControversialQA: Exploring Controversy in Question Answering	Feb 10, 2023	Question Answering	—Unverified
A Biomedical Knowledge Graph for Biomarker Discovery in Cancer	Feb 9, 2023	ArticlesData Integration	—Unverified
Explanation Selection Using Unlabeled Data for Chain-of-Thought Prompting	Feb 9, 2023	Mathematical ReasoningNatural Language Inference	CodeCode Available
Robust Question Answering against Distribution Shifts with Test-Time Adaptation: An Empirical Study	Feb 9, 2023	Imitation LearningQuestion Answering	CodeCode Available
ELBA: Learning by Asking for Embodied Visual Navigation and Task Completion	Feb 9, 2023	Question AnsweringVisual Navigation	—Unverified
ChatGPT versus Traditional Question Answering for Knowledge Graphs: Current Status and Future Directions Towards Knowledge Graph Chatbots	Feb 8, 2023	ChatbotKnowledge Graphs	—Unverified
A Survey on Arabic Named Entity Recognition: Past, Recent Advances, and Future Trends	Feb 7, 2023	Feature EngineeringLanguage Modeling	—Unverified
Efficient End-to-End Video Question Answering with Pyramidal Multimodal Transformer	Feb 4, 2023	Computational EfficiencyQuestion Answering	CodeCode Available
idT5: Indonesian Version of Multilingual T5 Transformer	Feb 2, 2023	Question AnsweringQuestion Generation	—Unverified
Combining Deep Neural Reranking and Unsupervised Extraction for Multi-Query Focused Summarization	Feb 2, 2023	DiversityExtractive Summarization	—Unverified
Faithful Chain-of-Thought Reasoning	Jan 31, 2023	MathMulti-hop Question Answering	CodeCode Available
CSAT‑FTCN: A Fuzzy‑Oriented Model with Contextual Self‑attention Network for Multimodal Emotion Recognition	Jan 31, 2023	Emotion RecognitionMultimodal Emotion Recognition	—Unverified
HeroNet: A Hybrid Retrieval-Generation Network for Conversational Bots	Jan 29, 2023	Multi-Task LearningQuestion Answering	CodeCode Available
BinaryVQA: A Versatile Test Set to Evaluate the Out-of-Distribution Generalization of VQA Models	Jan 28, 2023	Out-of-Distribution GeneralizationQuestion Answering	CodeCode Available
ACL-Fig: A Dataset for Scientific Figure Classification	Jan 28, 2023	ClassificationQuestion Answering	—Unverified
Understanding the Effectiveness of Very Large Language Models on Dialog Evaluation	Jan 27, 2023	Question Answering	—Unverified
Graph Attention with Hierarchies for Multi-hop Question Answering	Jan 27, 2023	Graph AttentionGraph Neural Network	—Unverified
Towards a Unified Model for Generating Answers and Explanations in Visual Question Answering	Jan 25, 2023	DecoderExplanation Generation	—Unverified

Show:10 25 50

← PrevPage 232 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified