Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6626–6650 of 10817 papers

Title	Date	Tasks	Status
Multilingual Supervision of Semantic Annotation	Dec 1, 2016	Question AnsweringRelation Extraction	—Unverified
HiQA: A Hierarchical Contextual Augmentation RAG for Multi-Documents QA	Feb 1, 2024	HallucinationLanguage Modeling	—Unverified
Multilingual Transfer Learning for QA Using Translation as Data Augmentation	Dec 10, 2020	Cross-Lingual TransferData Augmentation	—Unverified
Multilingual Universal Sentence Encoder for Semantic Retrieval	Jul 9, 2019	Question AnsweringRetrieval	—Unverified
Multilingual WSD-like Constraints for Paraphrase Extraction	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Context-guided Triple Matching for Multiple Choice Question Answering	Sep 27, 2021	BenchmarkingMultiple-choice	—Unverified
MultiMed: Massively Multimodal and Multitask Medical Understanding	Aug 22, 2024	BenchmarkingMedical Question Answering	—Unverified
Multimodal Adaptive Distillation for Leveraging Unimodal Encoders for Vision-Language Tasks	Apr 22, 2022	Question AnsweringVisual Commonsense Reasoning	—Unverified
A Multimodal Memes Classification: A Survey and Open Research Issues	Sep 17, 2020	ClassificationGeneral Classification	—Unverified
Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models	Mar 1, 2024	BenchmarkingMathematical Reasoning	—Unverified
HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights	May 7, 2025	ArticlesContrastive Learning	—Unverified
Context Generation Improves Open Domain Question Answering	Oct 12, 2022	Language ModelingLanguage Modelling	—Unverified
Multimodal Commonsense Knowledge Distillation for Visual Question Answering	Nov 5, 2024	Knowledge DistillationQuestion Answering	—Unverified
A Training-free Sub-quadratic Cost Transformer Model Serving Framework With Hierarchically Pruned Attention	Jun 14, 2024	GPUQuestion Answering	—Unverified
Multimodal Continuous Visual Attention Mechanisms	Apr 7, 2021	ClusteringQuestion Answering	—Unverified
Multimodal Datasets and Benchmarks for Reasoning about Dynamic Spatio-Temporality in Everyday Environments	Aug 21, 2024	Question Answering	—Unverified
Multimodal DBN for Predicting High-Quality Answers in cQA portals	Aug 1, 2013	Question AnsweringText Classification	—Unverified
Hint-enhanced In-Context Learning wakes Large Language Models up for knowledge-intensive tasks	Nov 3, 2023	In-Context LearningOpen-Domain Question Answering	—Unverified
Multimodal Dialogue State Tracking By QA Approach with Data Augmentation	Jul 20, 2020	Data AugmentationDecoder	—Unverified
Context Filtering with Reward Modeling in Question Answering	Dec 16, 2024	Question Answering	—Unverified
Multimodal Dual Attention Memory for Video Story Question Answering	Sep 21, 2018	Question Answering	—Unverified
Natural Language Generation at Scale: A Case Study for Open Domain Question Answering	Mar 19, 2019	DecoderKnowledge Graphs	—Unverified
Hindi Question Generation Using Dependency Structures	Jun 20, 2019	Question AnsweringQuestion Generation	—Unverified
Enhancing Multi-Image Question Answering via Submodular Subset Selection	May 15, 2025	Question AnsweringRetrieval	—Unverified
Hi, how can I help you?: Automating enterprise IT support help desks	Nov 2, 2017	ManagementNatural Language Understanding	—Unverified

Show:10 25 50

← PrevPage 266 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified