Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6601–6650 of 10817 papers

Title	Date	Tasks	Status
A Multimodal Social Agent	Dec 11, 2024	Common Sense ReasoningDecision Making	—Unverified
Addressing Blind Guessing: Calibration of Selection Bias in Multiple-Choice Question Answering by Video Language Models	Oct 18, 2024	FairnessMultiple-choice	—Unverified
Natural language processing for word sense disambiguation and information extraction	Apr 5, 2020	ManagementQuestion Answering	—Unverified
HIS-GPT: Towards 3D Human-In-Scene Multimodal Understanding	Mar 17, 2025	Question AnsweringScene Understanding	—Unverified
Multi-Instance Learning for End-to-End Knowledge Base Question Answering	Mar 6, 2019	Knowledge Base Question AnsweringMultiple Instance Learning	—Unverified
Multi-Row, Multi-Span Distant Supervision For Table+Text Question	Dec 14, 2021	Question AnsweringReading Comprehension	—Unverified
Context-guided Triple Matching for Multiple Choice Question Answering	Jan 16, 2022	BenchmarkingMultiple-choice	—Unverified
Multi-Level Alignments As An Extensible Representation Basis for Textual Entailment Algorithms	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Multi-Level Attention Networks for Visual Question Answering	Jul 1, 2017	Question AnsweringVisual Question Answering	—Unverified
Multi-Level Explanations for Generative Language Models	Mar 21, 2024	Question Answeringtext-classification	—Unverified
Multi-level Gated Recurrent Neural Network for Dialog Act Classification	Oct 4, 2019	ClassificationDialog Act Classification	—Unverified
Enhancing Event Causality Identification with Rationale and Structure-Aware Causal Question Answering	Mar 17, 2024	Event Causality IdentificationMultiple-choice	—Unverified
Multilingual Aliasing for Auto-Generating Proposition Banks	Dec 1, 2016	Machine TranslationQuestion Answering	—Unverified
Multilingual Answer Sentence Reranking via Automatically Translated Data	Feb 20, 2021	Question AnsweringReranking	—Unverified
Multilingual Augmentation for Robust Visual Question Answering in Remote Sensing Images	Apr 7, 2023	Contrastive LearningQuestion Answering	—Unverified
Multilingual European Language Models: Benchmarking Approaches and Challenges	Feb 18, 2025	BenchmarkingQuestion Answering	—Unverified
Multilingual Image Corpus – Towards a Multimodal and Multilingual Dataset	Jun 1, 2022	Caption Generationimage-classification	—Unverified
Multilingual Medical Question Answering and Information Retrieval for Rural Health Intelligence Access	Jun 2, 2021	Information RetrievalMedical Question Answering	—Unverified
Enhancing Generalization in Medical Visual Question Answering Tasks via Gradient-Guided Model Perturbation	Mar 5, 2024	Data AugmentationMedical Visual Question Answering	—Unverified
A Bayesian Approach to Unsupervised Semantic Role Induction	Apr 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Multilingual Open QA on the MIA Shared Task	Jan 7, 2025	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
Multilingual Question Answering from Formatted Text applied to Conversational Agents	Oct 10, 2019	Extractive Question-AnsweringMachine Translation	—Unverified
A Survey on Complex Knowledge Base Question Answering: Methods, Challenges and Solutions	May 25, 2021	Information RetrievalKnowledge Base Question Answering	—Unverified
Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task	Apr 4, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified
Enhancing Human-Computer Interaction in Chest X-ray Analysis using Vision and Language Model with Eye Gaze Patterns	Apr 3, 2024	Language ModelingLanguage Modelling	—Unverified
Multilingual Supervision of Semantic Annotation	Dec 1, 2016	Question AnsweringRelation Extraction	—Unverified
HiQA: A Hierarchical Contextual Augmentation RAG for Multi-Documents QA	Feb 1, 2024	HallucinationLanguage Modeling	—Unverified
Multilingual Transfer Learning for QA Using Translation as Data Augmentation	Dec 10, 2020	Cross-Lingual TransferData Augmentation	—Unverified
Multilingual Universal Sentence Encoder for Semantic Retrieval	Jul 9, 2019	Question AnsweringRetrieval	—Unverified
Multilingual WSD-like Constraints for Paraphrase Extraction	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Context-guided Triple Matching for Multiple Choice Question Answering	Sep 27, 2021	BenchmarkingMultiple-choice	—Unverified
MultiMed: Massively Multimodal and Multitask Medical Understanding	Aug 22, 2024	BenchmarkingMedical Question Answering	—Unverified
Multimodal Adaptive Distillation for Leveraging Unimodal Encoders for Vision-Language Tasks	Apr 22, 2022	Question AnsweringVisual Commonsense Reasoning	—Unverified
A Multimodal Memes Classification: A Survey and Open Research Issues	Sep 17, 2020	ClassificationGeneral Classification	—Unverified
Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models	Mar 1, 2024	BenchmarkingMathematical Reasoning	—Unverified
HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights	May 7, 2025	ArticlesContrastive Learning	—Unverified
Context Generation Improves Open Domain Question Answering	Oct 12, 2022	Language ModelingLanguage Modelling	—Unverified
Multimodal Commonsense Knowledge Distillation for Visual Question Answering	Nov 5, 2024	Knowledge DistillationQuestion Answering	—Unverified
A Training-free Sub-quadratic Cost Transformer Model Serving Framework With Hierarchically Pruned Attention	Jun 14, 2024	GPUQuestion Answering	—Unverified
Multimodal Continuous Visual Attention Mechanisms	Apr 7, 2021	ClusteringQuestion Answering	—Unverified
Multimodal Datasets and Benchmarks for Reasoning about Dynamic Spatio-Temporality in Everyday Environments	Aug 21, 2024	Question Answering	—Unverified
Multimodal DBN for Predicting High-Quality Answers in cQA portals	Aug 1, 2013	Question AnsweringText Classification	—Unverified
Hint-enhanced In-Context Learning wakes Large Language Models up for knowledge-intensive tasks	Nov 3, 2023	In-Context LearningOpen-Domain Question Answering	—Unverified
Multimodal Dialogue State Tracking By QA Approach with Data Augmentation	Jul 20, 2020	Data AugmentationDecoder	—Unverified
Context Filtering with Reward Modeling in Question Answering	Dec 16, 2024	Question Answering	—Unverified
Multimodal Dual Attention Memory for Video Story Question Answering	Sep 21, 2018	Question Answering	—Unverified
Natural Language Generation at Scale: A Case Study for Open Domain Question Answering	Mar 19, 2019	DecoderKnowledge Graphs	—Unverified
Hindi Question Generation Using Dependency Structures	Jun 20, 2019	Question AnsweringQuestion Generation	—Unverified
Enhancing Multi-Image Question Answering via Submodular Subset Selection	May 15, 2025	Question AnsweringRetrieval	—Unverified
Hi, how can I help you?: Automating enterprise IT support help desks	Nov 2, 2017	ManagementNatural Language Understanding	—Unverified

Show:10 25 50

← PrevPage 133 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified