Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6601–6625 of 10817 papers

Title	Date	Tasks	Status
Building and Exploring Semantic Equivalences Resources	May 1, 2012	Information RetrievalOpinion Mining	—Unverified
Context-guided Triple Matching for Multiple Choice Question Answering	Jan 16, 2022	BenchmarkingMultiple-choice	—Unverified
A Graph Traversal Based Approach to Answer Non-Aggregation Questions Over DBpedia	Oct 16, 2015	Question Answering	—Unverified
A Survey on Complex Knowledge Base Question Answering: Methods, Challenges and Solutions	May 25, 2021	Information RetrievalKnowledge Base Question Answering	—Unverified
Multi-Instance Learning for End-to-End Knowledge Base Question Answering	Mar 6, 2019	Knowledge Base Question AnsweringMultiple Instance Learning	—Unverified
Multi-Row, Multi-Span Distant Supervision For Table+Text Question	Dec 14, 2021	Question AnsweringReading Comprehension	—Unverified
HiQA: A Hierarchical Contextual Augmentation RAG for Multi-Documents QA	Feb 1, 2024	HallucinationLanguage Modeling	—Unverified
Multi-Level Alignments As An Extensible Representation Basis for Textual Entailment Algorithms	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Multi-Level Attention Networks for Visual Question Answering	Jul 1, 2017	Question AnsweringVisual Question Answering	—Unverified
Multi-Level Explanations for Generative Language Models	Mar 21, 2024	Question Answeringtext-classification	—Unverified
Multi-level Gated Recurrent Neural Network for Dialog Act Classification	Oct 4, 2019	ClassificationDialog Act Classification	—Unverified
Enhancing Event Causality Identification with Rationale and Structure-Aware Causal Question Answering	Mar 17, 2024	Event Causality IdentificationMultiple-choice	—Unverified
Multilingual Aliasing for Auto-Generating Proposition Banks	Dec 1, 2016	Machine TranslationQuestion Answering	—Unverified
Multilingual Answer Sentence Reranking via Automatically Translated Data	Feb 20, 2021	Question AnsweringReranking	—Unverified
Multilingual Augmentation for Robust Visual Question Answering in Remote Sensing Images	Apr 7, 2023	Contrastive LearningQuestion Answering	—Unverified
Multilingual European Language Models: Benchmarking Approaches and Challenges	Feb 18, 2025	BenchmarkingQuestion Answering	—Unverified
Multilingual Image Corpus – Towards a Multimodal and Multilingual Dataset	Jun 1, 2022	Caption Generationimage-classification	—Unverified
Multilingual Medical Question Answering and Information Retrieval for Rural Health Intelligence Access	Jun 2, 2021	Information RetrievalMedical Question Answering	—Unverified
Context-guided Triple Matching for Multiple Choice Question Answering	Sep 27, 2021	BenchmarkingMultiple-choice	—Unverified
A Multimodal Memes Classification: A Survey and Open Research Issues	Sep 17, 2020	ClassificationGeneral Classification	—Unverified
Multilingual Open QA on the MIA Shared Task	Jan 7, 2025	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
Multilingual Question Answering from Formatted Text applied to Conversational Agents	Oct 10, 2019	Extractive Question-AnsweringMachine Translation	—Unverified
HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights	May 7, 2025	ArticlesContrastive Learning	—Unverified
Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task	Apr 4, 2025	Open-Domain Question AnsweringQuestion Answering	—Unverified
Context Generation Improves Open Domain Question Answering	Oct 12, 2022	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 265 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified