Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4626–4650 of 10817 papers

Title	Date	Tasks	Status
Automatically Developing a Fine-grained Arabic Named Entity Corpus and Gazetteer by utilizing Wikipedia	Oct 1, 2013	Question AnsweringTransliteration	—Unverified
DAFE: LLM-Based Evaluation Through Dynamic Arbitration for Free-Form Question-Answering	Mar 11, 2025	FormInstruction Following	—Unverified
DADgraph: A Discourse-aware Dialogue Graph Neural Network for Multiparty Dialogue Machine Reading Comprehension	Apr 26, 2021	Graph Neural NetworkMachine Reading Comprehension	—Unverified
Automated Utterance Generation	Apr 7, 2020	Extractive SummarizationQuestion Answering	—Unverified
An Effective Multi-Stage Approach For Question Answering	Jul 10, 2019	Machine Reading ComprehensionNatural Language Understanding	—Unverified
Advancements and Challenges in Bangla Question Answering Models: A Comprehensive Review	Dec 16, 2024	ArticlesQuestion Answering	—Unverified
An Effective Contextual Language Modeling Framework for Speech Summarization with Augmented Features	Jun 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
ARTEMIS-DA: An Advanced Reasoning and Transformation Engine for Multi-Step Insight Synthesis in Data Analytics	Dec 18, 2024	Code GenerationInformation Retrieval	—Unverified
Cycle-Consistency for Robust Visual Question Answering	Feb 15, 2019	Question AnsweringQuestion Generation	—Unverified
Automated Testing and Improvement of Named Entity Recognition Systems	Aug 14, 2023	named-entity-recognitionNamed Entity Recognition	—Unverified
VRBench: A Benchmark for Multi-Step Reasoning in Long Narrative Videos	Jun 12, 2025	Question Answering	—Unverified
CyberBOT: Towards Reliable Cybersecurity Education via Ontology-Grounded Retrieval Augmented Generation	Apr 1, 2025	ChatbotQuestion Answering	—Unverified
Automated Story Generation as Question-Answering	Dec 7, 2021	Generative Question AnsweringLanguage Modeling	—Unverified
CVQA: Culturally-diverse Multilingual Visual Question Answering Benchmark	Jun 10, 2024	DiversityQuestion Answering	—Unverified
ANEC: An Amharic Named Entity Corpus and Transformer Based Recognizer	Jul 2, 2022	imbalanced classificationInformation Retrieval	—Unverified
A Cognitive Ideation Support Framework using IBM Watson Services	Dec 18, 2024	Question Answering	—Unverified
Interpretable AMR-Based Question Decomposition for Multi-hop Question Answering	Jun 16, 2022	Abstract Meaning RepresentationAMR-to-Text Generation	—Unverified
Interpretable Bilingual Multimodal Large Language Model for Diverse Biomedical Tasks	Oct 24, 2024	image-classificationImage Classification	—Unverified
C-VQA: A Compositional Split of the Visual Question Answering (VQA) v1.0 Dataset	Apr 26, 2017	Question AnsweringVisual Question Answering	—Unverified
Automated Historical Fact-Checking by Passage Retrieval, Word Statistics, and Virtual Question-Answering	Nov 1, 2017	Fact CheckingPassage Retrieval	—Unverified
Automated Graph Generation at Sentence Level for Reading Comprehension Based on Conceptual Graphs	Dec 1, 2020	Graph GenerationMiscellaneous	—Unverified
Cut to the Chase: A Context Zoom-in Network for Reading Comprehension	Oct 1, 2018	Question AnsweringReading Comprehension	—Unverified
A Coarse to Fine Question Answering System based on Reinforcement Learning	Jun 1, 2021	Deep Reinforcement LearningQuestion Answering	—Unverified
Internal and External Knowledge Interactive Refinement Framework for Knowledge-Intensive Question Answering	Aug 23, 2024	HallucinationQuestion Answering	—Unverified
Curriculum Script Distillation for Multilingual Visual Question Answering	Jan 17, 2023	Question AnsweringVisual Question Answering	—Unverified

Show:10 25 50

← PrevPage 186 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified