Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5451–5475 of 10817 papers

Title	Date	Tasks	Status
Exploring and Analyzing Machine Commonsense Benchmarks	Dec 21, 2020	Common Sense ReasoningQuestion Answering	—Unverified
Promotion of Answer Value Measurement with Domain Effects in Community Question Answering Systems	Jun 1, 2019	Answer SelectionCommunity Question Answering	—Unverified
100 Things You Always Wanted to Know about Linguistics But Were Afraid to Ask*	Jun 1, 2012	Question AnsweringSentiment Analysis	—Unverified
EBMs vs. CL: Exploring Self-Supervised Visual Pretraining for Visual Question Answering	Jun 29, 2022	Contrastive LearningOut of Distribution (OOD) Detection	—Unverified
E-BERT: A Phrase and Product Knowledge Enhanced Language Model for E-commerce	Sep 7, 2020	Aspect ExtractionDenoising	—Unverified
eaVQA: An Experimental Analysis on Visual Question Answering Models	Dec 1, 2021	Question AnsweringVisual Question Answering	—Unverified
Easy Questions First? A Case Study on Curriculum Learning for Question Answering	Aug 1, 2016	Active LearningQuestion Answering	—Unverified
Biomedical Question Answering via Weighted Neural Network Passage Retrieval	Jan 9, 2018	Passage RetrievalQuestion Answering	—Unverified
Answer-checking in Context: A Multi-modal FullyAttention Network for Visual Question Answering	Oct 17, 2020	Question AnsweringVisual Question Answering	—Unverified
EarthSE: A Benchmark Evaluating Earth Scientific Exploration Capability for Large Language Models	May 22, 2025	Question AnsweringSpecificity	—Unverified
EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues	Dec 19, 2024	Change DetectionDisaster Response	—Unverified
Biomedical Question Answering via Multi-Level Summarization on a Local Knowledge Graph	Apr 2, 2025	Language ModelingLanguage Modelling	—Unverified
Biomedical Question Answering: A Survey of Approaches and Challenges	Feb 10, 2021	Information RetrievalMachine Reading Comprehension	—Unverified
Answer Candidate Type Selection: Text-to-Text Language Model for Closed Book Question Answering Meets Knowledge Graphs	Oct 10, 2023	Graph Question AnsweringKnowledge Graphs	—Unverified
EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation	Dec 6, 2024	MMEQuestion Answering	—Unverified
E3D-GPT: Enhanced 3D Visual Foundation for Medical Vision-Language Model	Oct 18, 2024	Language ModelingLanguage Modelling	—Unverified
Biomedical Multi-hop Question Answering Using Knowledge Graph Embeddings and Language Models	Nov 10, 2022	Knowledge Graph EmbeddingsKnowledge Graphs	—Unverified
Answer, Assemble, Ace: Understanding How Transformers Answer Multiple Choice Questions	Jul 21, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
A General FOFE-net Framework for Simple and Effective Question Answering over Knowledge Bases	Mar 29, 2019	Question AnsweringRelation	—Unverified
A Copy-Augmented Generative Model for Open-Domain Question Answering	Oct 16, 2021	Natural QuestionsOpen-Domain Question Answering	—Unverified
DynRsl-VLM: Enhancing Autonomous Driving Perception with Dynamic Resolution Vision-Language Models	Mar 14, 2025	Autonomous DrivingComputational Efficiency	—Unverified
Biomedical Large Languages Models Seem not to be Superior to Generalist Models on Unseen Medical Data	Aug 25, 2024	Document SummarizationGeneral Knowledge	—Unverified
DynRank: Improving Passage Retrieval with Dynamic Zero-Shot Prompting Based on Question Classification	Nov 30, 2024	Open-Domain Question AnsweringPassage Retrieval	—Unverified
DynFocus: Dynamic Cooperative Network Empowers LLMs with Video Understanding	Nov 19, 2024	Question AnsweringVideo Understanding	—Unverified
Answerable or Not: Devising a Dataset for Extending Machine Reading Comprehension	Aug 1, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 219 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified