Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7076–7100 of 10817 papers

Title	Date	Tasks	Status
On the effectiveness of small, discriminatively pre-trained language representation models for biomedical text mining	Nov 1, 2020	Domain AdaptationGPU	—Unverified
On the Effects of Video Grounding on Language Models	Oct 1, 2022	Image CaptioningQuestion Answering	—Unverified
Knowledge Base Completion using Web-Based Question Answering and Multimodal Fusion	Nov 14, 2022	Knowledge Base CompletionQuestion Answering	—Unverified
deepCybErNet at EmoInt-2017: Deep Emotion Intensities in Tweets	Sep 1, 2017	Emotion ClassificationNatural Language Inference	—Unverified
Knowledge-Aware Reasoning over Multimodal Semi-structured Tables	Aug 25, 2024	Multimodal ReasoningQuestion Answering	—Unverified
Knowledge-Aware Language Model Pretraining	Jun 29, 2020	Knowledge ProbingLanguage Modeling	—Unverified
Deep Contextualized Pairwise Semantic Similarity for Arabic Language Questions	Sep 19, 2019	Community Question AnsweringQuestion Answering	—Unverified
On-the-fly Text Retrieval for End-to-End ASR Adaptation	Mar 20, 2023	Language ModelingLanguage Modelling	—Unverified
On the General Value of Evidence, and Bilingual Scene-Text Visual Question Answering	Feb 24, 2020	Question AnsweringReferring Expression	—Unverified
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems	Mar 17, 2025	Evidence SelectionLarge Language Model	—Unverified
On the Hardness of Faithful Chain-of-Thought Reasoning in Large Language Models	Jun 15, 2024	In-Context LearningQuestion Answering	—Unverified
Knowledge-Aware Diverse Reranking for Cross-Source Question Answering	Jun 25, 2025	Question AnsweringRAG	—Unverified
Deep Contextualized Biomedical Abbreviation Expansion	Jun 8, 2019	Information RetrievalQuestion Answering	—Unverified
AutoRev: Automatic Peer Review System for Academic Research Papers	May 20, 2025	Question AnsweringReview Generation	—Unverified
Knowledge-Augmented Language Models Interpreting Structured Chest X-Ray Findings	May 3, 2025	Question AnsweringVisual Question Answering	—Unverified
Knowledge-Augmented Language Model Prompting for Zero-Shot Knowledge Graph Question Answering	Jun 7, 2023	Graph Question AnsweringLanguage Modeling	—Unverified
On the Importance of Diversity in Question Generation for QA	Jul 1, 2020	DiversityQuestion Answering	—Unverified
On the importance of pre-training data volume for compact language models	Oct 8, 2020	FQuADLanguage Modeling	—Unverified
Knowledge as A Bridge: Improving Cross-domain Answer Selection with External Knowledge	Aug 1, 2018	Answer SelectionInformation Retrieval	—Unverified
On the Intrinsic Self-Correction Capability of LLMs: Uncertainty and Latent Concept	Jun 4, 2024	Question AnsweringSafety Alignment	—Unverified
On the Limitations of Vision-Language Models in Understanding Image Transforms	Mar 12, 2025	Question AnsweringVideo Generation	—Unverified
Deep Cognitive Reasoning Network for Multi-hop Question Answering over Knowledge Graphs	Aug 1, 2021	Knowledge GraphsMulti-hop Question Answering	—Unverified
Knowledge AI: Fine-tuning NLP Models for Facilitating Scientific Knowledge Extraction and Understanding	Aug 4, 2024	named-entity-recognitionNamed Entity Recognition	—Unverified
Knowledge-Aided Open-Domain Question Answering	Jun 9, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Knowledge Acquisition for Visual Question Answering via Iterative Querying	Jul 1, 2017	Question AnsweringVisual Question Answering	—Unverified

Show:10 25 50

← PrevPage 284 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified