Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5476–5500 of 10817 papers

Title	Date	Tasks	Status
DynamicVL: Benchmarking Multimodal Large Language Models for Dynamic City Understanding	May 27, 2025	BenchmarkingChange Detection	—Unverified
Dynamic Uncertainty Ranking: Enhancing In-Context Learning for Long-Tail Knowledge in LLMs	Oct 31, 2024	In-Context LearningMemorization	—Unverified
Dynamic-TinyBERT: Boost TinyBERT's Inference Efficiency by Dynamic Sequence Length	Nov 18, 2021	Computational EfficiencyHyperparameter Optimization	—Unverified
Biomedical Entity Linking with Triple-aware Pre-Training	Aug 28, 2023	Entity LinkingQuestion Answering	—Unverified
Answerability in Retrieval-Augmented Open-Domain Question Answering	Mar 3, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching	Mar 5, 2024	ChatbotCommunity Question Answering	—Unverified
Dynamic Strategy Planning for Efficient Question Answering with Large Language Models	Oct 30, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
Dynamic Stochastic Decoding Strategy for Open-Domain Dialogue Generation	Jun 12, 2024	Dialogue GenerationDiversity	—Unverified
Biomedical Document Retrieval for Clinical Decision Support System	Jul 1, 2018	Information RetrievalLearning-To-Rank	—Unverified
Answerability Fields: Answerable Location Estimation via Diffusion Models	Jul 26, 2024	Question AnsweringScene Understanding	—Unverified
Dynamic Relevance Graph Network for Knowledge-Aware Question Answering	Jan 16, 2022	Graph Neural NetworkQuestion Answering	—Unverified
Biomedical/Clinical NLP	Aug 1, 2014	Coreference ResolutionPart-Of-Speech Tagging	—Unverified
Dynamic Q&A of Clinical Documents with Large Language Models	Jan 19, 2024	ChatbotDecision Making	—Unverified
Dynamic Neural Turing Machine with Soft and Hard Addressing Schemes	Jun 30, 2016	Natural Language InferenceQuestion Answering	—Unverified
BioMedGPT: Open Multimodal Generative Pre-trained Transformer for BioMedicine	Aug 18, 2023	Few-Shot LearningLanguage Modeling	—Unverified
An Overview Of Temporal Commonsense Reasoning and Acquisition	Jul 28, 2023	Common Sense ReasoningLanguage Modelling	—Unverified
A Gaze-grounded Visual Question Answering Dataset for Clarifying Ambiguous Japanese Questions	Mar 26, 2024	Gaze Target EstimationQuestion Answering	—Unverified
A Question Answering Framework for Decontextualizing User-facing Snippets from Scientific Documents	May 24, 2023	Question AnsweringQuestion Generation	—Unverified
Dynamic Multistep Reasoning based on Video Scene Graph for Video Question Answering	Jul 1, 2022	Question AnsweringVideo Question Answering	—Unverified
DynamicMind: A Tri-Mode Thinking System for Large Language Models	Jun 6, 2025	Computational EfficiencyPrompt Engineering	—Unverified
BioMedBERT: A Pre-trained Biomedical Language Model for QA and IR	Dec 10, 2020	ArticlesInformation Retrieval	—Unverified
An Overview of Distant Supervision for Relation Extraction with a Focus on Denoising and Pre-training Methods	Jul 17, 2022	DenoisingKnowledge Graph Completion	—Unverified
Dynamic Knowledge Integration for Enhanced Vision-Language Reasoning	Jan 15, 2025	Question AnsweringVisual Question Answering	—Unverified
Dynamic Neuro-Symbolic Knowledge Graph Construction for Zero-shot Commonsense Question Answering	Nov 10, 2019	graph constructionKnowledge Graphs	—Unverified
Dynamic Knowledge-Base Alignment for Coreference Resolution	Aug 1, 2013	coreference-resolutionCoreference Resolution	—Unverified

Show:10 25 50

← PrevPage 220 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified