Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4926–4950 of 10817 papers

Title	Date	Tasks	Status
Integrating Vision and Language Datasets to Measure Word Concreteness	Nov 1, 2017	Image CaptioningImage Retrieval	—Unverified
PolQA: Polish Question Answering Dataset	Dec 17, 2022	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Large Language Models Can Better Understand Knowledge Graphs Than We Thought	Feb 18, 2024	Knowledge GraphsPrompt Engineering	—Unverified
Analyzing Patient Records to Establish If and When a Patient Suffered from a Medical Condition	Jun 1, 2012	Information RetrievalQuestion Answering	—Unverified
Knowledge Acquisition for Visual Question Answering via Iterative Querying	Jul 1, 2017	Question AnsweringVisual Question Answering	—Unverified
Intent Recognition in Conversational Recommender Systems	Dec 6, 2022	ChatbotFeature Engineering	—Unverified
Knowledge-Aided Open-Domain Question Answering	Jun 9, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Interactive Attention AI to translate low light photos to captions for night scene understanding in women safety	Jan 4, 2022	DecoderDeep Learning	—Unverified
Biomedical Evidence Generation Engine	Nov 11, 2019	Information RetrievalQuestion Answering	—Unverified
Improving Question Answering over Knowledge Graphs Using Graph Summarization	Mar 25, 2022	Entity EmbeddingsGraph Embedding	—Unverified
Attention is Not Always What You Need: Towards Efficient Classification of Domain-Specific Text	Mar 31, 2023	Question AnsweringSentiment Analysis	—Unverified
InteractiveIE: Towards Assessing the Strength of Human-AI Collaboration in Improving the Performance of Information Extraction	May 24, 2023	Question AnsweringQuestion Generation	—Unverified
Cross-lingual Transfer of Semantic Role Labeling Models	Aug 1, 2013	Cross-Lingual TransferLanguage Modelling	—Unverified
Improving Question Answering Model Robustness with Synthetic Adversarial Data Generation	Apr 18, 2021	Answer SelectionQuestion Answering	—Unverified
Improving Question Answering by Commonsense-Based Pre-Training	Sep 5, 2018	Question Answering	—Unverified
Counterfactual Vision-and-Language Navigation: Unravelling the Unseen	Dec 1, 2020	counterfactualEmbodied Question Answering	—Unverified
Knowing Where to Look? Analysis on Attention of Visual Question Answering System	Oct 9, 2018	Question AnsweringVisual Question Answering	—Unverified
Improving Query Graph Generation for Complex Question Answering over Knowledge Base	Nov 1, 2021	Graph GenerationQuestion Answering	—Unverified
Interactive Mongolian Question Answer Matching Model Based on Attention Mechanism in the Law Domain	Oct 1, 2022	Question Answering	—Unverified
Interactive Natural Language Query Construction for Report Generation	May 1, 2012	Question AnsweringText Generation	—Unverified
Interactive-Predictive Machine Translation based on Syntactic Constraints of Prefix	Dec 1, 2016	Machine TranslationQuestion Answering	—Unverified
Analyzing Mitigation Strategies for Catastrophic Forgetting in End-to-End Training of Spoken Language Models	May 23, 2025	Continual LearningQuestion Answering	—Unverified
Interactive Question Answering Systems: Literature Review	Sep 4, 2022	Question Answering	—Unverified
Improving QA Efficiency with DistilBERT: Fine-Tuning and Inference on mobile Intel CPUs	May 28, 2025	Computational EfficiencyCPU	—Unverified
Counterfactual Vision and Language Learning	Jun 1, 2020	counterfactualQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 198 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified