Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7601–7650 of 10817 papers

Title	Date	Tasks	Status
Data Augmentation for BERT Fine-Tuning in Open-Domain Question Answering	Apr 14, 2019	Data AugmentationOpen-Domain Question Answering	—Unverified
Automatic Claim Review for Climate Science via Explanation Generation	Jul 30, 2021	DecoderExplanation Generation	—Unverified
JEEM: Vision-Language Understanding in Four Arabic Dialects	Mar 27, 2025	Image CaptioningQuestion Answering	—Unverified
Prompt-based Conservation Learning for Multi-hop Question Answering	Sep 14, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified
Prompt-based Learning for Unpaired Image Captioning	May 26, 2022	Image CaptioningImage-text Retrieval	—Unverified
Prompt-based Personalized Federated Learning for Medical Visual Question Answering	Feb 15, 2024	Federated LearningMedical Visual Question Answering	—Unverified
JEC-QA: A Legal-Domain Question Answering Dataset	Nov 27, 2019	Question AnsweringReading Comprehension	—Unverified
DARE: Diverse Visual Question Answering with Robustness Evaluation	Sep 26, 2024	image-classificationImage Classification	—Unverified
JAIST: Combining multiple features for Answer Selection in Community Question Answering	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
Jailbreak Attacks and Defenses Against Large Language Models: A Survey	Jul 5, 2024	Code CompletionQuestion Answering	—Unverified
Jaeger: A Concatenation-Based Multi-Transformer VQA Model	Oct 11, 2023	Dimensionality Reductionmodel	—Unverified
Prompt Engineering for Healthcare: Methodologies and Applications	Apr 28, 2023	Machine TranslationPrompt Engineering	—Unverified
Danoliteracy of Generative, Large Language Models	Oct 30, 2024	Question Answering	—Unverified
Prompt Guided Copy Mechanism for Conversational Question Answering	Aug 7, 2023	Conversational Question AnsweringQuestion Answering	—Unverified
Automatic Building and Using Parallel Resources for SMT from Comparable Corpora	Apr 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Medical Knowledge Graph QA for Drug-Drug Interaction Prediction based on Multi-hop Machine Reading Comprehension	Dec 19, 2022	Entity EmbeddingsGraph Neural Network	—Unverified
Prompting Explicit and Implicit Knowledge for Multi-hop Question Answering Based on Human Reading Process	Feb 29, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
Advances in Multi-turn Dialogue Comprehension: A Survey	Mar 4, 2021	DiversityLanguage Modelling	—Unverified
Prompting Large Language Models with Knowledge Graphs for Question Answering Involving Long-tail Facts	May 10, 2024	Knowledge GraphsQuestion Answering	—Unverified
Prompting Large Language Models with Rationale Heuristics for Knowledge-based Visual Question Answering	Dec 22, 2024	Question AnsweringVisual Question Answering	—Unverified
A Collection of Question Answering Datasets for Norwegian	Jan 19, 2025	Question AnsweringWorld Knowledge	—Unverified
Prompting Large Language Models with Speech Recognition Abilities	Jul 21, 2023	Abstractive Text SummarizationAutomatic Speech Recognition	—Unverified
IXAGroupEHUSpaceEval: (X-Space) A WordNet-based approach towards the Automatic Recognition of Spatial Information following the ISO-Space Annotation Scheme	Jun 1, 2015	Coreference ResolutionNamed Entity Recognition (NER)	—Unverified
Prompting Whisper for QA-driven Zero-shot End-to-end Spoken Language Understanding	Jun 21, 2024	Cross-corpusDecoder	—Unverified
iVQA: Inverse Visual Question Answering	Oct 10, 2017	Question AnsweringQuestion Generation	—Unverified
I've got the "Answer"! Interpretation of LLMs Hidden States in Question Answering	Jun 4, 2024	Question Answering	—Unverified
DaNetQA: a yes/no Question Answering Dataset for the Russian Language	Oct 6, 2020	Question AnsweringSentence	—Unverified
PromptRefine: Enhancing Few-Shot Performance on Low-Resource Indic Languages with Example Selection from Related Example Banks	Dec 7, 2024	Cross-Lingual Question AnsweringDiversity	—Unverified
Prompt Sketching for Large Language Models	Nov 8, 2023	Arithmetic ReasoningBenchmarking	—Unverified
It was the training data pruning too!	Mar 12, 2018	Question Answering	—Unverified
It Takes Two to Tango: Towards Theory of AI's Mind	Apr 3, 2017	AttributeQuestion Answering	—Unverified
It Takes Two to Tango: Navigating Conceptualizations of NLP Tasks and Measurements of Performance	May 15, 2023	coreference-resolutionCoreference Resolution	—Unverified
Damage Assessment after Natural Disasters with UAVs: Semantic Feature Extraction using Deep Learning	Dec 14, 2024	Decision MakingQuestion Answering	—Unverified
Automatically Extracting Procedural Knowledge from Instructional Texts using Natural Language Processing	May 1, 2012	Question Answering	—Unverified
An Efficient Active Learning Framework for New Relation Types	Oct 1, 2013	Active LearningQuestion Answering	—Unverified
It Takes Three to Tango: Triangulation Approach to Answer Ranking in Community Question Answering	Nov 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
Proposal-free One-stage Referring Expression via Grid-Word Cross-Attention	May 5, 2021	Question AnsweringReferring Expression	—Unverified
Proposing Plausible Answers for Open-ended Visual Question Answering	Oct 20, 2016	Graph MatchingOpen-Ended Question Answering	—Unverified
It's High Time: A Survey of Temporal Information Retrieval and Question Answering	May 26, 2025	ArticlesInformation Retrieval	—Unverified
PropTest: Automatic Property Testing for Improved Visual Programming	Mar 25, 2024	Question AnsweringReferring Expression	—Unverified
ProQA: Structural Prompt-based Pre-training for Unified Question Answering	Jan 16, 2022	Continual LearningFew-Shot Learning	—Unverified
It's About Time: Incorporating Temporality in Retrieval Augmented Language Models	Jan 24, 2024	Few-Shot LearningHallucination	—Unverified
ITNLP-AiKF at SemEval-2016 Task 3 a quesiton answering system using community QA repository	Jun 1, 2016	Answer SelectionCommunity Question Answering	—Unverified
DAHRS: Divergence-Aware Hallucination-Remediated SRL Projection	Jul 12, 2024	fr-enHallucination	—Unverified
ProSwitch: Knowledge-Guided Instruction Tuning to Switch Between Professional and Non-Professional Responses	Mar 14, 2024	Language ModelingLanguage Modelling	—Unverified
Automatically Developing a Fine-grained Arabic Named Entity Corpus and Gazetteer by utilizing Wikipedia	Oct 1, 2013	Question AnsweringTransliteration	—Unverified
It is AI’s Turn to Ask Humans a Question: Question-Answer Pair Generation for Children’s Story Books	May 1, 2022	Answer GenerationQuestion-Answer-Generation	—Unverified
It is AI’s Turn to Ask Human a Question: Question and Answer Pair Generation for Children Storybooks in FairytaleQA Dataset	Nov 16, 2021	Answer GenerationQuestion-Answer-Generation	—Unverified
Provenance: A Light-weight Fact-checker for Retrieval Augmented LLM Generation Output	Nov 1, 2024	Fact CheckingNatural Language Inference	—Unverified
DAFE: LLM-Based Evaluation Through Dynamic Arbitration for Free-Form Question-Answering	Mar 11, 2025	FormInstruction Following	—Unverified

Show:10 25 50

← PrevPage 153 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified