Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7601–7625 of 10817 papers

Title	Date	Tasks	Status
JAIST: Combining multiple features for Answer Selection in Community Question Answering	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
Jailbreak Attacks and Defenses Against Large Language Models: A Survey	Jul 5, 2024	Code CompletionQuestion Answering	—Unverified
Jaeger: A Concatenation-Based Multi-Transformer VQA Model	Oct 11, 2023	Dimensionality Reductionmodel	—Unverified
Prompt-based Conservation Learning for Multi-hop Question Answering	Sep 14, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified
Prompt-based Learning for Unpaired Image Captioning	May 26, 2022	Image CaptioningImage-text Retrieval	—Unverified
Prompt-based Personalized Federated Learning for Medical Visual Question Answering	Feb 15, 2024	Federated LearningMedical Visual Question Answering	—Unverified
Danoliteracy of Generative, Large Language Models	Oct 30, 2024	Question Answering	—Unverified
Automatic Building and Using Parallel Resources for SMT from Comparable Corpora	Apr 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Medical Knowledge Graph QA for Drug-Drug Interaction Prediction based on Multi-hop Machine Reading Comprehension	Dec 19, 2022	Entity EmbeddingsGraph Neural Network	—Unverified
Advances in Multi-turn Dialogue Comprehension: A Survey	Mar 4, 2021	DiversityLanguage Modelling	—Unverified
A Collection of Question Answering Datasets for Norwegian	Jan 19, 2025	Question AnsweringWorld Knowledge	—Unverified
Prompt Engineering for Healthcare: Methodologies and Applications	Apr 28, 2023	Machine TranslationPrompt Engineering	—Unverified
IXAGroupEHUSpaceEval: (X-Space) A WordNet-based approach towards the Automatic Recognition of Spatial Information following the ISO-Space Annotation Scheme	Jun 1, 2015	Coreference ResolutionNamed Entity Recognition (NER)	—Unverified
Prompt Guided Copy Mechanism for Conversational Question Answering	Aug 7, 2023	Conversational Question AnsweringQuestion Answering	—Unverified
iVQA: Inverse Visual Question Answering	Oct 10, 2017	Question AnsweringQuestion Generation	—Unverified
I've got the "Answer"! Interpretation of LLMs Hidden States in Question Answering	Jun 4, 2024	Question Answering	—Unverified
Prompting Explicit and Implicit Knowledge for Multi-hop Question Answering Based on Human Reading Process	Feb 29, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified
DaNetQA: a yes/no Question Answering Dataset for the Russian Language	Oct 6, 2020	Question AnsweringSentence	—Unverified
Prompting Large Language Models with Knowledge Graphs for Question Answering Involving Long-tail Facts	May 10, 2024	Knowledge GraphsQuestion Answering	—Unverified
Prompting Large Language Models with Rationale Heuristics for Knowledge-based Visual Question Answering	Dec 22, 2024	Question AnsweringVisual Question Answering	—Unverified
It was the training data pruning too!	Mar 12, 2018	Question Answering	—Unverified
Prompting Large Language Models with Speech Recognition Abilities	Jul 21, 2023	Abstractive Text SummarizationAutomatic Speech Recognition	—Unverified
It Takes Two to Tango: Towards Theory of AI's Mind	Apr 3, 2017	AttributeQuestion Answering	—Unverified
Prompting Whisper for QA-driven Zero-shot End-to-end Spoken Language Understanding	Jun 21, 2024	Cross-corpusDecoder	—Unverified
It Takes Two to Tango: Navigating Conceptualizations of NLP Tasks and Measurements of Performance	May 15, 2023	coreference-resolutionCoreference Resolution	—Unverified

Show:10 25 50

← PrevPage 305 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified