Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8751–8775 of 10817 papers

Title	Date	Tasks	Status
Learning to Inference Adaptively for Multimodal Large Language Models	Mar 13, 2025	HallucinationQuestion Answering	—Unverified
Learning to Initialize: Can Meta Learning Improve Cross-task Generalization in Prompt Tuning?	Feb 16, 2023	Few-Shot LearningLanguage Modeling	—Unverified
Learning to Interactively Learn and Assist	Jun 24, 2019	Imitation LearningQuestion Answering	—Unverified
Learning to Jointly Predict Ellipsis and Comparison Structures	Aug 1, 2016	Question AnsweringReading Comprehension	—Unverified
Learning to Make Inferences in a Semantic Parsing Task	Jan 1, 2016	Machine TranslationNatural Language Inference	—Unverified
Learning to Map Natural Language Statements into Knowledge Base Representations for Knowledge Base Construction	May 1, 2018	Graph EmbeddingKnowledge Base Construction	—Unverified
Learning to Model Multilingual Unrestricted Coreference in OntoNotes	Jul 1, 2012	Coreference ResolutionMachine Translation	—Unverified
Learning to Navigate Wikipedia by Taking Random Walks	Oct 31, 2022	Fact VerificationNavigate	—Unverified
Learning to Order Natural Language Texts	Aug 1, 2013	Concept-To-Text GenerationDocument Summarization	—Unverified
Learning to Order Sub-questions for Complex Question Answering	Nov 11, 2019	Question AnsweringReinforcement Learning	—Unverified
Learning to Organize Knowledge and Answer Questions with N-Gram Machines	Nov 17, 2017	Open-Domain Question AnsweringQuestion Answering	—Unverified
LEARNING TO ORGANIZE KNOWLEDGE WITH N-GRAM MACHINES	Jan 1, 2018	Language ModelingLanguage Modelling	—Unverified
Learning to Paraphrase for Question Answering	Aug 20, 2017	Question AnsweringSentence	—Unverified
Learning to Plan and Generate Text with Citations	Apr 4, 2024	Long Form Question AnsweringQuestion Answering	—Unverified
LearningToQuestion at SemEval 2017 Task 3: Ranking Similar Questions by Learning to Rank Using Rich Features	Aug 1, 2017	Information RetrievalLearning-To-Rank	—Unverified
Learning to Rank Answer Candidates for Automatic Resolution of Crossword Puzzles	Jun 1, 2014	Learning-To-RankQuestion Answering	—Unverified
Learning to Reason Iteratively and Parallelly for Complex Visual Reasoning Scenarios	Nov 20, 2024	Question AnsweringVisual Question Answering (VQA)	—Unverified
Learning to Reason Over Time: Timeline Self-Reflection for Improved Temporal Reasoning in Language Models	Apr 7, 2025	Question AnsweringScheduling	—Unverified
Neural Reasoning, Fast and Slow, for Video Question Answering	Jul 10, 2019	Natural QuestionsQuestion Answering	—Unverified
Learning to Recognize the Unseen Visual Predicates	Sep 25, 2019	Question AnsweringVisual Question Answering	—Unverified
Learning to Recover Reasoning Chains for Multi-Hop Question Answering via Cooperative Games	Apr 6, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
Learning to Rehearse in Long Sequence Memorization	Jun 2, 2021	MemorizationQuestion Answering	—Unverified
Learning to Selectively Transfer: Reinforced Transfer Learning for Deep Text Matching	Dec 30, 2018	Information RetrievalNatural Language Inference	—Unverified
Learning to Select Question-Relevant Relations for Visual Question Answering	Jun 1, 2021	Graph AttentionQuestion Answering	—Unverified
Learning to Select the Relevant History Turns in Conversational Question Answering	Aug 4, 2023	Binary ClassificationConversational Question Answering	—Unverified

Show:10 25 50

← PrevPage 351 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified