Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8751–8775 of 10817 papers

Title	Date	Tasks	Status
Fortune: Formula-Driven Reinforcement Learning for Symbolic Table Reasoning in Language Models	May 29, 2025	Question AnsweringReinforcement Learning (RL)	—Unverified
Foundational Model for Electron Micrograph Analysis: Instruction-Tuning Small-Scale Language-and-Vision Assistant for Enterprise Adoption	Aug 23, 2024	Instruction FollowingKnowledge Distillation	—Unverified
Foundation Models and Adaptive Feature Selection: A Synergistic Approach to Video Question Answering	Dec 12, 2024	feature selectionLanguage Modeling	—Unverified
Foundation Models for Natural Language Processing -- Pre-trained Language Models Integrating Media	Feb 16, 2023	Question AnsweringStory Generation	—Unverified
FPAI at SemEval-2021 Task 6: BERT-MRC for Propaganda Techniques Detection	Aug 1, 2021	Data AugmentationQuestion Answering	—Unverified
FQuAD2.0: French Question Answering and knowing that you know nothing	Sep 27, 2021	ArticlesFQuAD	—Unverified
FQuAD2.0: French Question Answering and Learning When You Don’t Know	Jun 1, 2022	ArticlesFQuAD	—Unverified
FQuAD: French Question Answering Dataset	Feb 14, 2020	ArticlesFQuAD	—Unverified
FRACTAL: Fine-Grained Scoring from Aggregate Text Labels	Apr 7, 2024	MathMultiple Instance Learning	—Unverified
FrameNet+: Fast Paraphrastic Tripling of FrameNet	Jul 1, 2015	Knowledge Base PopulationNatural Language Inference	—Unverified
FrameNet on the Way to Babel: Creating a Bilingual FrameNet Using Wiktionary as Interlingual Connection	Aug 1, 2013	Cross-Lingual TransferQuestion Answering	—Unverified
Frame Semantics across Languages: Towards a Multilingual FrameNet	Aug 1, 2018	Question AnsweringSemantic Parsing	—Unverified
Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering	Sep 8, 2022	Question AnsweringVideo Question Answering	—Unverified
Frame-Voyager: Learning to Query Frames for Video Large Language Models	Oct 4, 2024	Question AnsweringVideo Question Answering	—Unverified
Framework for Question-Answering in Sanskrit through Automated Construction of Knowledge Graphs	Oct 11, 2023	Knowledge GraphsQuestion Answering	—Unverified
Framework for Weakly Supervised Causal Knowledge Extraction from Text	Jan 16, 2022	ManagementNatural Language Inference	—Unverified
Framing QA as Building and Ranking Intersentence Answer Justifications	Jun 1, 2017	Multiple-choiceQuestion Answering	—Unverified
FRAQUE: a FRAme-based QUEstion-answering system for the Public Administration domain	May 1, 2020	Question AnsweringWord Embeddings	—Unverified
Freebase QA: Information Extraction or Semantic Parsing?	Jun 1, 2014	Open Information ExtractionQuestion Answering	—Unverified
Free Form Medical Visual Question Answering in Radiology	Jan 23, 2024	DiagnosticForm	—Unverified
freePruner: A Training-free Approach for Large Multimodal Model Acceleration	Nov 23, 2024	QuantizationQuestion Answering	—Unverified
FReM: A Flexible Reasoning Mechanism for Balancing Quick and Slow Thinking in Long-Context Question Answering	Mar 29, 2025	Question Answering	—Unverified
Frequently Asked Questions Retrieval for Croatian Based on Semantic Textual Similarity	Aug 1, 2013	Question AnsweringRetrieval	—Unverified
FriendsQA: Open-Domain Question Answering on TV Show Transcripts	Sep 1, 2019	Open-Domain Question AnsweringQuestion Answering	—Unverified
From Beginner to Expert: Modeling Medical Knowledge into General LLMs	Dec 2, 2023	Language ModellingLarge Language Model	—Unverified

Show:10 25 50

← PrevPage 351 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified