Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5901–5925 of 10817 papers

Title	Date	Tasks	Status
Towards Efficient Speech-Text Jointly Decoding within One Speech Language Model	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
Locate Then Generate: Bridging Vision and Language with Bounding Box for Scene-Text VQA	Apr 4, 2023	Answer GenerationLanguage Modelling	—Unverified
Measuring Popularity of Machine-Generated Sentences Using Term Count, Document Frequency, and Dependency Language Model	Oct 1, 2015	Language ModelingLanguage Modelling	—Unverified
ICRC-HIT: A Deep Learning based Comment Sequence Labeling System for Answer Selection Challenge	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
A Telecom-Domain Online Customer Service Assistant Based on Question Answering with Word Embedding and Intent Classification	Nov 1, 2017	General ClassificationInformation Retrieval	—Unverified
Conversational Machine Comprehension: a Literature Review	Jun 1, 2020	Machine Reading ComprehensionNatural Language Understanding	—Unverified
Measuring Domain Portability and ErrorPropagation in Biomedical QA	Sep 12, 2019	Natural QuestionsQuestion Answering	—Unverified
i-Code Studio: A Configurable and Composable Framework for Integrative AI	May 23, 2023	Question AnsweringRetrieval	—Unverified
ICL00 at SemEval-2016 Task 3: Translation-Based Method for CQA System	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
Double Retrieval and Ranking for Accurate Question Answering	Jan 16, 2022	Answer SelectionQuestion Answering	—Unverified
Logical Inference on Dependency-based Compositional Semantics	Jun 1, 2014	Question Answering	—Unverified
Logically Consistent Loss for Visual Question Answering	Nov 19, 2020	Multi-Task LearningQuestion Answering	—Unverified
Logical Parsing from Natural Language Based on a Neural Translation Model	May 9, 2017	Question AnsweringSemantic Parsing	—Unverified
Logical Story Representations via FrameNet + Semantic Parsing	Jan 16, 2022	Formal LogicQuestion Answering	—Unverified
Conversational Knowledge Teaching Agent that uses a Knowledge Base	Sep 1, 2015	Grammatical Error CorrectionKnowledge Base Question Answering	—Unverified
ICE: Idiom and Collocation Extractor for Research and Education	Apr 1, 2017	POSQuestion Answering	—Unverified
Conversational Information Seeking	Jan 21, 2022	Conversational Question AnsweringConversational Recommendation	—Unverified
Logic-in-Frames: Dynamic Keyframe Search via Visual Semantic-Logical Verification for Long Video Understanding	Mar 17, 2025	AttributeMME	—Unverified
Measuring Machine Intelligence Through Visual Question Answering	Aug 31, 2016	Image CaptioningQuestion Answering	—Unverified
An Online Question Answering System based on Sub-graph Searching	Jul 29, 2021	Answer GenerationKnowledge Graphs	—Unverified
LOIS: Looking Out of Instance Semantics for Visual Question Answering	Jul 26, 2023	Question AnsweringVisual Question Answering	—Unverified
Measuring Progress on Scalable Oversight for Large Language Models	Nov 4, 2022	Experimental DesignLanguage Modelling	—Unverified
ICDAR 2019 Competition on Scene Text Visual Question Answering	Jun 30, 2019	Question AnsweringVisual Question Answering	—Unverified
LLMs May Perform MCQA by Selecting the Least Incorrect Option	Feb 2, 2024	Multiple-choiceMultiple Choice Question Answering (MCQA)	—Unverified
Conversational Exploratory Search via Interactive Storytelling	Sep 15, 2017	Conversational SearchNavigate	—Unverified

Show:10 25 50

← PrevPage 237 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified