Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9151–9175 of 10817 papers

Title	Date	Tasks	Status
ICE: Idiom and Collocation Extractor for Research and Education	Apr 1, 2017	POSQuestion Answering	—Unverified
ICL00 at SemEval-2016 Task 3: Translation-Based Method for CQA System	Jun 1, 2016	Community Question AnsweringQuestion Answering	—Unverified
i-Code Studio: A Configurable and Composable Framework for Integrative AI	May 23, 2023	Question AnsweringRetrieval	—Unverified
ICRC-HIT: A Deep Learning based Comment Sequence Labeling System for Answer Selection Challenge	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
Identification of Alias Links among Participants in Narratives	Jul 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Identification of Temporal Event Relationships in Biographical Accounts	Jun 1, 2013	Question Answering	—Unverified
Identifying and Mitigating Position Bias of Multi-image Vision-Language Models	Mar 18, 2025	PositionQuestion Answering	—Unverified
Identifying Causal Relations Using Parallel Wikipedia Articles	Aug 1, 2016	ArticlesCausal Inference	—Unverified
Identifying Constant and Unique Relations by using Time-Series Text	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Identifying Nuggets of Information in GALE Distillation Evaluation	May 1, 2012	Machine TranslationQuestion Answering	—Unverified
Identifying Participation of Individual Verbs or VerbNet Classes in the Causative Alternation	Jan 1, 2019	Question Answering	—Unverified
Identifying Purpose Behind Electoral Tweets	Nov 5, 2013	Question Answering	—Unverified
Identifying Shopping Intent in Product QA for Proactive Recommendations	Apr 9, 2024	FrictionMixture-of-Experts	—Unverified
Identifying Supporting Facts for Multi-hop Question Answering with Document Graph Networks	Oct 1, 2019	Multi-hop Question AnsweringQuestion Answering	—Unverified
Identifying the Provision of Choices in Privacy Policy Text	Sep 1, 2017	Question Answering	—Unverified
Identifying Various Kinds of Event Mentions in K-Parser Output	Jun 1, 2015	Machine TranslationQuestion Answering	—Unverified
Idest: Learning a Distributed Representation for Event Patterns	May 1, 2015	ArticlesAttribute	—Unverified
idT5: Indonesian Version of Multilingual T5 Transformer	Feb 2, 2023	Question AnsweringQuestion Generation	—Unverified
IFlyLegal: A Chinese Legal System for Consultation, Law Searching, and Document Analysis	Nov 1, 2019	Natural Language InferenceQuestion Answering	—Unverified
If No Media Were Allowed inside the Venue, Was Anybody Allowed?	Apr 1, 2017	NegationQuestion Answering	—Unverified
IfQA: A Dataset for Open-domain Question Answering under Counterfactual Presuppositions	May 23, 2023	counterfactualCounterfactual Reasoning	—Unverified
If You Can't Beat Them Join Them: Handcrafted Features Complement Neural Nets for Non-Factoid Answer Reranking	Apr 1, 2017	Answer SelectionCommunity Question Answering	—Unverified
If You Want to Go Far Go Together: Unsupervised Joint Candidate Evidence Retrieval for Multi-hop Question Answering	Jun 1, 2021	Answer SelectionMulti-hop Question Answering	—Unverified
I Have Seen Enough: A Teacher Student Network for Video Classification Using Fewer Frames	May 12, 2018	ClassificationGeneral Classification	—Unverified
IHS-RD-Belarus at SemEval-2016 Task 1: Multistage Approach for Measuring Semantic Similarity	Jun 1, 2016	Information RetrievalMachine Translation	—Unverified

Show:10 25 50

← PrevPage 367 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified