Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6051–6075 of 10817 papers

Title	Date	Tasks	Status
Detect, Retrieve, Comprehend: A Flexible Framework for Zero-Shot Document-Level Question Answering	Oct 4, 2022	Question AnsweringRetrieval	—Unverified
Mining Duplicate Questions of Stack Overflow	Oct 4, 2022	Community Question AnsweringQuestion Answering	—Unverified
Extending Compositional Attention Networks for Social Reasoning in Videos	Oct 3, 2022	Question AnsweringVideo Question Answering	CodeCode Available
Russian Web Tables: A Public Corpus of Web Tables for Russian Language Based on Wikipedia	Oct 3, 2022	Knowledge Base ConstructionManagement	CodeCode Available
Understanding Prior Bias and Choice Paralysis in Transformer-based Language Representation Models through Four Experimental Probes	Oct 3, 2022	Decision MakingMultiple-choice	—Unverified
How Relevant is Selective Memory Population in Lifelong Language Learning?	Oct 3, 2022	Lifelong learningQuestion Answering	—Unverified
CMQA: A Dataset of Conditional Question Answering with Multiple-Span Answers	Oct 1, 2022	Question Answering	CodeCode Available
Focus on FoCus: Is FoCus focused on Context, Knowledge and Persona?	Oct 1, 2022	Dialogue GenerationQuestion Answering	—Unverified
ArT: All-round Thinker for Unsupervised Commonsense Question Answering	Oct 1, 2022	AllQuestion Answering	CodeCode Available
Findings of the VarDial Evaluation Campaign 2022	Oct 1, 2022	Dialect IdentificationExtractive Question-Answering	CodeCode Available
Aligning Multilingual Embeddings for Improved Code-switched Natural Language Understanding	Oct 1, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Are Visual-Linguistic Models Commonsense Knowledge Bases?	Oct 1, 2022	Natural Language UnderstandingQuestion Answering	CodeCode Available
Type-dependent Prompt CycleQAG : Cycle Consistency for Multi-hop Question Generation	Oct 1, 2022	Answer GenerationLogical Reasoning	—Unverified
CausalQA: A Benchmark for Causal Question Answering	Oct 1, 2022	Question Answering	CodeCode Available
Can We Guide a Multi-Hop Reasoning Language Model to Incrementally Learn at Each Single-Hop?	Oct 1, 2022	Language ModelingLanguage Modelling	CodeCode Available
Evaluating Coreference Resolvers on Community-based Question Answering: From Rule-based to State of the Art	Oct 1, 2022	Answer Selectioncoreference-resolution	CodeCode Available
Can Edge Probing Tests Reveal Linguistic Knowledge in QA Models?	Oct 1, 2022	Question Answering	—Unverified
Dual Capsule Attention Mask Network with Mutual Learning for Visual Question Answering	Oct 1, 2022	Question AnsweringVisual Question Answering	—Unverified
MRC-based Medical NER with Multi-task Learning and Multi-strategies	Oct 1, 2022	Boundary DetectionDecoder	—Unverified
A Zero-Shot Claim Detection Framework Using Question Answering	Oct 1, 2022	MisinformationObject	—Unverified
A Dual-Attention Learning Network with Word and Sentence Embedding for Medical Visual Question Answering	Oct 1, 2022	Medical Visual Question AnsweringQuestion Answering	CodeCode Available
On the Effects of Video Grounding on Language Models	Oct 1, 2022	Image CaptioningQuestion Answering	—Unverified
An Augmented Benchmark Dataset for Geometric Question Answering through Dual Parallel Text Encoding	Oct 1, 2022	Data AugmentationMath	—Unverified
In-the-Wild Video Question Answering	Oct 1, 2022	Evidence SelectionQuestion Answering	—Unverified
Noun-MWP: Math Word Problems Meet Noun Answers	Oct 1, 2022	MathQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 243 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified