Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7576–7600 of 10817 papers

Title	Date	Tasks	Status	Hype
Context-based Transformer Models for Answer Sentence Selection	Jun 1, 2020	Question AnsweringSentence	—Unverified	0
Probing Emergent Semantics in Predictive Agents via Question Answering	Jun 1, 2020	DecoderQuestion Answering	—Unverified	0
Multimodal grid features and cell pointers for Scene Text Visual Question Answering	Jun 1, 2020	Question AnsweringVisual Question Answering	—Unverified	0
Structured Multimodal Attentions for TextVQA	Jun 1, 2020	Graph AttentionOptical Character Recognition (OCR)	CodeCode Available	1
Conversational Machine Comprehension: a Literature Review	Jun 1, 2020	Machine Reading ComprehensionNatural Language Understanding	—Unverified	0
Efficient Deployment of Conversational Natural Language Interfaces over Databases	May 31, 2020	ChatbotQuestion Answering	—Unverified	0
Improving Quality of a Post's Set of Answers in Stack Overflow	May 30, 2020	Community Question AnsweringQuestion Answering	CodeCode Available	0
Using Large Pretrained Language Models for Answering User Queries from Product Specifications	May 29, 2020	Question Answering	—Unverified	0
Language Models are Few-Shot Learners	May 28, 2020	answerability predictionArticles	CodeCode Available	3
Generating Diverse and Consistent QA pairs from Contexts with Information-Maximizing Hierarchical Conditional VAEs	May 28, 2020	Question-Answer-GenerationQuestion Answering	CodeCode Available	1
English Intermediate-Task Training Improves Zero-Shot Cross-Lingual Transfer Too	May 26, 2020	Cross-Lingual TransferHellaSwag	—Unverified	0
Refining Implicit Argument Annotation for UCCA	May 26, 2020	Coreference ResolutionNatural Language Understanding	—Unverified	0
History-Aware Question Answering in a Blocks World Dialogue System	May 26, 2020	Natural Language UnderstandingQuestion Answering	—Unverified	0
Generating Semantically Valid Adversarial Questions for TableQA	May 26, 2020	Adversarial AttackQuestion Answering	—Unverified	0
Knowledge Graph Simple Question Answering for Unseen Domains	May 25, 2020	Domain AdaptationQuestion Answering	CodeCode Available	1
An Audio-enriched BERT-based Framework for Spoken Multiple-choice Question Answering	May 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Open-Retrieval Conversational Question Answering	May 22, 2020	Conversational Question AnsweringConversational Search	CodeCode Available	1
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks	May 22, 2020	Fact VerificationQuestion Answering	CodeCode Available	4
A Complex KBQA System using Multiple Reasoning Paths	May 22, 2020	Natural Language UnderstandingQuestion Answering	—Unverified	0
Comparative Study of Machine Learning Models and BERT on SQuAD	May 22, 2020	BIG-bench Machine LearningQuestion Answering	CodeCode Available	0
Fluent Response Generation for Conversational Question Answering	May 21, 2020	Conversational Question AnsweringData Augmentation	CodeCode Available	1
RuBQ: A Russian Dataset for Question Answering over Wikidata	May 21, 2020	Entity LinkingKnowledge Base Question Answering	CodeCode Available	1
Functorial Language Games for Question Answering	May 19, 2020	Question Answering	—Unverified	0
On the Value of Out-of-Distribution Testing: An Example of Goodhart's Law	May 19, 2020	Model SelectionQuestion Answering	—Unverified	0
Towards Question Format Independent Numerical Reasoning: A Set of Prerequisite Tasks	May 18, 2020	Natural Language InferenceQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 304 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified