Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6726–6750 of 10817 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning from Reformulations in Conversational Question Answering over Knowledge Graphs	May 11, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	1
Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules	May 11, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
Cross-Modal Generative Augmentation for Visual Question Answering	May 11, 2021	Data AugmentationQuestion Answering	—Unverified	0
Improving Factual Consistency of Abstractive Summarization via Question Answering	May 10, 2021	Abstractive Text SummarizationQuestion Answering	CodeCode Available	1
Recent Advances in Deep Learning Based Dialogue Systems: A Systematic Survey	May 10, 2021	Information RetrievalQuestion Answering	—Unverified	0
ExpMRC: Explainability Evaluation for Machine Reading Comprehension	May 10, 2021	Machine Reading ComprehensionMulti-Choice MRC	CodeCode Available	1
ReadTwice: Reading Very Large Documents with Memories	May 10, 2021	Question Answering	—Unverified	0
Inter-GPS: Interpretable Geometry Problem Solving with Formal Language and Symbolic Reasoning	May 10, 2021	Arithmetic ReasoningGeometry Problem Solving	CodeCode Available	1
Passage Retrieval for Outside-Knowledge Visual Question Answering	May 9, 2021	Image CaptioningObject	CodeCode Available	1
Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents	May 9, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
D2S: Document-to-Slide Generation Via Query-Based Text Summarization	May 8, 2021	BenchmarkingLong Form Question Answering	CodeCode Available	1
A Dataset of Information-Seeking Questions and Answers Anchored in Research Papers	May 7, 2021	Evidence SelectionQuestion Answering	CodeCode Available	1
Diff-Explainer: Differentiable Convex Optimization for Explainable Multi-hop Inference	May 7, 2021	Multi-hop Question AnsweringNatural Language Inference	—Unverified	0
Towards General Natural Language Understanding with Probabilistic Worldbuilding	May 6, 2021	Natural Language UnderstandingQuestion Answering	CodeCode Available	1
Learning to Perturb Word Embeddings for Out-of-distribution QA	May 6, 2021	Data AugmentationDomain Generalization	CodeCode Available	1
Proposal-free One-stage Referring Expression via Grid-Word Cross-Attention	May 5, 2021	Question AnsweringReferring Expression	—Unverified	0
Rethinking Search: Making Domain Experts out of Dilettantes	May 5, 2021	Information RetrievalQuestion Answering	—Unverified	0
AdaVQA: Overcoming Language Priors with Adapted Margin Cosine Loss	May 5, 2021	Question AnsweringVisual Question Answering	CodeCode Available	0
Semantic Modeling for Food Recommendation Explanations	May 4, 2021	Food recommendationKnowledge Base Question Answering	—Unverified	0
Conversational Machine Reading Comprehension for Vietnamese Healthcare Texts	May 4, 2021	ArticlesChatbot	CodeCode Available	0
Iterated learning for emergent systematicity in VQA	May 3, 2021	Question AnsweringSystematic Generalization	—Unverified	0
Unreasonable Effectiveness of Rule-Based Heuristics in Solving Russian SuperGLUE Tasks	May 3, 2021	Common Sense ReasoningNatural Language Inference	—Unverified	0
A survey on VQA_Datasets and Approaches	May 2, 2021	Question AnsweringSurvey	—Unverified	0
Towards Bengali Word Embedding: Corpus Creation, Intrinsic and Extrinsic Evaluations	May 1, 2021	Document ClassificationInformation Retrieval	—Unverified	0
When to Fold'em: How to answer Unanswerable questions	May 1, 2021	Language ModelingLanguage Modelling	CodeCode Available	1

Show:10 25 50

← PrevPage 270 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified