Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6776–6800 of 10817 papers

Title	Date	Tasks	Status	Hype
When Does Pretraining Help? Assessing Self-Supervised Learning for Law and the CaseHOLD Dataset	Apr 18, 2021	Multiple-choiceQuestion Answering	CodeCode Available	1
Contextualized Query Embeddings for Conversational Search	Apr 18, 2021	Conversational SearchInformation Retrieval	—Unverified	0
Generative Context Pair Selection for Multi-hop Question Answering	Apr 18, 2021	Multi-hop Question AnsweringQuestion Answering	—Unverified	0
FedNLP: Benchmarking Federated Learning Methods for Natural Language Processing Tasks	Apr 18, 2021	BenchmarkingFederated Learning	CodeCode Available	0
Case-based Reasoning for Natural Language Queries over Knowledge Bases	Apr 18, 2021	Knowledge Base Question AnsweringNatural Language Queries	—Unverified	0
Can NLI Models Verify QA Systems' Predictions?	Apr 18, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1
Cross-Task Generalization via Natural Language Crowdsourcing Instructions	Apr 18, 2021	Question Answering	CodeCode Available	2
Improving Question Answering Model Robustness with Synthetic Adversarial Data Generation	Apr 18, 2021	Answer SelectionQuestion Answering	—Unverified	0
GooAQ: Open Question Answering with Diverse Answer Types	Apr 18, 2021	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	1
ASBERT: Siamese and Triplet network embedding for open question answering	Apr 17, 2021	Answer SelectionNetwork Embedding	—Unverified	0
Multi-Perspective Abstractive Answer Summarization	Apr 17, 2021	Community Question AnsweringQuestion Answering	—Unverified	0
A Graph-guided Multi-round Retrieval Method for Conversational Open-domain Question Answering	Apr 17, 2021	Conversational Question AnsweringOpen-Domain Question Answering	—Unverified	0
Explaining Answers with Entailment Trees	Apr 17, 2021	Language ModellingQuestion Answering	CodeCode Available	1
Mobile App Tasks with Iterative Feedback (MoTIF): Addressing Task Feasibility in Interactive Visual Environments	Apr 17, 2021	Common Sense ReasoningQuestion Answering	CodeCode Available	1
BEIR: A Heterogenous Benchmark for Zero-shot Evaluation of Information Retrieval Models	Apr 17, 2021	Argument RetrievalBenchmarking	CodeCode Available	2
Joint Passage Ranking for Diverse Multi-Answer Retrieval	Apr 17, 2021	Answer GenerationDiversity	—Unverified	0
ESTER: A Machine Reading Comprehension Dataset for Event Semantic Relation Reasoning	Apr 16, 2021	Machine Reading ComprehensionNatural Language Queries	CodeCode Available	1
Q^2: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering	Apr 16, 2021	Abstractive Text SummarizationDialogue Evaluation	CodeCode Available	1
Capturing Row and Column Semantics in Transformer Based Question Answering over Tables	Apr 16, 2021	Question Answering	CodeCode Available	1
Multivalent Entailment Graphs for Question Answering	Apr 16, 2021	Question Answering	—Unverified	0
What to Pre-Train on? Efficient Intermediate Task Selection	Apr 16, 2021	Multiple-choiceQuestion Answering	CodeCode Available	1
Cross-Modal Retrieval Augmentation for Multi-Modal Classification	Apr 16, 2021	ClassificationCross-Modal Retrieval	—Unverified	0
IndoNLG: Benchmark and Resources for Evaluating Indonesian Natural Language Generation	Apr 16, 2021	Machine TranslationQuestion Answering	CodeCode Available	1
VGNMN: Video-grounded Neural Module Network to Video-Grounded Language Tasks	Apr 16, 2021	Information RetrievalQuestion Answering	—Unverified	0
Editing Factual Knowledge in Language Models	Apr 16, 2021	Fact CheckingMeta-Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 272 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified