Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2026–2050 of 10817 papers

Title	Date	Tasks	Status	Hype
Visual Relation Grounding in Videos	Jul 17, 2020	Question AnsweringRelation	CodeCode Available	1
Advances of Transformer-Based Models for News Headline Generation	Jul 9, 2020	Headline Generationnamed-entity-recognition	CodeCode Available	1
KQA Pro: A Dataset with Explicit Compositional Programs for Complex Question Answering over Knowledge Base	Jul 8, 2020	AttributeDiagnostic	CodeCode Available	1
Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering	Jul 2, 2020	Natural QuestionsOpen-Domain Question Answering	CodeCode Available	1
Project PIAF: Building a Native French Question-Answering Dataset	Jul 2, 2020	Question Answering	CodeCode Available	1
Asking Effective and Diverse Questions: A Machine Reading Comprehension based Framework for Joint Entity-Relation Extraction	Jul 1, 2020	DiversityMachine Reading Comprehension	CodeCode Available	1
Latent Compositional Representations Improve Systematic Generalization in Grounded Question Answering	Jul 1, 2020	Inductive BiasQuestion Answering	CodeCode Available	1
CorefQA: Coreference Resolution as Query-based Span Prediction	Jul 1, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	1
DocVQA: A Dataset for VQA on Document Images	Jul 1, 2020	Question AnsweringReading Comprehension	CodeCode Available	1
COVID-QA: A Question Answering Dataset for COVID-19	Jul 1, 2020	ArticlesQuestion Answering	CodeCode Available	1
Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings	Jul 1, 2020	Answer SelectionKnowledge Graphs	CodeCode Available	1
Transferability of Natural Language Inference to Biomedical Question Answering	Jul 1, 2020	Natural Language InferenceQuestion Answering	CodeCode Available	1
Ontology-guided Semantic Composition for Zero-Shot Learning	Jun 30, 2020	image-classificationImage Classification	CodeCode Available	1
Multi-Partition Embedding Interaction with Block Term Format for Knowledge Graph Completion	Jun 29, 2020	Graph EmbeddingKnowledge Graph Completion	CodeCode Available	1
Answering Questions on COVID-19 in Real-Time	Jun 29, 2020	Information RetrievalQuestion Answering	CodeCode Available	1
Graph Optimal Transport for Cross-Domain Alignment	Jun 26, 2020	Graph MatchingImage Captioning	CodeCode Available	1
ReCO: A Large Scale Chinese Reading Comprehension Dataset on Opinion	Jun 22, 2020	Causal InferenceChinese Reading Comprehension	CodeCode Available	1
A Qualitative Evaluation of Language Models on Automatic Question-Answering for COVID-19	Jun 19, 2020	ChatbotLanguage Modeling	CodeCode Available	1
Sparse and Continuous Attention Mechanisms	Jun 12, 2020	Machine TranslationQuestion Answering	CodeCode Available	1
Closed Loop Neural-Symbolic Learning via Integrating Neural Perception, Grammar Parsing, and Symbolic Reasoning	Jun 11, 2020	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
Large-Scale Adversarial Training for Vision-and-Language Representation Learning	Jun 11, 2020	Image-text RetrievalQuestion Answering	CodeCode Available	1
ClarQ: A large-scale and diverse dataset for Clarification Question Generation	Jun 10, 2020	Question AnsweringQuestion Generation	CodeCode Available	1
Roses Are Red, Violets Are Blue... but Should Vqa Expect Them To?	Jun 9, 2020	Question AnsweringVisual Question Answering	CodeCode Available	1
Counterfactual VQA: A Cause-Effect Look at Language Bias	Jun 8, 2020	Causal Inferencecounterfactual	CodeCode Available	1
Pre-training Polish Transformer-based Language Models at Scale	Jun 7, 2020	Machine TranslationQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 82 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified