Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7926–7950 of 10817 papers

Title	Date	Tasks	Status	Hype
A Vietnamese Question Answering System	Nov 26, 2019	Question Answering	—Unverified	0
Unsupervised Domain Adaptation of Language Models for Reading Comprehension	Nov 25, 2019	Domain AdaptationLanguage Modeling	—Unverified	0
Learning to Retrieve Reasoning Paths over Wikipedia Graph for Question Answering	Nov 24, 2019	Question AnsweringRetrieval	CodeCode Available	1
ScienceExamCER: A High-Density Fine-Grained Science-Domain Corpus for Common Entity Recognition	Nov 24, 2019	ClassificationGeneral Classification	—Unverified	0
Using the Web as an Implicit Training Set: Application to Noun Compound Syntax and Semantics	Nov 23, 2019	Information RetrievalMachine Translation	—Unverified	0
Unsupervised Keyword Extraction for Full-sentence VQA	Nov 23, 2019	Keyword ExtractionQuestion Answering	—Unverified	0
An End-to-End Framework for Cold Question Routing in Community Question Answering Services	Nov 22, 2019	Community Question AnsweringGraph Embedding	—Unverified	0
Joint Learning of Answer Selection and Answer Summary Generation in Community Question Answering	Nov 22, 2019	Answer SelectionCommunity Question Answering	CodeCode Available	0
Interactive Text Ranking with Bayesian Optimisation: A Case Study on Community QA and Summarisation	Nov 22, 2019	Bayesian OptimisationCommunity Question Answering	CodeCode Available	0
The JDDC Corpus: A Large-Scale Multi-Turn Chinese Dialogue Dataset for E-commerce Customer Service	Nov 22, 2019	Question AnsweringRetrieval	—Unverified	0
Improving Conditioning in Context-Aware Sequence to Sequence Models	Nov 21, 2019	abstractive question answeringData Augmentation	—Unverified	0
Paraphrasing with Large Language Models	Nov 21, 2019	Language ModelingLanguage Modelling	—Unverified	0
Temporal Reasoning via Audio Question Answering	Nov 21, 2019	Audio Question AnsweringDiagnostic	CodeCode Available	0
SemanticZ at SemEval-2016 Task 3: Ranking Relevant Answers in Community Question Answering Using Semantic Similarity Based on Fine-tuned Word Embeddings	Nov 20, 2019	Community Question AnsweringQuestion Answering	CodeCode Available	0
Global Thread-Level Inference for Comment Classification in Community Question Answering	Nov 20, 2019	Community Question AnsweringGeneral Classification	—Unverified	0
Explanation vs Attention: A Two-Player Game to Obtain Attention for VQA	Nov 19, 2019	Question AnsweringVisual Question Answering	—Unverified	0
Unsupervised Natural Question Answering with a Small Model	Nov 19, 2019	Language ModelingLanguage Modelling	—Unverified	0
Multi-task Sentence Encoding Model for Semantic Retrieval in Question Answering Systems	Nov 18, 2019	intent-classificationIntent Classification	—Unverified	0
Quick and (not so) Dirty: Unsupervised Selection of Justification Sentences for Multi-hop Question Answering	Nov 17, 2019	ARCInformation Retrieval	—Unverified	0
DualVD: An Adaptive Dual Encoding Model for Deep Visual Understanding in Visual Dialogue	Nov 17, 2019	feature selectionQuestion Answering	CodeCode Available	0
Inductive Relation Prediction by Subgraph Reasoning	Nov 16, 2019	Graph EmbeddingGraph Neural Network	CodeCode Available	1
Selection-based Question Answering of an MOOC	Nov 15, 2019	Question Answering	CodeCode Available	0
Question-Conditioned Counterfactual Image Generation for VQA	Nov 14, 2019	counterfactualImage Generation	—Unverified	0
FAQ-based Question Answering via Knowledge Anchors	Nov 14, 2019	graph constructionKnowledge Graphs	—Unverified	0
Adapting and evaluating a deep learning language model for clinical why-question answering	Nov 13, 2019	Language ModelingLanguage Modelling	—Unverified	0

Show:10 25 50

← PrevPage 318 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified