Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8026–8050 of 10817 papers

Title	Date	Tasks	Status
A Vietnamese Text-Based Conversational Agent	Nov 26, 2019	Question Answering	—Unverified
A Vietnamese Question Answering System	Nov 26, 2019	Question Answering	—Unverified
Unsupervised Domain Adaptation of Language Models for Reading Comprehension	Nov 25, 2019	Domain AdaptationLanguage Modeling	—Unverified
ScienceExamCER: A High-Density Fine-Grained Science-Domain Corpus for Common Entity Recognition	Nov 24, 2019	ClassificationGeneral Classification	—Unverified
Using the Web as an Implicit Training Set: Application to Noun Compound Syntax and Semantics	Nov 23, 2019	Information RetrievalMachine Translation	—Unverified
Unsupervised Keyword Extraction for Full-sentence VQA	Nov 23, 2019	Keyword ExtractionQuestion Answering	—Unverified
An End-to-End Framework for Cold Question Routing in Community Question Answering Services	Nov 22, 2019	Community Question AnsweringGraph Embedding	—Unverified
The JDDC Corpus: A Large-Scale Multi-Turn Chinese Dialogue Dataset for E-commerce Customer Service	Nov 22, 2019	Question AnsweringRetrieval	—Unverified
Joint Learning of Answer Selection and Answer Summary Generation in Community Question Answering	Nov 22, 2019	Answer SelectionCommunity Question Answering	CodeCode Available
Interactive Text Ranking with Bayesian Optimisation: A Case Study on Community QA and Summarisation	Nov 22, 2019	Bayesian OptimisationCommunity Question Answering	CodeCode Available
Paraphrasing with Large Language Models	Nov 21, 2019	Language ModelingLanguage Modelling	—Unverified
Temporal Reasoning via Audio Question Answering	Nov 21, 2019	Audio Question AnsweringDiagnostic	CodeCode Available
Improving Conditioning in Context-Aware Sequence to Sequence Models	Nov 21, 2019	abstractive question answeringData Augmentation	—Unverified
SemanticZ at SemEval-2016 Task 3: Ranking Relevant Answers in Community Question Answering Using Semantic Similarity Based on Fine-tuned Word Embeddings	Nov 20, 2019	Community Question AnsweringQuestion Answering	CodeCode Available
Global Thread-Level Inference for Comment Classification in Community Question Answering	Nov 20, 2019	Community Question AnsweringGeneral Classification	—Unverified
Explanation vs Attention: A Two-Player Game to Obtain Attention for VQA	Nov 19, 2019	Question AnsweringVisual Question Answering	—Unverified
Unsupervised Natural Question Answering with a Small Model	Nov 19, 2019	Language ModelingLanguage Modelling	—Unverified
Multi-task Sentence Encoding Model for Semantic Retrieval in Question Answering Systems	Nov 18, 2019	intent-classificationIntent Classification	—Unverified
Quick and (not so) Dirty: Unsupervised Selection of Justification Sentences for Multi-hop Question Answering	Nov 17, 2019	ARCInformation Retrieval	—Unverified
DualVD: An Adaptive Dual Encoding Model for Deep Visual Understanding in Visual Dialogue	Nov 17, 2019	feature selectionQuestion Answering	CodeCode Available
Selection-based Question Answering of an MOOC	Nov 15, 2019	Question Answering	CodeCode Available
Question-Conditioned Counterfactual Image Generation for VQA	Nov 14, 2019	counterfactualImage Generation	—Unverified
FAQ-based Question Answering via Knowledge Anchors	Nov 14, 2019	graph constructionKnowledge Graphs	—Unverified
Adapting and evaluating a deep learning language model for clinical why-question answering	Nov 13, 2019	Language ModelingLanguage Modelling	—Unverified
Neural Duplicate Question Detection without Labeled Training Data	Nov 13, 2019	Answer SelectionCommunity Question Answering	CodeCode Available

Show:10 25 50

← PrevPage 322 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified