Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8001–8050 of 10817 papers

Title	Date	Tasks	Status
Machine Translation Evaluation Meets Community Question Answering	Dec 6, 2019	Community Question AnsweringMachine Translation	—Unverified
Weak Supervision helps Emergence of Word-Object Alignment and improves Vision-Language Tasks	Dec 6, 2019	Image RetrievalInductive Bias	—Unverified
12-in-1: Multi-Task Vision and Language Representation Learning	Dec 5, 2019	10-shot image generationImage Retrieval	CodeCode Available
An Exploration of Data Augmentation and Sampling Techniques for Domain-Agnostic Question Answering	Dec 4, 2019	Data AugmentationQuestion Answering	—Unverified
Cooperative Reasoning on Knowledge Graph and Corpus: A Multi-agentReinforcement Learning Approach	Dec 4, 2019	Question Answering	—Unverified
SemEval-2016 Task 3: Community Question Answering	Dec 3, 2019	Community Question AnsweringQuestion Answering	—Unverified
Unsupervised Inflection Generation Using Neural Language Modeling	Dec 3, 2019	Language ModelingLanguage Modelling	—Unverified
SemEval-2017 Task 3: Community Question Answering	Dec 2, 2019	Community Question AnsweringQuestion Answering	CodeCode Available
Deep Bayesian Active Learning for Multiple Correct Outputs	Dec 2, 2019	Active LearningAnswer Generation	—Unverified
TutorialVQA: Question Answering Dataset for Tutorial Videos	Dec 2, 2019	Question AnsweringVideo Question Answering	CodeCode Available
RUBi: Reducing Unimodal Biases for Visual Question Answering	Dec 1, 2019	Question AnsweringVisual Question Answering	CodeCode Available
Neural Shuffle-Exchange Networks - Sequence Processing in O(n log n) Time	Dec 1, 2019	LAMBADALanguage Modeling	CodeCode Available
Deep Human Answer Understanding for Natural Reverse QA	Dec 1, 2019	Question Answering	—Unverified
Building Discourse Parser for Thirukkural	Dec 1, 2019	EthicsInformation Retrieval	—Unverified
TAB-VCR: Tags and Attributes based VCR Baselines	Dec 1, 2019	AttributeQuestion Answering	CodeCode Available
基於特徵粒度之訓練策略於中文口語問答系統之應用 (A Feature-granularity Training Strategy for Chinese Spoken Question Answering)	Dec 1, 2019	Question Answering	—Unverified
Compositional De-Attention Networks	Dec 1, 2019	Machine TranslationNatural Language Inference	—Unverified
A Hybrid Approach Towards Two Stage Bengali Question Classification Utilizing Smart Data Balancing Technique	Nov 30, 2019	ClassificationGeneral Classification	—Unverified
A Free Lunch in Generating Datasets: Building a VQG and VQA System with Attention and Humans in the Loop	Nov 30, 2019	Question AnsweringQuestion Generation	—Unverified
Assessing the Robustness of Visual Question Answering Models	Nov 30, 2019	Question AnsweringVisual Question Answering	—Unverified
Evaluating Commonsense in Pre-trained Language Models	Nov 27, 2019	Language ModelingLanguage Modelling	CodeCode Available
Label Dependent Deep Variational Paraphrase Generation	Nov 27, 2019	Machine Reading ComprehensionParaphrase Generation	—Unverified
JEC-QA: A Legal-Domain Question Answering Dataset	Nov 27, 2019	Question AnsweringReading Comprehension	—Unverified
Transfer Learning in Visual and Relational Reasoning	Nov 27, 2019	Question AnsweringRelational Reasoning	—Unverified
SemEval-2015 Task 3: Answer Selection in Community Question Answering	Nov 26, 2019	Answer SelectionCommunity Question Answering	—Unverified
A Vietnamese Text-Based Conversational Agent	Nov 26, 2019	Question Answering	—Unverified
A Vietnamese Question Answering System	Nov 26, 2019	Question Answering	—Unverified
Unsupervised Domain Adaptation of Language Models for Reading Comprehension	Nov 25, 2019	Domain AdaptationLanguage Modeling	—Unverified
ScienceExamCER: A High-Density Fine-Grained Science-Domain Corpus for Common Entity Recognition	Nov 24, 2019	ClassificationGeneral Classification	—Unverified
Using the Web as an Implicit Training Set: Application to Noun Compound Syntax and Semantics	Nov 23, 2019	Information RetrievalMachine Translation	—Unverified
Unsupervised Keyword Extraction for Full-sentence VQA	Nov 23, 2019	Keyword ExtractionQuestion Answering	—Unverified
An End-to-End Framework for Cold Question Routing in Community Question Answering Services	Nov 22, 2019	Community Question AnsweringGraph Embedding	—Unverified
The JDDC Corpus: A Large-Scale Multi-Turn Chinese Dialogue Dataset for E-commerce Customer Service	Nov 22, 2019	Question AnsweringRetrieval	—Unverified
Joint Learning of Answer Selection and Answer Summary Generation in Community Question Answering	Nov 22, 2019	Answer SelectionCommunity Question Answering	CodeCode Available
Interactive Text Ranking with Bayesian Optimisation: A Case Study on Community QA and Summarisation	Nov 22, 2019	Bayesian OptimisationCommunity Question Answering	CodeCode Available
Paraphrasing with Large Language Models	Nov 21, 2019	Language ModelingLanguage Modelling	—Unverified
Temporal Reasoning via Audio Question Answering	Nov 21, 2019	Audio Question AnsweringDiagnostic	CodeCode Available
Improving Conditioning in Context-Aware Sequence to Sequence Models	Nov 21, 2019	abstractive question answeringData Augmentation	—Unverified
SemanticZ at SemEval-2016 Task 3: Ranking Relevant Answers in Community Question Answering Using Semantic Similarity Based on Fine-tuned Word Embeddings	Nov 20, 2019	Community Question AnsweringQuestion Answering	CodeCode Available
Global Thread-Level Inference for Comment Classification in Community Question Answering	Nov 20, 2019	Community Question AnsweringGeneral Classification	—Unverified
Explanation vs Attention: A Two-Player Game to Obtain Attention for VQA	Nov 19, 2019	Question AnsweringVisual Question Answering	—Unverified
Unsupervised Natural Question Answering with a Small Model	Nov 19, 2019	Language ModelingLanguage Modelling	—Unverified
Multi-task Sentence Encoding Model for Semantic Retrieval in Question Answering Systems	Nov 18, 2019	intent-classificationIntent Classification	—Unverified
Quick and (not so) Dirty: Unsupervised Selection of Justification Sentences for Multi-hop Question Answering	Nov 17, 2019	ARCInformation Retrieval	—Unverified
DualVD: An Adaptive Dual Encoding Model for Deep Visual Understanding in Visual Dialogue	Nov 17, 2019	feature selectionQuestion Answering	CodeCode Available
Selection-based Question Answering of an MOOC	Nov 15, 2019	Question Answering	CodeCode Available
Question-Conditioned Counterfactual Image Generation for VQA	Nov 14, 2019	counterfactualImage Generation	—Unverified
FAQ-based Question Answering via Knowledge Anchors	Nov 14, 2019	graph constructionKnowledge Graphs	—Unverified
Adapting and evaluating a deep learning language model for clinical why-question answering	Nov 13, 2019	Language ModelingLanguage Modelling	—Unverified
Neural Duplicate Question Detection without Labeled Training Data	Nov 13, 2019	Answer SelectionCommunity Question Answering	CodeCode Available

Show:10 25 50

← PrevPage 161 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified