Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1951–2000 of 10817 papers

Title	Date	Tasks	Status	Hype
Less is More: Data-Efficient Complex Question Answering over Knowledge Bases	Oct 29, 2020	DecoderMulti-hop Question Answering	CodeCode Available	1
Retrieve, Program, Repeat: Complex Knowledge Base Question Answering via Alternate Meta-learning	Oct 29, 2020	Knowledge Base Question AnsweringMeta-Learning	CodeCode Available	1
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark	Oct 29, 2020	Common Sense ReasoningDiagnostic	CodeCode Available	1
MMFT-BERT: Multimodal Fusion Transformer with BERT Encodings for Visual Question Answering	Oct 27, 2020	DiagnosticQuestion Answering	CodeCode Available	1
Measuring Association Between Labels and Free-Text Rationales	Oct 24, 2020	Decision MakingFeature Importance	CodeCode Available	1
Learning Contextualized Knowledge Structures for Commonsense Reasoning	Oct 24, 2020	Knowledge GraphsNatural Language Inference	CodeCode Available	1
RUArt: A Novel Text-Centered Solution for Text-Based Visual Question Answering	Oct 24, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1
AQuaMuSe: Automatically Generating Datasets for Query-Based Multi-Document Summarization	Oct 23, 2020	Document SummarizationMulti-Document Summarization	CodeCode Available	1
Answering Open-Domain Questions of Varying Reasoning Steps from Text	Oct 23, 2020	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Unsupervised Multi-hop Question Answering by Question Generation	Oct 23, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
mT5: A massively multilingual pre-trained text-to-text transformer	Oct 22, 2020	Common Sense ReasoningNatural Language Inference	CodeCode Available	1
XOR QA: Cross-lingual Open-Retrieval Question Answering	Oct 22, 2020	ArticlesMachine Translation	CodeCode Available	1
Removing Bias in Multi-modal Classifiers: Regularization by Maximizing Functional Entropies	Oct 21, 2020	Question AnsweringVisual Question Answering	CodeCode Available	1
RECONSIDER: Re-Ranking using Span-Focused Cross-Attention for Open Domain Question Answering	Oct 21, 2020	Machine Reading ComprehensionNatural Questions	CodeCode Available	1
Exploring Sequence-to-Sequence Models for SPARQL Pattern Composition	Oct 21, 2020	Machine TranslationQuestion Answering	CodeCode Available	1
Bayesian Attention Modules	Oct 20, 2020	Image CaptioningMachine Translation	CodeCode Available	1
Open Question Answering over Tables and Text	Oct 20, 2020	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	1
Knowledge Graph-based Question Answering with Electronic Health Records	Oct 19, 2020	Natural Language QueriesQuestion Answering	CodeCode Available	1
The RELX Dataset and Matching the Multilingual Blanks for Cross-Lingual Relation Classification	Oct 19, 2020	ClassificationGeneral Classification	CodeCode Available	1
Knowledge-guided Open Attribute Value Extraction with Reinforcement Learning	Oct 19, 2020	ArticlesAttribute	CodeCode Available	1
Delaying Interaction Layers in Transformer-based Encoders for Efficient Open Domain Question Answering	Oct 16, 2020	Information RetrievalManagement	CodeCode Available	1
Natural Language Rationales with Full-Stack Visual Reasoning: From Pixels to Semantic Frames to Commonsense Graphs	Oct 15, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Length-Adaptive Transformer: Train Once with Length Drop, Use Anytime with Search	Oct 14, 2020	ClassificationQuestion Answering	CodeCode Available	1
CoRel: Seed-Guided Topical Taxonomy Construction by Concept Learning and Relation Transferring	Oct 13, 2020	Question AnsweringRelation	CodeCode Available	1
Contrast and Classify: Training Robust VQA Models	Oct 13, 2020	Contrastive LearningData Augmentation	CodeCode Available	1
Cross-Modal BERT for Text-Audio Sentiment Analysis	Oct 12, 2020	Multimodal Sentiment AnalysisNatural Language Inference	CodeCode Available	1
Counterfactual Variable Control for Robust and Interpretable Question Answering	Oct 12, 2020	Causal Inferencecounterfactual	CodeCode Available	1
Open-Domain Question Answering Goes Conversational via Question Rewriting	Oct 10, 2020	Conversational Question AnsweringOpen-Domain Question Answering	CodeCode Available	1
AutoQA: From Databases To QA Semantic Parsers With Only Synthetic Training Data	Oct 9, 2020	AttributeNatural Questions	CodeCode Available	1
Infusing Disease Knowledge into BERT for Health Question Answering, Medical Inference and Disease Name Recognition	Oct 8, 2020	Question AnsweringWorld Knowledge	CodeCode Available	1
MOCHA: A Dataset for Training and Evaluating Generative Reading Comprehension Metrics	Oct 7, 2020	Question AnsweringReading Comprehension	CodeCode Available	1
Exposing Shallow Heuristics of Relation Extraction Models with Challenge Data	Oct 7, 2020	AttributeQuestion Answering	CodeCode Available	1
Learning to Explain: Datasets and Models for Identifying Valid Reasoning Chains in Multihop Question-Answering	Oct 7, 2020	Question AnsweringReasoning Chain Explanations	CodeCode Available	1
SRLGRN: Semantic Role Labeling Graph Reasoning Network	Oct 7, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Cross-Thought for Sentence Encoder Pre-training	Oct 7, 2020	Information RetrievalLanguage Modeling	CodeCode Available	1
Universal Natural Language Processing with Limited Annotations: Try Few-shot Textual Entailment as a Start	Oct 6, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	1
PolicyQA: A Reading Comprehension Dataset for Privacy Policies	Oct 6, 2020	Question AnsweringReading Comprehension	CodeCode Available	1
UnQovering Stereotyping Biases via Underspecified Questions	Oct 6, 2020	Question Answering	CodeCode Available	1
Neural Mask Generator: Learning to Generate Adaptive Word Maskings for Language Model Adaptation	Oct 6, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
InfoBERT: Improving Robustness of Language Models from An Information Theoretic Perspective	Oct 5, 2020	Natural Language InferenceQuestion Answering	CodeCode Available	1
LUKE: Deep Contextualized Entity Representations with Entity-aware Self-attention	Oct 2, 2020	Common Sense ReasoningEntity Typing	CodeCode Available	1
Autoregressive Entity Retrieval	Oct 2, 2020	Entity DisambiguationEntity Linking	CodeCode Available	1
MultiCQA: Zero-Shot Transfer of Self-Supervised Text Matching Models on a Massive Scale	Oct 2, 2020	Answer SelectionCommunity Question Answering	CodeCode Available	1
Towards Question-Answering as an Automatic Metric for Evaluating the Content Quality of a Summary	Oct 1, 2020	Question Answering	CodeCode Available	1
Interpreting Graph Neural Networks for NLP With Differentiable Edge Masking	Oct 1, 2020	Question AnsweringSemantic Role Labeling	CodeCode Available	1
Sequence-to-Sequence Learning for Indonesian Automatic Question Generator	Sep 29, 2020	Question AnsweringQuestion Generation	CodeCode Available	1
SPARTA: Efficient Open-Domain Question Answering via Sparse Transformer Matching Retrieval	Sep 28, 2020	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Multi-Relational Embedding for Knowledge Graph Representation and Analysis	Sep 28, 2020	Computational EfficiencyGraph Embedding	CodeCode Available	1
Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval	Sep 27, 2020	Question AnsweringRetrieval	CodeCode Available	1
X-LXMERT: Paint, Caption and Answer Questions with Multi-Modal Transformers	Sep 23, 2020	Image CaptioningImage Generation	CodeCode Available	1

Show:10 25 50

← PrevPage 40 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified