Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7601–7650 of 10817 papers

Title	Date	Tasks	Status	Hype
Question-Driven Summarization of Answers to Consumer Health Questions	May 18, 2020	Medical Question AnsweringQuestion Answering	CodeCode Available	1
CS-NLP team at SemEval-2020 Task 4: Evaluation of State-of-the-art NLP Deep Learning Architectures on Commonsense Reasoning Task	May 17, 2020	Multiple-choiceNatural Language Inference	—Unverified	0
Support-BERT: Predicting Quality of Question-Answer Pairs in MSDN using Deep Bidirectional Transformer	May 17, 2020	Community Question AnsweringQuestion Answering	—Unverified	0
Context-Based Quotation Recommendation	May 17, 2020	ArticlesOpen-Domain Question Answering	—Unverified	0
Visual Relationship Detection using Scene Graphs: A Survey	May 16, 2020	Graph GenerationImage Generation	—Unverified	0
COVID-Twitter-BERT: A Natural Language Processing Model to Analyse COVID-19 Content on Twitter	May 15, 2020	ClassificationGeneral Classification	CodeCode Available	1
An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named Entity Recognition	May 14, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified	0
Entity-Enriched Neural Models for Clinical Question Answering	May 13, 2020	Question Answering	CodeCode Available	1
Dense-Caption Matching and Frame-Selection Gating for Temporal Localization in VideoQA	May 13, 2020	Image CaptioningMulti-Label Classification	CodeCode Available	1
Do not let the history haunt you -- Mitigating Compounding Errors in Conversational Question Answering	May 12, 2020	Conversational Question AnsweringQuestion Answering	—Unverified	0
Cross-Modality Relevance for Reasoning on Language and Vision	May 12, 2020	Question AnsweringVisual Question Answering	CodeCode Available	1
A Self-Training Method for Machine Reading Comprehension with Soft Evidence Extraction	May 11, 2020	Machine Reading ComprehensionMulti-Choice MRC	CodeCode Available	1
Maximizing Information Gain in Partially Observable Environments via Prediction Reward	May 11, 2020	PredictionQuestion Answering	—Unverified	0
A Dataset for Statutory Reasoning in Tax Law Entailment and Question Answering	May 11, 2020	Natural Language UnderstandingQuestion Answering	CodeCode Available	1
How Context Affects Language Models' Factual Predictions	May 10, 2020	Information RetrievalLanguage Modeling	—Unverified	0
Character Matters: Video Story Understanding with Character-Aware Relations	May 9, 2020	Question Answering	—Unverified	0
Beyond Accuracy: Behavioral Testing of NLP models with CheckList	May 8, 2020	Question AnsweringSentiment Analysis	CodeCode Available	2
What Do Questions Exactly Ask? MFAE: Duplicate Question Identification with Multi-Fusion Asking Emphasis	May 7, 2020	Community Question AnsweringNatural Language Inference	CodeCode Available	1
COBRA: Contrastive Bi-Modal Representation Algorithm	May 7, 2020	Cross-Modal RetrievalImage Captioning	CodeCode Available	1
FEQA: A Question Answering Evaluation Framework for Faithfulness Assessment in Abstractive Summarization	May 7, 2020	Abstractive Text SummarizationQuestion Answering	CodeCode Available	1
Where is Linked Data in Question Answering over Linked Data?	May 7, 2020	Question Answering	—Unverified	0
DramaQA: Character-Centered Video Story Understanding with Hierarchical QA	May 7, 2020	Question AnsweringVideo Question Answering	CodeCode Available	0
CounQER: A System for Discovering and Linking Count Information in Knowledge Bases	May 7, 2020	Question Answering	CodeCode Available	0
A Large-Scale, Open-Domain, Mixed-Interface Dialogue-Based ITS for STEM	May 6, 2020	BIG-bench Machine LearningQuestion Answering	—Unverified	0
Harvesting and Refining Question-Answer Pairs for Unsupervised QA	May 6, 2020	Few-Shot LearningQuestion Answering	CodeCode Available	1
Probabilistic Assumptions Matter: Improved Models for Distantly-Supervised Document-Level Question Answering	May 5, 2020	Extractive Question-AnsweringQuestion Answering	CodeCode Available	0
MultiReQA: A Cross-Domain Evaluation for Retrieval Question Answering Models	May 5, 2020	Information RetrievalQuestion Answering	CodeCode Available	1
The Cascade Transformer: an Application for Efficient Answer Sentence Selection	May 5, 2020	General ClassificationQuestion Answering	CodeCode Available	1
CAiRE-COVID: A Question Answering and Query-focused Multi-Document Summarization System for COVID-19 Scholarly Information Management	May 4, 2020	ArticlesDocument Summarization	CodeCode Available	1
Visual Question Answering with Prior Class Semantics	May 4, 2020	Question AnsweringVisual Question Answering	—Unverified	0
DoQA -- Accessing Domain-Specific FAQs via Conversational QA	May 4, 2020	Conversational Question AnsweringInformation Retrieval	—Unverified	0
Unsupervised Alignment-based Iterative Evidence Retrieval for Multi-hop Question Answering	May 4, 2020	Evidence SelectionMulti-hop Question Answering	CodeCode Available	1
ForecastQA: A Question Answering Challenge for Event Forecasting with Temporal Text Data	May 2, 2020	Knowledge GraphsLanguage Modelling	—Unverified	0
ProtoQA: A Question Answering Dataset for Prototypical Common-Sense Reasoning	May 2, 2020	Common Sense ReasoningQuestion Answering	CodeCode Available	1
UnifiedQA: Crossing Format Boundaries With a Single QA System	May 2, 2020	Common Sense ReasoningLanguage Modeling	CodeCode Available	1
Exploring and Predicting Transferability across NLP Tasks	May 2, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Is Multihop QA in DiRe Condition? Measuring and Reducing Disconnected Reasoning	May 2, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	0
BERT-kNN: Adding a kNN Search Component to Pretrained Language Models for Better QA	May 2, 2020	Information RetrievalLanguage Modeling	CodeCode Available	1
SEEK: Segmented Embedding of Knowledge Graphs	May 2, 2020	Graph EmbeddingKnowledge Graph Embedding	CodeCode Available	1
DeFormer: Decomposing Pre-trained Transformers for Faster Question Answering	May 2, 2020	Question Answering	CodeCode Available	1
AVA: an Automatic eValuation Approach to Question Answering Systems	May 2, 2020	Question Answering	—Unverified	0
Connecting the Dots: A Knowledgeable Path Generator for Commonsense Question Answering	May 2, 2020	Knowledge GraphsLanguage Modeling	CodeCode Available	1
NeurQuRI: Neural Question Requirement Inspector for Answerability Prediction in Machine Reading Comprehension	May 1, 2020	answerability predictionMachine Reading Comprehension	—Unverified	0
Neural Symbolic Reader: Scalable Integration of Distributed and Symbolic Representations for Reading Comprehension	May 1, 2020	Data AugmentationMath	—Unverified	0
Transformer-XH: Multi-Evidence Reasoning with eXtra Hop Attention	May 1, 2020	Fact VerificationMulti-hop Question Answering	CodeCode Available	1
ScholarlyRead: A New Dataset for Scientific Article Reading Comprehension	May 1, 2020	ArticlesQuestion Answering	—Unverified	0
Chat or Learn: a Data-Driven Robust Question-Answering System	May 1, 2020	ArticlesChatbot	—Unverified	0
Evaluation of Dataset Selection for Pre-Training and Fine-Tuning Transformer Language Models for Clinical Question Answering	May 1, 2020	Machine Reading ComprehensionQuestion Answering	—Unverified	0
AIA-BDE: A Corpus of FAQs in Portuguese and their Variations	May 1, 2020	Information RetrievalNatural Language Inference	—Unverified	0
A Corpus for Visual Question Answering Annotated with Frame Semantic Information	May 1, 2020	Question AnsweringVisual Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 153 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified