Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7676–7700 of 10817 papers

Title	Date	Tasks	Status	Hype
Progressively Pretrained Dense Corpus Index for Open-Domain Question Answering	Apr 30, 2020	Information RetrievalOpen-Domain Question Answering	CodeCode Available	1
Question Rewriting for Conversational Question Answering	Apr 30, 2020	Conversational Question AnsweringPassage Retrieval	—Unverified	0
Exploring Contextualized Neural Language Models for Temporal Dependency Parsing	Apr 30, 2020	Dependency ParsingQuestion Answering	CodeCode Available	0
RikiNet: Reading Wikipedia Pages for Natural Question Answering	Apr 30, 2020	Natural Language UnderstandingNatural Questions	—Unverified	0
Dynamic Language Binding in Relational Visual Reasoning	Apr 30, 2020	ObjectQuestion Answering	CodeCode Available	1
MAD-X: An Adapter-Based Framework for Multi-Task Cross-Lingual Transfer	Apr 30, 2020	Cross-Lingual Transfernamed-entity-recognition	CodeCode Available	2
Look at the First Sentence: Position Bias in Question Answering	Apr 30, 2020	Extractive Question-AnsweringPosition	CodeCode Available	1
An Empirical Study of Pre-trained Transformers for Arabic Information Extraction	Apr 30, 2020	Cross-Lingual TransferLanguage Modelling	CodeCode Available	1
Robust Question Answering Through Sub-part Alignment	Apr 30, 2020	Question Answering	—Unverified	0
Context based Text-generation using LSTM networks	Apr 30, 2020	ClusteringLanguage Modelling	—Unverified	0
How do Decisions Emerge across Layers in Neural Models? Interpretation with Differentiable Masking	Apr 30, 2020	PredictionQuestion Answering	CodeCode Available	1
Pragmatic Issue-Sensitive Image Captioning	Apr 29, 2020	DescriptiveImage Captioning	CodeCode Available	0
A Supervised Word Alignment Method based on Cross-Language Span Prediction using Multilingual BERT	Apr 29, 2020	Question AnsweringSentence	—Unverified	0
The Effect of Natural Distribution Shift on Question Answering Models	Apr 29, 2020	ArticlesQuestion Answering	—Unverified	0
Exploiting Structured Knowledge in Text via Graph-Guided Representation Learning	Apr 29, 2020	Entity LinkingKnowledge Base Completion	—Unverified	0
Empower Entity Set Expansion via Language Model Probing	Apr 29, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Efficient Document Re-Ranking for Transformers by Precomputing Term Representations	Apr 29, 2020	Document RankingQuestion Answering	CodeCode Available	0
SubjQA: A Dataset for Subjectivity and Review Comprehension	Apr 29, 2020	Question AnsweringSentiment Analysis	CodeCode Available	1
Event Extraction by Answering (Almost) Natural Questions	Apr 28, 2020	Event Argument ExtractionEvent Extraction	CodeCode Available	1
A Novel Attention-based Aggregation Function to Combine Vision and Language	Apr 27, 2020	General ClassificationImage Captioning	—Unverified	0
Conversational Question Answering over Passages by Leveraging Word Proximity Networks	Apr 27, 2020	Conversational Question AnsweringInformation Retrieval	CodeCode Available	1
SCDE: Sentence Cloze Dataset with High Quality Distractors From Examinations	Apr 27, 2020	Question AnsweringSentence	CodeCode Available	1
Challenge Closed-book Science Exam: A Meta-learning Based Question Answering System	Apr 26, 2020	AI2 Reasoning ChallengeARC	—Unverified	0
MATINF: A Jointly Labeled Large-Scale Dataset for Classification, Question Answering and Summarization	Apr 26, 2020	ClassificationGeneral Classification	CodeCode Available	1
Beyond 512 Tokens: Siamese Multi-depth Transformer-based Hierarchical Encoder for Long-Form Document Matching	Apr 26, 2020	ClusteringForm	CodeCode Available	0

Show:10 25 50

← PrevPage 308 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified