Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6651–6675 of 10817 papers

Title	Date	Tasks	Status	Hype
Learning to Select Question-Relevant Relations for Visual Question Answering	Jun 1, 2021	Graph AttentionQuestion Answering	—Unverified	0
SPARTQA: A Textual Question Answering Benchmark for Spatial Reasoning	Jun 1, 2021	Question AnsweringSpatial Reasoning	CodeCode Available	1
CLEVR\_HYP: A Challenge Dataset and Baselines for Visual Question Answering with Hypothetical Actions over Images	Jun 1, 2021	Question AnsweringVisual Question Answering	CodeCode Available	0
NAMER: A Node-Based Multitasking Framework for Multi-Hop Knowledge Base Question Answering	Jun 1, 2021	Data AugmentationKnowledge Base Question Answering	CodeCode Available	0
Adaptable and Interpretable Neural MemoryOver Symbolic Knowledge	Jun 1, 2021	Question Answering	—Unverified	0
MM-AVS: A Full-Scale Dataset for Multi-modal Summarization	Jun 1, 2021	Question Answering	—Unverified	0
Breadth First Reasoning Graph for Multi-hop Question Answering	Jun 1, 2021	Graph Neural NetworkMulti-hop Question Answering	—Unverified	0
MIMOQA: Multimodal Input Multimodal Output Question Answering	Jun 1, 2021	Question AnsweringVisual Question Answering	—Unverified	0
Discovering Better Model Architectures for Medical Query Understanding	Jun 1, 2021	modelNatural Language Inference	—Unverified	0
AVA: an Automatic eValuation Approach for Question Answering Systems	Jun 1, 2021	Question Answering	—Unverified	0
An Emotional Comfort Framework for Improving User Satisfaction in E-Commerce Customer Service Chatbots	Jun 1, 2021	Answer SelectionEmotion Classification	—Unverified	0
Improving Zero-Shot Cross-lingual Transfer for Multilingual Question Answering over Knowledge Graph	Jun 1, 2021	Bilingual Lexicon InductionCross-Lingual Transfer	—Unverified	0
If You Want to Go Far Go Together: Unsupervised Joint Candidate Evidence Retrieval for Multi-hop Question Answering	Jun 1, 2021	Answer SelectionMulti-hop Question Answering	—Unverified	0
Goodwill Hunting: Analyzing and Repurposing Off-the-Shelf Named Entity Linking Systems	Jun 1, 2021	Entity LinkingQuestion Answering	—Unverified	0
RECONSIDER: Improved Re-Ranking using Span-Focused Cross-Attention for Open Domain Question Answering	Jun 1, 2021	Machine Reading ComprehensionNatural Questions	—Unverified	0
Explainable Multi-hop Verbal Reasoning Through Internal Monologue	Jun 1, 2021	Language ModelingLanguage Modelling	—Unverified	0
EaSe: A Diagnostic Tool for VQA based on Answer Diversity	Jun 1, 2021	DiagnosticDiversity	CodeCode Available	0
Looking Beyond Sentence-Level Natural Language Inference for Question Answering and Text Summarization	Jun 1, 2021	Multiple-choiceNatural Language Inference	—Unverified	0
DeCEMBERT: Learning from Noisy Instructional Videos via Dense Captions and Entropy Minimization	Jun 1, 2021	Question AnsweringRetrieval	CodeCode Available	1
Worldly Wise (WoW) - Cross-Lingual Knowledge Fusion for Fact-based Visual Spoken-Question Answering	Jun 1, 2021	Knowledge GraphsQuestion Answering	—Unverified	0
Using Integrated Gradients and Constituency Parse Trees to explain Linguistic Acceptability learnt by BERT	Jun 1, 2021	CoLADecision Making	—Unverified	0
Game-theoretic Vocabulary Selection via the Shapley Value and Banzhaf Index	Jun 1, 2021	Document ClassificationNatural Language Inference	—Unverified	0
What Ingredients Make for an Effective Crowdsourcing Protocol for Difficult NLU Data Collection Tasks?	Jun 1, 2021	Multiple-choiceNatural Language Understanding	CodeCode Available	0
Parameter-Efficient Neural Question Answering Models via Graph-Enriched Document Representations	Jun 1, 2021	Question Answering	—Unverified	0
Question-aware Transformer Models for Consumer Health Question Summarization	Jun 1, 2021	Abstractive Text SummarizationDecoder	—Unverified	0

Show:10 25 50

← PrevPage 267 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified