Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5351–5375 of 10817 papers

Title	Date	Tasks	Status	Hype
A Novel DeBERTa-based Model for Financial Question Answering Task	Jul 12, 2022	Language ModelingLanguage Modelling	—Unverified	0
Video Graph Transformer for Video Question Answering	Jul 12, 2022	Question AnsweringRelation	CodeCode Available	1
Effective Few-Shot Named Entity Linking by Meta-Learning	Jul 12, 2022	Entity LinkingKnowledge Base Completion	CodeCode Available	0
A Survey on Table Question Answering: Recent Advances	Jul 12, 2022	Question AnsweringSemantic Parsing	—Unverified	0
ViQuAE, a Dataset for Knowledge-based Visual Question Answering about Named Entities	Jul 11, 2022	ArticlesFew-Shot Learning	CodeCode Available	1
Embedding Recycling for Language Models	Jul 11, 2022	Question AnsweringText Classification	CodeCode Available	1
OmniTab: Pretraining with Natural and Synthetic Data for Few-shot Table-based Question Answering	Jul 8, 2022	Question AnsweringRetrieval	CodeCode Available	1
Crake: Causal-Enhanced Table-Filler for Question Answering over Large Scale Knowledge Base	Jul 8, 2022	Question AnsweringRelation Extraction	CodeCode Available	0
OVQA: A Clinically Generated Visual Question Answering Dataset	Jul 7, 2022	BenchmarkingMedical Visual Question Answering	—Unverified	0
Active Learning and Multi-label Classification for Ellipsis and Coreference Detection in Conversational Question-Answering	Jul 7, 2022	Active LearningConversational Question Answering	—Unverified	0
CoQAR: Question Rewriting on CoQA	Jul 7, 2022	Conversational Question AnsweringForm	CodeCode Available	1
BioTABQA: Instruction Learning for Biomedical Table Question Answering	Jul 6, 2022	Question Answering	—Unverified	0
Knowing Earlier what Right Means to You: A Comprehensive VQA Dataset for Grounding Relative Directions via Multi-Task Learning	Jul 6, 2022	DiagnosticMulti-Task Learning	CodeCode Available	0
Ask Me What You Need: Product Retrieval using Knowledge from GPT-3	Jul 6, 2022	Common Sense ReasoningQuestion Answering	—Unverified	0
Weakly Supervised Grounding for VQA in Vision-Language Transformers	Jul 5, 2022	Question AnsweringRepresentation Learning	CodeCode Available	1
Vision-and-Language Pretraining	Jul 5, 2022	Diversityimage-classification	CodeCode Available	0
Topic Community Based Temporal Expertise for Question Routing	Jul 5, 2022	Question Answering	—Unverified	0
Cross-Lingual QA as a Stepping Stone for Monolingual Open QA in Icelandic	Jul 5, 2022	Language ModelingLanguage Modelling	—Unverified	0
PReGAN: Answer Oriented Passage Ranking with Weakly Supervised GAN	Jul 5, 2022	Passage RankingPassage Reranking	—Unverified	0
MIA 2022 Shared Task Submission: Leveraging Entity Representations, Dense-Sparse Hybrids, and Fusion-in-Decoder for Cross-Lingual Question Answering	Jul 5, 2022	Cross-Lingual Question AnsweringDecoder	—Unverified	0
Discourse-Aware Graph Networks for Textual Logical Reasoning	Jul 4, 2022	graph constructionLogical Reasoning	—Unverified	0
Rationale-Augmented Ensembles in Language Models	Jul 2, 2022	In-Context LearningPrompt Engineering	—Unverified	0
INSCIT: Information-Seeking Conversations with Mixed-Initiative Interactions	Jul 2, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
MIA 2022 Shared Task: Evaluating Cross-lingual Open-Retrieval Question Answering for 16 Diverse Languages	Jul 2, 2022	Question AnsweringRetrieval	—Unverified	0
ANEC: An Amharic Named Entity Corpus and Transformer Based Recognizer	Jul 2, 2022	imbalanced classificationInformation Retrieval	—Unverified	0

Show:10 25 50

← PrevPage 215 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified