Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6851–6875 of 10817 papers

Title	Date	Tasks	Status
C-MORE: Pretraining to Answer Open-Domain Questions by Consulting Millions of References	Oct 16, 2021	Open-Domain Question AnsweringQuestion Answering	—Unverified
xGQA: Cross-Lingual Visual Question Answering	Oct 16, 2021	Cross-Lingual TransferLanguage Modeling	—Unverified
Challenges in Generalization in Open Domain Question Answering	Oct 16, 2021	Natural QuestionsOpen-Domain Question Answering	—Unverified
Explore before Moving: A Feasible Path Estimation and Memory Recalling Framework for Embodied Navigation	Oct 16, 2021	Common Sense ReasoningEmbodied Question Answering	—Unverified
Explainable Assessment of Healthcare Articles with QA	Oct 16, 2021	ArticlesExplanation Generation	—Unverified
Evaluation of Transfer Learning for Polish with a text-to-text model	Oct 16, 2021	DecoderDenoising	—Unverified
Echo-Attention: Attend Once and Get N Attentions for Free	Oct 16, 2021	Language ModelingLanguage Modelling	—Unverified
A Copy-Augmented Generative Model for Open-Domain Question Answering	Oct 16, 2021	Natural QuestionsOpen-Domain Question Answering	—Unverified
Ditch the Gold Standard: Re-evaluating Conversational Question Answering	Oct 16, 2021	Conversational Question AnsweringQuestion Answering	—Unverified
Learning Rich Representation of Keyphrases from Text	Oct 16, 2021	Abstractive Text SummarizationKeyphrase Extraction	—Unverified
Pro-KD: Progressive Distillation by Following the Footsteps of the Teacher	Oct 16, 2021	image-classificationImage Classification	—Unverified
Cross-lingual Inference with A Chinese Entailment Graph	Oct 16, 2021	Entity TypingQuestion Answering	—Unverified
Semantic Search as Extractive Paraphrase Span Detection	Oct 16, 2021	Extractive Question-AnsweringQuestion Answering	—Unverified
Cooperative Semi-Supervised Transfer Learning of Machine Reading Comprehension	Oct 16, 2021	Extractive Question-AnsweringMachine Reading Comprehension	—Unverified
HiTab: A Hierarchical Table Dataset for Question Answering and Natural Language Generation	Oct 16, 2021	Entity AlignmentQuestion Answering	—Unverified
Towards Transparent Interactive Semantic Parsing via Step-by-Step Correction	Oct 15, 2021	Question AnsweringSemantic Parsing	CodeCode Available
Attacking Open-domain Question Answering by Injecting Misinformation	Oct 15, 2021	MisinformationOpen-Domain Question Answering	CodeCode Available
A Survey on State-of-the-art Techniques for Knowledge Graphs Construction and Challenges ahead	Oct 15, 2021	Knowledge GraphsLogical Reasoning	—Unverified
Cross-Lingual Open-Domain Question Answering with Answer Sentence Generation	Oct 14, 2021	Answer GenerationGenerative Question Answering	—Unverified
Retrieval-guided Counterfactual Generation for QA	Oct 14, 2021	counterfactualData Augmentation	—Unverified
MMIU: Dataset for Visual Intent Understanding in Multimodal Assistants	Oct 13, 2021	intent-classificationIntent Classification	—Unverified
Open-Domain Question-Answering for COVID-19 and Other Emergent Domains	Oct 13, 2021	DiversityMisinformation	CodeCode Available
Improving Users' Mental Model with Attention-directed Counterfactual Edits	Oct 13, 2021	counterfactualQuestion Answering	—Unverified
Systematic Inequalities in Language Technology Performance across the World's Languages	Oct 13, 2021	Dependency ParsingMachine Translation	CodeCode Available
Mention Memory: incorporating textual knowledge into Transformers through entity mention attention	Oct 12, 2021	Claim VerificationNatural Language Understanding	CodeCode Available

Show:10 25 50

← PrevPage 275 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified