Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1825 of 10817 papers

Title	Date	Tasks	Status	Hype
SciFive: a text-to-text transformer model for biomedical literature	May 28, 2021	Document ClassificationDrug–drug Interaction Extraction	CodeCode Available	1
CoSQA: 20,000+ Web Queries for Code Search and Question Answering	May 27, 2021	Code SearchContrastive Learning	CodeCode Available	1
Dynamic Semantic Graph Construction and Reasoning for Explainable Multi-hop Science Question Answering	May 25, 2021	Abstract Meaning RepresentationARC	CodeCode Available	1
Multi-modal Understanding and Generation for Medical Images and Text via Vision-Language Pre-Training	May 24, 2021	Image CaptioningMedical Visual Question Answering	CodeCode Available	1
Modeling Worlds in Text	May 21, 2021	Action ParsingKnowledge Graphs	CodeCode Available	1
Multiple Meta-model Quantifying for Medical Visual Question Answering	May 19, 2021	Medical Visual Question AnsweringMeta-Learning	CodeCode Available	1
NExT-QA:Next Phase of Question-Answering to Explaining Temporal Actions	May 18, 2021	Question AnsweringVideo Question Answering	CodeCode Available	1
TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance	May 17, 2021	Question Answering	CodeCode Available	1
Pay Attention to MLPs	May 17, 2021	Image ClassificationNatural Language Inference	CodeCode Available	1
QAConv: Question Answering on Informative Conversations	May 14, 2021	Question Answering	CodeCode Available	1
Predicting Text Readability from Scrolling Interactions	May 13, 2021	Question AnsweringReading Comprehension	CodeCode Available	1
Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules	May 11, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
Reinforcement Learning from Reformulations in Conversational Question Answering over Knowledge Graphs	May 11, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	1
Inter-GPS: Interpretable Geometry Problem Solving with Formal Language and Symbolic Reasoning	May 10, 2021	Arithmetic ReasoningGeometry Problem Solving	CodeCode Available	1
Improving Factual Consistency of Abstractive Summarization via Question Answering	May 10, 2021	Abstractive Text SummarizationQuestion Answering	CodeCode Available	1
ExpMRC: Explainability Evaluation for Machine Reading Comprehension	May 10, 2021	Machine Reading ComprehensionMulti-Choice MRC	CodeCode Available	1
Passage Retrieval for Outside-Knowledge Visual Question Answering	May 9, 2021	Image CaptioningObject	CodeCode Available	1
Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents	May 9, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
D2S: Document-to-Slide Generation Via Query-Based Text Summarization	May 8, 2021	BenchmarkingLong Form Question Answering	CodeCode Available	1
A Dataset of Information-Seeking Questions and Answers Anchored in Research Papers	May 7, 2021	Evidence SelectionQuestion Answering	CodeCode Available	1
Towards General Natural Language Understanding with Probabilistic Worldbuilding	May 6, 2021	Natural Language UnderstandingQuestion Answering	CodeCode Available	1
Learning to Perturb Word Embeddings for Out-of-distribution QA	May 6, 2021	Data AugmentationDomain Generalization	CodeCode Available	1
When to Fold'em: How to answer Unanswerable questions	May 1, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
Hidden Backdoors in Human-Centric Language Models	May 1, 2021	Language ModellingMachine Translation	CodeCode Available	1
Entailment as Few-Shot Learner	Apr 29, 2021	Contrastive LearningData Augmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 73 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified