Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1850 of 10817 papers

Title	Date	Tasks	Status	Hype
SciFive: a text-to-text transformer model for biomedical literature	May 28, 2021	Document ClassificationDrug–drug Interaction Extraction	CodeCode Available	1
CoSQA: 20,000+ Web Queries for Code Search and Question Answering	May 27, 2021	Code SearchContrastive Learning	CodeCode Available	1
Dynamic Semantic Graph Construction and Reasoning for Explainable Multi-hop Science Question Answering	May 25, 2021	Abstract Meaning RepresentationARC	CodeCode Available	1
Multi-modal Understanding and Generation for Medical Images and Text via Vision-Language Pre-Training	May 24, 2021	Image CaptioningMedical Visual Question Answering	CodeCode Available	1
Modeling Worlds in Text	May 21, 2021	Action ParsingKnowledge Graphs	CodeCode Available	1
Multiple Meta-model Quantifying for Medical Visual Question Answering	May 19, 2021	Medical Visual Question AnsweringMeta-Learning	CodeCode Available	1
NExT-QA:Next Phase of Question-Answering to Explaining Temporal Actions	May 18, 2021	Question AnsweringVideo Question Answering	CodeCode Available	1
Pay Attention to MLPs	May 17, 2021	Image ClassificationNatural Language Inference	CodeCode Available	1
TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance	May 17, 2021	Question Answering	CodeCode Available	1
QAConv: Question Answering on Informative Conversations	May 14, 2021	Question Answering	CodeCode Available	1
Predicting Text Readability from Scrolling Interactions	May 13, 2021	Question AnsweringReading Comprehension	CodeCode Available	1
Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules	May 11, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1
Reinforcement Learning from Reformulations in Conversational Question Answering over Knowledge Graphs	May 11, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	1
Inter-GPS: Interpretable Geometry Problem Solving with Formal Language and Symbolic Reasoning	May 10, 2021	Arithmetic ReasoningGeometry Problem Solving	CodeCode Available	1
ExpMRC: Explainability Evaluation for Machine Reading Comprehension	May 10, 2021	Machine Reading ComprehensionMulti-Choice MRC	CodeCode Available	1
Improving Factual Consistency of Abstractive Summarization via Question Answering	May 10, 2021	Abstractive Text SummarizationQuestion Answering	CodeCode Available	1
Passage Retrieval for Outside-Knowledge Visual Question Answering	May 9, 2021	Image CaptioningObject	CodeCode Available	1
Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents	May 9, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
D2S: Document-to-Slide Generation Via Query-Based Text Summarization	May 8, 2021	BenchmarkingLong Form Question Answering	CodeCode Available	1
A Dataset of Information-Seeking Questions and Answers Anchored in Research Papers	May 7, 2021	Evidence SelectionQuestion Answering	CodeCode Available	1
Learning to Perturb Word Embeddings for Out-of-distribution QA	May 6, 2021	Data AugmentationDomain Generalization	CodeCode Available	1
Towards General Natural Language Understanding with Probabilistic Worldbuilding	May 6, 2021	Natural Language UnderstandingQuestion Answering	CodeCode Available	1
When to Fold'em: How to answer Unanswerable questions	May 1, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
Hidden Backdoors in Human-Centric Language Models	May 1, 2021	Language ModellingMachine Translation	CodeCode Available	1
Entailment as Few-Shot Learner	Apr 29, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
MDETR -- Modulated Detection for End-to-End Multi-Modal Understanding	Apr 26, 2021	Generalized Referring Expression ComprehensionPhrase Grounding	CodeCode Available	1
PanGu-α: Large-scale Autoregressive Pretrained Chinese Language Models with Auto-parallel Computation	Apr 26, 2021	Cloze (multi-choices) (Few-Shot)Cloze (multi-choices) (One-Shot)	CodeCode Available	1
RelTransformer: A Transformer-Based Long-Tail Visual Relationship Recognition	Apr 24, 2021	Image CaptioningObject Recognition	CodeCode Available	1
GraghVQA: Language-Guided Graph Neural Networks for Graph-based Visual Question Answering	Apr 20, 2021	Graph Neural NetworkGraph Question Answering	CodeCode Available	1
X-METRA-ADA: Cross-lingual Meta-Transfer Learning Adaptation to Natural Language Understanding and Question Answering	Apr 20, 2021	Cross-Lingual TransferMeta-Learning	CodeCode Available	1
ELECTRAMed: a new pre-trained language representation model for biomedical NLP	Apr 19, 2021	Drug–drug Interaction ExtractionLanguage Modeling	CodeCode Available	1
GooAQ: Open Question Answering with Diverse Answer Types	Apr 18, 2021	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	1
MT6: Multilingual Pretrained Text-to-Text Transformer with Translation Pairs	Apr 18, 2021	Abstractive Text SummarizationMachine Translation	CodeCode Available	1
Can NLI Models Verify QA Systems' Predictions?	Apr 18, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1
When Does Pretraining Help? Assessing Self-Supervised Learning for Law and the CaseHOLD Dataset	Apr 18, 2021	Multiple-choiceQuestion Answering	CodeCode Available	1
Explaining Answers with Entailment Trees	Apr 17, 2021	Language ModellingQuestion Answering	CodeCode Available	1
Mobile App Tasks with Iterative Feedback (MoTIF): Addressing Task Feasibility in Interactive Visual Environments	Apr 17, 2021	Common Sense ReasoningQuestion Answering	CodeCode Available	1
Capturing Row and Column Semantics in Transformer Based Question Answering over Tables	Apr 16, 2021	Question Answering	CodeCode Available	1
Q^2: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering	Apr 16, 2021	Abstractive Text SummarizationDialogue Evaluation	CodeCode Available	1
IndoNLG: Benchmark and Resources for Evaluating Indonesian Natural Language Generation	Apr 16, 2021	Machine TranslationQuestion Answering	CodeCode Available	1
What to Pre-Train on? Efficient Intermediate Task Selection	Apr 16, 2021	Multiple-choiceQuestion Answering	CodeCode Available	1
ESTER: A Machine Reading Comprehension Dataset for Event Semantic Relation Reasoning	Apr 16, 2021	Machine Reading ComprehensionNatural Language Queries	CodeCode Available	1
Editing Factual Knowledge in Language Models	Apr 16, 2021	Fact CheckingMeta-Learning	CodeCode Available	1
Time-Stamped Language Model: Teaching Language Models to Understand the Flow of Events	Apr 15, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
Sequence tagging for biomedical extractive question answering	Apr 15, 2021	Extractive Question-AnsweringQuestion Answering	CodeCode Available	1
Designing a Minimal Retrieve-and-Read System for Open-Domain Question Answering	Apr 15, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
How to Train BERT with an Academic Budget	Apr 15, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
TransferNet: An Effective and Transparent Framework for Multi-hop Question Answering over Relation Graph	Apr 15, 2021	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
TWEAC: Transformer with Extendable QA Agent Classifiers	Apr 14, 2021	Question Answering	CodeCode Available	1
QA-GNN: Reasoning with Language Models and Knowledge Graphs for Question Answering	Apr 13, 2021	Common Sense ReasoningGraph Representation Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 37 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified