Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6751–6800 of 10817 papers

Title	Date	Tasks	Status	Hype
Hidden Backdoors in Human-Centric Language Models	May 1, 2021	Language ModellingMachine Translation	CodeCode Available	1
Chop Chop BERT: Visual Question Answering by Chopping VisualBERT's Heads	Apr 30, 2021	Question AnsweringVisual Question Answering	—Unverified	0
Entailment as Few-Shot Learner	Apr 29, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
Bridge to Answer: Structure-aware Graph Interaction Network for Video Question Answering	Apr 29, 2021	Question AnsweringVideo Question Answering	—Unverified	0
Document Collection Visual Question Answering	Apr 27, 2021	document understandingQuestion Answering	—Unverified	0
Question-Aware Memory Network for Multi-hop Question Answering in Human-Robot Interaction	Apr 27, 2021	Graph EmbeddingGraph Question Answering	—Unverified	0
Document Structure aware Relational Graph Convolutional Networks for Ontology Population	Apr 27, 2021	Hypernym DiscoveryQuestion Answering	—Unverified	0
PanGu-α: Large-scale Autoregressive Pretrained Chinese Language Models with Auto-parallel Computation	Apr 26, 2021	Cloze (multi-choices) (Few-Shot)Cloze (multi-choices) (One-Shot)	CodeCode Available	1
MDETR -- Modulated Detection for End-to-End Multi-Modal Understanding	Apr 26, 2021	Generalized Referring Expression ComprehensionPhrase Grounding	CodeCode Available	1
DADgraph: A Discourse-aware Dialogue Graph Neural Network for Multiparty Dialogue Machine Reading Comprehension	Apr 26, 2021	Graph Neural NetworkMachine Reading Comprehension	—Unverified	0
InfographicVQA	Apr 26, 2021	Question AnsweringVisual Question Answering	—Unverified	0
Towards Knowledge Graphs Validation through Weighted Knowledge Sources	Apr 26, 2021	Knowledge GraphsQuestion Answering	—Unverified	0
GermanQuAD and GermanDPR: Improving Non-English Question Answering and Passage Retrieval	Apr 26, 2021	Passage RetrievalQuestion Answering	—Unverified	0
Ask & Explore: Grounded Question Answering for Curiosity-Driven Exploration	Apr 24, 2021	Question Answering	—Unverified	0
RelTransformer: A Transformer-Based Long-Tail Visual Relationship Recognition	Apr 24, 2021	Image CaptioningObject Recognition	CodeCode Available	1
Playing Lottery Tickets with Vision and Language	Apr 23, 2021	Image-text RetrievalQuestion Answering	—Unverified	0
BERT-CoQAC: BERT-based Conversational Question Answering in Context	Apr 23, 2021	Conversational Question AnsweringLanguage Modelling	—Unverified	0
Sattiy at SemEval-2021 Task 9: An Ensemble Solution for Statement Verification and Evidence Finding with Tables	Apr 21, 2021	ArticlesNatural Language Understanding	—Unverified	0
Efficient Retrieval Optimized Multi-task Learning	Apr 20, 2021	Extractive Question-AnsweringMulti-Task Learning	—Unverified	0
X-METRA-ADA: Cross-lingual Meta-Transfer Learning Adaptation to Natural Language Understanding and Question Answering	Apr 20, 2021	Cross-Lingual TransferMeta-Learning	CodeCode Available	1
Towards Solving Multimodal Comprehension	Apr 20, 2021	16kAnswer Generation	—Unverified	0
GraghVQA: Language-Guided Graph Neural Networks for Graph-based Visual Question Answering	Apr 20, 2021	Graph Neural NetworkGraph Question Answering	CodeCode Available	1
Natural Language Generation Using Link Grammar for General Conversational Intelligence	Apr 19, 2021	Question AnsweringText Generation	CodeCode Available	0
ELECTRAMed: a new pre-trained language representation model for biomedical NLP	Apr 19, 2021	Drug–drug Interaction ExtractionLanguage Modeling	CodeCode Available	1
MT6: Multilingual Pretrained Text-to-Text Transformer with Translation Pairs	Apr 18, 2021	Abstractive Text SummarizationMachine Translation	CodeCode Available	1
When Does Pretraining Help? Assessing Self-Supervised Learning for Law and the CaseHOLD Dataset	Apr 18, 2021	Multiple-choiceQuestion Answering	CodeCode Available	1
Contextualized Query Embeddings for Conversational Search	Apr 18, 2021	Conversational SearchInformation Retrieval	—Unverified	0
Generative Context Pair Selection for Multi-hop Question Answering	Apr 18, 2021	Multi-hop Question AnsweringQuestion Answering	—Unverified	0
FedNLP: Benchmarking Federated Learning Methods for Natural Language Processing Tasks	Apr 18, 2021	BenchmarkingFederated Learning	CodeCode Available	0
Case-based Reasoning for Natural Language Queries over Knowledge Bases	Apr 18, 2021	Knowledge Base Question AnsweringNatural Language Queries	—Unverified	0
Can NLI Models Verify QA Systems' Predictions?	Apr 18, 2021	Natural Language InferenceQuestion Answering	CodeCode Available	1
Cross-Task Generalization via Natural Language Crowdsourcing Instructions	Apr 18, 2021	Question Answering	CodeCode Available	2
Improving Question Answering Model Robustness with Synthetic Adversarial Data Generation	Apr 18, 2021	Answer SelectionQuestion Answering	—Unverified	0
GooAQ: Open Question Answering with Diverse Answer Types	Apr 18, 2021	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	1
ASBERT: Siamese and Triplet network embedding for open question answering	Apr 17, 2021	Answer SelectionNetwork Embedding	—Unverified	0
Multi-Perspective Abstractive Answer Summarization	Apr 17, 2021	Community Question AnsweringQuestion Answering	—Unverified	0
A Graph-guided Multi-round Retrieval Method for Conversational Open-domain Question Answering	Apr 17, 2021	Conversational Question AnsweringOpen-Domain Question Answering	—Unverified	0
Explaining Answers with Entailment Trees	Apr 17, 2021	Language ModellingQuestion Answering	CodeCode Available	1
Mobile App Tasks with Iterative Feedback (MoTIF): Addressing Task Feasibility in Interactive Visual Environments	Apr 17, 2021	Common Sense ReasoningQuestion Answering	CodeCode Available	1
BEIR: A Heterogenous Benchmark for Zero-shot Evaluation of Information Retrieval Models	Apr 17, 2021	Argument RetrievalBenchmarking	CodeCode Available	2
Joint Passage Ranking for Diverse Multi-Answer Retrieval	Apr 17, 2021	Answer GenerationDiversity	—Unverified	0
ESTER: A Machine Reading Comprehension Dataset for Event Semantic Relation Reasoning	Apr 16, 2021	Machine Reading ComprehensionNatural Language Queries	CodeCode Available	1
Q^2: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering	Apr 16, 2021	Abstractive Text SummarizationDialogue Evaluation	CodeCode Available	1
Capturing Row and Column Semantics in Transformer Based Question Answering over Tables	Apr 16, 2021	Question Answering	CodeCode Available	1
Multivalent Entailment Graphs for Question Answering	Apr 16, 2021	Question Answering	—Unverified	0
What to Pre-Train on? Efficient Intermediate Task Selection	Apr 16, 2021	Multiple-choiceQuestion Answering	CodeCode Available	1
Cross-Modal Retrieval Augmentation for Multi-Modal Classification	Apr 16, 2021	ClassificationCross-Modal Retrieval	—Unverified	0
IndoNLG: Benchmark and Resources for Evaluating Indonesian Natural Language Generation	Apr 16, 2021	Machine TranslationQuestion Answering	CodeCode Available	1
VGNMN: Video-grounded Neural Module Network to Video-Grounded Language Tasks	Apr 16, 2021	Information RetrievalQuestion Answering	—Unverified	0
Editing Factual Knowledge in Language Models	Apr 16, 2021	Fact CheckingMeta-Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 136 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified