Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7076–7100 of 10817 papers

Title	Date	Tasks	Status
Cognitive Visual Commonsense Reasoning Using Dynamic Working Memory	Jul 4, 2021	Question AnsweringScene Understanding	CodeCode Available
How to make qubits speak	Jul 2, 2021	Question Answering	—Unverified
A Practical 2-step Approach to Assist Enterprise Question-Answering Live Chat	Jul 1, 2021	Community Question AnsweringQuestion Answering	—Unverified
Cross-Lingual Named Entity Recognition via FastAlign: a Case Study	Jul 1, 2021	Machine Translationnamed-entity-recognition	—Unverified
Zero-Shot Estimation of Base Models' Weights in Ensemble of Machine Reading Comprehension Systems for Robust Generalization	Jun 30, 2021	Domain GeneralizationMachine Reading Comprehension	—Unverified
Revisiting the Primacy of English in Zero-shot Cross-lingual Transfer	Jun 30, 2021	Cross-Lingual TransferQuestion Answering	—Unverified
Adventurer's Treasure Hunt: A Transparent System for Visually Grounded Compositional Visual Question Answering based on Scene Graphs	Jun 28, 2021	Question AnsweringTask 2	—Unverified
Overview of BioASQ 2020: The eighth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering	Jun 28, 2021	Question Answering	—Unverified
Overview of BioASQ 2021: The ninth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering	Jun 28, 2021	Question Answering	—Unverified
PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph	Jun 27, 2021	Knowledge GraphsQuestion Answering	—Unverified
A Picture May Be Worth a Hundred Words for Visual Question Answering	Jun 25, 2021	Data AugmentationDescriptive	—Unverified
Multimodal Few-Shot Learning with Frozen Language Models	Jun 25, 2021	Few-Shot LearningLanguage Modeling	—Unverified
ParaLaw Nets -- Cross-lingual Sentence-level Pretraining for Legal Text Processing	Jun 25, 2021	Question AnsweringSentence	—Unverified
Probing Inter-modality: Visual Parsing with Self-Attention for Vision-Language Pre-training	Jun 25, 2021	Image-text RetrievalQuestion Answering	—Unverified
iReason: Multimodal Commonsense Reasoning using Videos and Natural Language with Interpretability	Jun 25, 2021	Bias DetectionQuestion Answering	—Unverified
Hierarchical Object-oriented Spatio-Temporal Reasoning for Video Question Answering	Jun 25, 2021	ObjectQuestion Answering	—Unverified
VOGUE: Answer Verbalization through Multi-Task Learning	Jun 24, 2021	Answer GenerationKnowledge Graphs	CodeCode Available
OKGIT: Open Knowledge Graph Link Prediction with Implicit Types	Jun 24, 2021	Knowledge GraphsLink Prediction	CodeCode Available
PALRACE: Reading Comprehension Dataset with Human Data and Labeled Rationales	Jun 23, 2021	Machine Reading ComprehensionQuestion Answering	—Unverified
Fine-tune the Entire RAG Architecture (including DPR retriever) for Question-Answering	Jun 22, 2021	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
A Joint Training Framework for Open-World Knowledge Graph Embeddings	Jun 22, 2021	Dialogue GenerationEntity Embeddings	—Unverified
KaggleDBQA: Realistic Evaluation of Text-to-SQL Parsers	Jun 22, 2021	Question AnsweringSQL Parsing	CodeCode Available
Open Temporal Relation Extraction for Question Answering	Jun 22, 2021	Question AnsweringReading Comprehension	—Unverified
VQA-Aid: Visual Question Answering for Post-Disaster Damage Assessment and Analysis	Jun 19, 2021	Question AnsweringVisual Question Answering	—Unverified
Attend What You Need: Motion-Appearance Synergistic Networks for Video Question Answering	Jun 19, 2021	AI AgentQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 284 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified