Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5326–5350 of 10817 papers

Title	Date	Tasks	Status	Hype
Neural Knowledge Bank for Pretrained Transformers	Jul 31, 2022	Language ModelingLanguage Modelling	—Unverified	0
Neuro-Symbolic Learning: Principles and Applications in Ophthalmology	Jul 31, 2022	Common Sense ReasoningImage Captioning	—Unverified	0
Face-to-Face Contrastive Learning for Social Intelligence Question-Answering	Jul 29, 2022	Contrastive LearningGraph Neural Network	—Unverified	0
Sequence to sequence pretraining for a less-resourced Slovenian language	Jul 28, 2022	Language ModelingLanguage Modelling	CodeCode Available	0
RealTime QA: What's the Answer Right Now?	Jul 27, 2022	Information RetrievalQuestion Answering	CodeCode Available	1
Uncertainty-based Visual Question Answering: Estimating Semantic Inconsistency between Image and Knowledge Base	Jul 27, 2022	Question AnsweringSemantic Similarity	—Unverified	0
Equivariant and Invariant Grounding for Video Question Answering	Jul 26, 2022	Question AnsweringVideo Question Answering	CodeCode Available	1
Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering	Jul 26, 2022	Causal InferenceQuestion Answering	CodeCode Available	1
LaKo: Knowledge-driven Visual Question Answering via Late Knowledge-to-Text Injection	Jul 26, 2022	DecoderKnowledge Graphs	CodeCode Available	1
WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models	Jul 25, 2022	Common Sense ReasoningGeneral Knowledge	CodeCode Available	0
Is GPT-3 all you need for Visual Question Answering in Cultural Heritage?	Jul 25, 2022	AllQuestion Answering	—Unverified	0
Towards Complex Document Understanding By Discrete Reasoning	Jul 25, 2022	document understandingQuestion Answering	—Unverified	0
Visual Perturbation-aware Collaborative Learning for Overcoming the Language Prior Problem	Jul 24, 2022	DiagnosticQuestion Answering	—Unverified	0
μKG: A Library for Multi-source Knowledge Graph Embeddings and Applications	Jul 23, 2022	Entity AlignmentEntity Typing	CodeCode Available	1
Semantic-aware Modular Capsule Routing for Visual Question Answering	Jul 21, 2022	Question AnsweringVisual Question Answering	—Unverified	0
Step by step: a hierarchical framework for multi-hop knowledge graph reasoning with reinforcement learning	Jul 19, 2022	Hierarchical Reinforcement LearningKnowledge Graphs	CodeCode Available	0
On the Usability of Transformers-based models for a French Question-Answering task	Jul 19, 2022	Cross-Lingual TransferData Augmentation	—Unverified	0
PiC: A Phrase-in-Context Dataset for Phrase Understanding and Semantic Search	Jul 19, 2022	Information RetrievalNatural Language Understanding	CodeCode Available	0
Rethinking Data Augmentation for Robust Visual Question Answering	Jul 18, 2022	Data AugmentationKnowledge Distillation	CodeCode Available	1
Can large language models reason about medical questions?	Jul 17, 2022	MedQAMultiple-choice	CodeCode Available	1
An Overview of Distant Supervision for Relation Extraction with a Focus on Denoising and Pre-training Methods	Jul 17, 2022	DenoisingKnowledge Graph Completion	—Unverified	0
Clover: Towards A Unified Video-Language Alignment and Fusion Model	Jul 16, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Re2G: Retrieve, Rerank, Generate	Jul 13, 2022	Fact CheckingFact Verification	CodeCode Available	1
N-Grammer: Augmenting Transformers with latent n-grams	Jul 13, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	4
3D Concept Grounding on Neural Fields	Jul 13, 2022	Instance SegmentationQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 214 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified