Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5126–5150 of 10817 papers

Title	Date	Tasks	Status	Hype
Towards a Unified Multi-Dimensional Evaluator for Text Generation	Oct 13, 2022	nlg evaluationQuestion Answering	CodeCode Available	2
OpenCQA: Open-ended Question Answering with Charts	Oct 12, 2022	Arithmetic ReasoningDescriptive	CodeCode Available	1
Improving Question Answering with Generation of NQ-like Questions	Oct 12, 2022	Natural QuestionsQuestion Answering	—Unverified	0
Long-Form Video-Language Pre-Training with Multimodal Temporal Contrastive Learning	Oct 12, 2022	Contrastive LearningForm	CodeCode Available	2
CIKQA: Learning Commonsense Inference with a Unified Knowledge-in-the-loop QA Paradigm	Oct 12, 2022	Question AnsweringTask 2	—Unverified	0
Are Sample-Efficient NLP Models More Robust?	Oct 12, 2022	Extractive Question-Answeringimage-classification	—Unverified	0
SlotFormer: Unsupervised Visual Dynamics Simulation with Object-Centric Models	Oct 12, 2022	ObjectQuestion Answering	CodeCode Available	1
Task Compass: Scaling Multi-task Pre-training with Task Prefix	Oct 12, 2022	Common Sense ReasoningData Augmentation	CodeCode Available	1
Relational Graph Convolutional Neural Networks for Multihop Reasoning: A Comparative Study	Oct 12, 2022	Question Answering	—Unverified	0
ERNIE-Layout: Layout Knowledge Enhanced Pre-training for Visually-rich Document Understanding	Oct 12, 2022	document-image-classificationDocument Image Classification	CodeCode Available	1
Question Answering Over Biological Knowledge Graph via Amazon Alexa	Oct 12, 2022	ArticlesData Integration	—Unverified	0
Discourse Analysis via Questions and Answers: Parsing Dependency Structures of Questions Under Discussion	Oct 12, 2022	Dependency ParsingQuestion Answering	CodeCode Available	1
Probing Commonsense Knowledge in Pre-trained Language Models with Sense-level Precision and Expanded Vocabulary	Oct 12, 2022	Question Answering	CodeCode Available	0
TwiRGCN: Temporally Weighted Graph Convolution for Question Answering over Temporal Knowledge Graphs	Oct 12, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
Context Generation Improves Open Domain Question Answering	Oct 12, 2022	Language ModelingLanguage Modelling	—Unverified	0
Decoupled Context Processing for Context Augmented Language Modeling	Oct 11, 2022	DecoderLanguage Modeling	—Unverified	0
CSS: Combining Self-training and Self-supervised Learning for Few-shot Dialogue State Tracking	Oct 11, 2022	Dialogue State TrackingMachine Reading Comprehension	—Unverified	0
Task-Aware Specialization for Efficient and Robust Dense Retrieval for Open-Domain Question Answering	Oct 11, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
Capturing Global Structural Information in Long Document Question Answering with Compressive Graph Selector Network	Oct 11, 2022	Evidence SelectionGraph Attention	CodeCode Available	0
MAP: Multimodal Uncertainty-Aware Vision-Language Pre-training Model	Oct 11, 2022	Contrastive LearningImage-text matching	CodeCode Available	1
Mixed-modality Representation Learning and Pre-training for Joint Table-and-Text Retrieval in OpenQA	Oct 11, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	1
How Well Do Multi-hop Reading Comprehension Models Understand Date Information?	Oct 11, 2022	Data AugmentationMulti-Hop Reading Comprehension	CodeCode Available	0
Contrastive Video-Language Learning with Fine-grained Frame Sampling	Oct 10, 2022	Question AnsweringRepresentation Learning	—Unverified	0
Semantic Framework based Query Generation for Temporal Question Answering over Knowledge Graphs	Oct 10, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
Language Prior Is Not the Only Shortcut: A Benchmark for Shortcut Learning in VQA	Oct 10, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 206 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified