Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1625 of 10817 papers

Title	Date	Tasks	Status	Hype
QALD-9-plus: A Multilingual Dataset for Question Answering over DBpedia and Wikidata Translated by Native Speakers	Jan 31, 2022	Graph Question AnsweringQuestion Answering	CodeCode Available	1
A Dataset for Medical Instructional Video Classification and Question Answering	Jan 30, 2022	ClassificationQuestion Answering	CodeCode Available	1
Clinical-Longformer and Clinical-BigBird: Transformers for long clinical sequences	Jan 27, 2022	Clinical KnowledgeDocument Classification	CodeCode Available	1
IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and Languages	Jan 27, 2022	Cross-Modal RetrievalFew-Shot Learning	CodeCode Available	1
SCAI-QReCC Shared Task on Conversational Question Answering	Jan 26, 2022	Answer GenerationConversational Question Answering	CodeCode Available	1
DOM-LM: Learning Generalizable Representations for HTML Documents	Jan 25, 2022	AttributeAttribute Extraction	CodeCode Available	1
Table Pre-training: A Survey on Model Architectures, Pre-training Objectives, and Downstream Tasks	Jan 24, 2022	DenoisingQuestion Answering	CodeCode Available	1
Leaf: Multiple-Choice Question Generation	Jan 22, 2022	Multiple-choiceQuestion Answering	CodeCode Available	1
Knowledge Graph Question Answering Leaderboard: A Community Resource to Prevent a Replication Crisis	Jan 20, 2022	Graph Question AnsweringQuestion Answering	CodeCode Available	1
RuMedBench: A Russian Medical Language Understanding Benchmark	Jan 17, 2022	Medical Diagnosisnamed-entity-recognition	CodeCode Available	1
Korean-Specific Dataset for Table Question Answering	Jan 17, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Kformer: Knowledge Injection in Transformer Feed-Forward Layers	Jan 15, 2022	Language ModellingMedical Question Answering	CodeCode Available	1
Sequence-to-Sequence Models for Extracting Information from Registration and Legal Documents	Jan 14, 2022	Open Information ExtractionQuestion Answering	CodeCode Available	1
SCROLLS: Standardized CompaRison Over Long Language Sequences	Jan 10, 2022	DecoderLong-range modeling	CodeCode Available	1
Maintaining Reasoning Consistency in Compositional Visual Question Answering	Jan 1, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
LaTr: Layout-Aware Transformer for Scene-Text VQA	Dec 23, 2021	Optical Character Recognition (OCR)Question Answering	CodeCode Available	1
Comprehensive Visual Question Answering on Point Clouds through Compositional Scene Manipulation	Dec 22, 2021	Common Sense ReasoningQuestion Answering	CodeCode Available	1
ScanQA: 3D Question Answering for Spatial Scene Understanding	Dec 20, 2021	3D Question Answering (3D-QA)Object	CodeCode Available	1
MuMuQA: Multimedia Multi-Hop News Question Answering via Cross-Media Knowledge Extraction and Grounding	Dec 20, 2021	Answer GenerationArticles	CodeCode Available	1
DegreEmbed: incorporating entity embedding into logic rule learning for knowledge graph reasoning	Dec 18, 2021	Knowledge GraphsLink Prediction	CodeCode Available	1
WebGPT: Browser-assisted question-answering with human feedback	Dec 17, 2021	Imitation LearningNavigate	CodeCode Available	1
Ditch the Gold Standard: Re-evaluating Conversational Question Answering	Dec 16, 2021	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
Evidentiality-guided Generation for Knowledge-Intensive NLP Tasks	Dec 16, 2021	AttributeFact Verification	CodeCode Available	1
DREAM: Improving Situational QA by First Elaborating the Situation	Dec 16, 2021	Question Answering	CodeCode Available	1
QuALITY: Question Answering with Long Input Texts, Yes!	Dec 16, 2021	Multiple-choiceMultiple Choice Question Answering (MCQA)	CodeCode Available	1

Show:10 25 50

← PrevPage 65 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified