Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5801–5825 of 10817 papers

Title	Date	Tasks	Status	Hype
On Modality Bias Recognition and Reduction	Feb 25, 2022	Action RecognitionMulti-modal Classification	CodeCode Available	0
Measuring CLEVRness: Blackbox testing of Visual Reasoning Models	Feb 24, 2022	BenchmarkingDiagnostic	—Unverified	0
BERTVision -- A Parameter-Efficient Approach for Question Answering	Feb 24, 2022	GPUQuestion Answering	CodeCode Available	1
UnifiedQA-v2: Stronger Generalization via Broader Cross-Format Training	Feb 23, 2022	Question Answering	CodeCode Available	2
Knowledge Base Question Answering by Case-based Reasoning over Subgraphs	Feb 22, 2022	Knowledge Base Question AnsweringQuestion Answering	CodeCode Available	1
OG-SGG: Ontology-Guided Scene Graph Generation. A Case Study in Transfer Learning for Telepresence Robotics	Feb 21, 2022	BIG-bench Machine LearningGraph Generation	CodeCode Available	0
Vision-Language Pre-Training with Triple Contrastive Learning	Feb 21, 2022	Contrastive Learningcross-modal alignment	CodeCode Available	2
(2.5+1)D Spatio-Temporal Scene Graphs for Video Question Answering	Feb 18, 2022	Question AnsweringSpatio-temporal Scene Graphs	—Unverified	0
SGPT: GPT Sentence Embeddings for Semantic Search	Feb 17, 2022	Argument RetrievalBiomedical Information Retrieval	CodeCode Available	2
Discovering Fine-Grained Semantics in Knowledge Graph Relations	Feb 17, 2022	Knowledge Graph CompletionKnowledge Graphs	—Unverified	0
ST-MoE: Designing Stable and Transferable Sparse Expert Models	Feb 17, 2022	ARCCommon Sense Reasoning	CodeCode Available	3
Question-Answer Sentence Graph for Joint Modeling Answer Selection	Feb 16, 2022	Answer SelectionQuestion Answering	—Unverified	0
ZeroGen: Efficient Zero-shot Learning via Dataset Generation	Feb 16, 2022	Data-free Knowledge DistillationDataset Generation	CodeCode Available	1
Privacy Preserving Visual Question Answering	Feb 15, 2022	Privacy PreservingQuestion Answering	—Unverified	0
MuLD: The Multitask Long Document Benchmark	Feb 15, 2022	Question AnsweringStyle change detection	CodeCode Available	1
XAI for Transformers: Better Explanations through Conservative Propagation	Feb 15, 2022	Explainable Artificial Intelligence (XAI)Question Answering	CodeCode Available	1
Delving Deeper into Cross-lingual Visual Question Answering	Feb 15, 2022	Inductive BiasQuestion Answering	CodeCode Available	0
Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation	Feb 15, 2022	Question Answering	CodeCode Available	1
Partially Fake Audio Detection by Self-attention-based Fake Span Discovery	Feb 14, 2022	Open-Ended Question AnsweringQuestion Answering	—Unverified	0
An experimental study of the vision-bottleneck in VQA	Feb 14, 2022	ObjectQuestion Answering	—Unverified	0
QA4QG: Using Question Answering to Constrain Multi-Hop Question Generation	Feb 14, 2022	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
PQuAD: A Persian Question Answering Dataset	Feb 13, 2022	ArticlesDiversity	—Unverified	0
Recognition-free Question Answering on Handwritten Document Collections	Feb 12, 2022	Question AnsweringRetrieval	—Unverified	0
FedQAS: Privacy-aware machine reading comprehension with federated learning	Feb 9, 2022	Conversational Question AnsweringFederated Learning	CodeCode Available	0
Can Open Domain Question Answering Systems Answer Visual Knowledge Questions?	Feb 9, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 233 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified