Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5526–5550 of 10817 papers

Title	Date	Tasks	Status	Hype
Train Flat, Then Compress: Sharpness-Aware Minimization Learns More Compressible Models	May 25, 2022	Model CompressionQuantization	—Unverified	0
Investigating Information Inconsistency in Multilingual Open-Domain Question Answering	May 25, 2022	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Leveraging QA Datasets to Improve Generative Data Augmentation	May 25, 2022	Common Sense ReasoningData Augmentation	CodeCode Available	0
Reasoning over Logically Interacted Conditions for Question Answering	May 25, 2022	Logical ReasoningQuestion Answering	—Unverified	0
Re-Examining Calibration: The Case of Question Answering	May 25, 2022	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Would You Ask it that Way? Measuring and Improving Question Naturalness for Knowledge Graph Question Answering	May 25, 2022	Graph Question AnsweringNatural Questions	CodeCode Available	1
Guiding Visual Question Answering with Attention Priors	May 25, 2022	Question AnsweringVisual Grounding	—Unverified	0
FabKG: A Knowledge graph of Manufacturing Science domain utilizing structured and unconventional unstructured knowledge source	May 24, 2022	Knowledge GraphsNER	—Unverified	0
From Easy to Hard: Two-stage Selector and Reader for Multi-hop Question Answering	May 24, 2022	Multi-hop Question AnsweringQuestion Answering	—Unverified	0
RetroMAE: Pre-Training Retrieval-oriented Language Models Via Masked Auto-Encoder	May 24, 2022	DecoderInformation Retrieval	CodeCode Available	2
mPLUG: Effective and Efficient Vision-Language Learning by Cross-modal Skip-connections	May 24, 2022	Computational Efficiencycross-modal alignment	CodeCode Available	1
Policy Compliance Detection via Expression Tree Inference	May 24, 2022	Natural Language InferenceQuestion Answering	—Unverified	0
Reassessing Evaluation Practices in Visual Question Answering: A Case Study on Out-of-Distribution Generalization	May 24, 2022	Image CaptioningOut-of-Distribution Generalization	—Unverified	0
A Survey on Neural Open Information Extraction: Current Status and Future Directions	May 24, 2022	Knowledge Base ConstructionNatural Language Understanding	—Unverified	0
On Advances in Text Generation from Images Beyond Captioning: A Case Study in Self-Rationalization	May 24, 2022	DescriptiveImage Captioning	—Unverified	0
Community Question Answering Entity Linking via Leveraging Auxiliary Data	May 24, 2022	Community Question AnsweringEntity Linking	CodeCode Available	0
On Measuring Social Biases in Prompt-Based Multi-Task Learning	May 23, 2022	FormLanguage Modeling	CodeCode Available	1
Time-series Transformer Generative Adversarial Networks	May 23, 2022	Question AnsweringTime Series	CodeCode Available	3
Memory-enriched computation and learning in spiking neural networks through Hebbian plasticity	May 23, 2022	One-Shot LearningOut-of-Distribution Generalization	CodeCode Available	0
Prompt Tuning for Discriminative Pre-trained Language Models	May 23, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
VQA-GNN: Reasoning with Multimodal Knowledge via Graph Neural Networks for Visual Question Answering	May 23, 2022	Knowledge GraphsQuestion Answering	—Unverified	0
StreamingQA: A Benchmark for Adaptation to New Knowledge over Time in Question Answering Models	May 23, 2022	ArticlesQuestion Answering	CodeCode Available	1
Relphormer: Relational Graph Transformer for Knowledge Graph Representations	May 22, 2022	General KnowledgeGraph Mining	CodeCode Available	1
Language Models with Image Descriptors are Strong Few-Shot Video-Language Learners	May 22, 2022	AttributeAutomatic Speech Recognition	CodeCode Available	1
Interpretable Proof Generation via Iterative Backward Reasoning	May 22, 2022	Question Answering	CodeCode Available	0

Show:10 25 50

← PrevPage 222 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified