Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5876–5900 of 10817 papers

Title	Date	Tasks	Status
FORTAP: Using Formulas for Numerical-Reasoning-Aware Table Pretraining	Jan 16, 2022	PredictionQuestion Answering	—Unverified
FedNLP: Benchmarking Federated Learning Methods for Natural Language Processing Tasks	Jan 16, 2022	BenchmarkingFederated Learning	—Unverified
FAQ Search using Transformers	Jan 16, 2022	Question Answering	—Unverified
ERNIE-Layout: Layout-Knowledge Enhanced Multi-modal Pre-training for Document Understanding	Jan 16, 2022	cross-modal alignmentDocument Classification	CodeCode Available
Dynamic Relevance Graph Network for Knowledge-Aware Question Answering	Jan 16, 2022	Graph Neural NetworkQuestion Answering	—Unverified
Retrieval Enhanced Data Augmentation for Question Answering on Privacy Policies	Jan 16, 2022	Data AugmentationDiversity	—Unverified
Interpretable Proof Generation via Iterative Backward Reasoning	Jan 16, 2022	PredictionQuestion Answering	—Unverified
On Measuring Social Biases in Prompt-Based Learning	Jan 16, 2022	FormLanguage Modelling	—Unverified
XLTime: A Cross-Lingual Knowledge Transfer Framework for Temporal Expression Extraction	Jan 16, 2022	Causal InferenceInformation Retrieval	—Unverified
Tapping BERT for Preposition Sense Disambiguation	Jan 16, 2022	Question Answering	—Unverified
Modeling Exemplification in Long-form Question Answering via Retrieval	Jan 16, 2022	FormLong Form Question Answering	—Unverified
How do QA models combine knowledge from LM and 100 passages?	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified
Consecutive Question Generation with Multitask Joint Reranking and Dynamic Rationale Search	Jan 16, 2022	DiversityInformativeness	—Unverified
All You May Need for VQA are Image Captions	Jan 16, 2022	AllImage Captioning	—Unverified
Framework for Weakly Supervised Causal Knowledge Extraction from Text	Jan 16, 2022	ManagementNatural Language Inference	—Unverified
CL-ReKD: Cross-lingual Knowledge Distillation for Multilingual Retrieval Question Answering	Jan 16, 2022	Knowledge DistillationLanguage Modeling	—Unverified
Fine-tuning Strategies for Domain Specific Question Answering under Low Annotation Budget Constraints	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified
Causal Distillation for Language Models	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified
Mosaic Augmentation for Text: Cropping and Collaging as Cross-Domain Techniques	Jan 16, 2022	Abstractive Text SummarizationExtractive Question-Answering	—Unverified
Evidentiality-guided Generation for Knowledge-Intensive NLP Tasks	Jan 16, 2022	Fact VerificationMemorization	—Unverified
MANGO: Enhancing the Robustness of VQA Models via Adversarial Noise Generation	Jan 16, 2022	Logical ReasoningQuestion Answering	—Unverified
StoryQA: Story Grounded Question Answering Dataset	Jan 16, 2022	Question Answering	—Unverified
MixQG: Neural Question Generation with Mixed Answer Types	Jan 16, 2022	Multiple-choiceQuestion Answering	—Unverified
Re2G: Retrieve, Rerank, Generate	Jan 16, 2022	Fact CheckingGPU	—Unverified
Probing the Role of Positional Information in Vision-Language Models	Jan 16, 2022	Contrastive LearningImage-text matching	—Unverified

Show:10 25 50

← PrevPage 236 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified