Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6426–6450 of 10817 papers

Title	Date	Tasks	Status
Semantic Structure based Query Graph Prediction for Question Answering over Knowledge Graph	Apr 15, 2022	Graph GenerationQuestion Answering	—Unverified
Improving Cross-Modal Understanding in Visual Dialog via Contrastive Learning	Apr 15, 2022	Contrastive LearningQuestion Answering	—Unverified
XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based Textual Knowledge Source	Apr 14, 2022	Information RetrievalMachine Reading Comprehension	—Unverified
Measuring Compositional Consistency for Video Question Answering	Apr 14, 2022	Question AnsweringVideo Question Answering	—Unverified
AGQA 2.0: An Updated Benchmark for Compositional Spatio-Temporal Reasoning	Apr 12, 2022	Question Answering	—Unverified
MuCoT: Multilingual Contrastive Training for Question-Answering in Low-resource Languages	Apr 12, 2022	Question Answering	CodeCode Available
Solving Price Per Unit Problem Around the World: Formulating Fact Extraction as Question Answering	Apr 12, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
XQA-DST: Multi-Domain and Multi-Lingual Dialogue State Tracking	Apr 12, 2022	Cross-Lingual TransferDialogue State Tracking	CodeCode Available
ASQA: Factoid Questions Meet Long-Form Answers	Apr 12, 2022	FormQuestion Answering	CodeCode Available
Uniform Complexity for Text Generation	Apr 11, 2022	Machine TranslationQuestion Answering	CodeCode Available
Answering Count Queries with Explanatory Evidence	Apr 11, 2022	Question Answering	CodeCode Available
Metaethical Perspectives on 'Benchmarking' AI Ethics	Apr 11, 2022	BenchmarkingEthics	—Unverified
Breaking Character: Are Subwords Good Enough for MRLs After All?	Apr 10, 2022	AllExtractive Question-Answering	—Unverified
Data Augmentation for Biomedical Factoid Question Answering	Apr 10, 2022	Data AugmentationInformation Retrieval	CodeCode Available
Augmenting Pre-trained Language Models with QA-Memory for Open-Domain Question Answering	Apr 10, 2022	DecoderOpen-Domain Question Answering	—Unverified
KGI: An Integrated Framework for Knowledge Intensive Language Tasks	Apr 8, 2022	Fact CheckingOpen-Domain Question Answering	—Unverified
Parameter-Efficient Abstractive Question Answering over Tables or Text	Apr 7, 2022	abstractive question answeringDecoder	CodeCode Available
Knowledge Base Index Compression via Dimensionality and Precision Reduction	Apr 6, 2022	Dimensionality ReductionQuestion Answering	CodeCode Available
Improving Zero-Shot Event Extraction via Sentence Simplification	Apr 6, 2022	Event Argument ExtractionEvent Extraction	—Unverified
Match-Prompt: Improving Multi-task Generalization Ability for Neural Text Matching via Prompt Learning	Apr 6, 2022	Information RetrievalParaphrase Identification	CodeCode Available
Improved and Efficient Conversational Slot Labeling through Question Answering	Apr 5, 2022	Natural Language UnderstandingQuestion Answering	—Unverified
Multi-View Approach to Suggest Moderation Actions in Community Question Answering Sites	Apr 4, 2022	Community Question Answeringnamed-entity-recognition	—Unverified
Question-Driven Graph Fusion Network For Visual Question Answering	Apr 3, 2022	Graph AttentionObject	—Unverified
Co-VQA : Answering by Interactive Sub Question Sequence	Apr 2, 2022	Question AnsweringVisual Question Answering	—Unverified
COOL, a Context Outlooker, and its Application to Question Answering and other Natural Language Processing Tasks	Apr 1, 2022	Question Answering	—Unverified

Show:10 25 50

← PrevPage 258 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified