Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1711–1720 of 10817 papers

Title	Date	Tasks	Status	Hype	Score
A Survey of Medical Vision-and-Language Applications and Their Techniques	Nov 19, 2024	Decision MakingDiagnostic	CodeCode Available	1	5
Coarse-to-Fine Reasoning for Visual Question Answering	Oct 6, 2021	Question AnsweringVisual Question Answering	CodeCode Available	1	5
Knowledgeable Preference Alignment for LLMs in Domain-specific Question Answering	Nov 11, 2023	Knowledge GraphsQuestion Answering	CodeCode Available	1	5
Clues Before Answers: Generation-Enhanced Multiple-Choice QA	Apr 30, 2022	DecoderMultiple-choice	CodeCode Available	1	5
Can Explanations Be Useful for Calibrating Black Box Models?	Oct 14, 2021	Extractive Question-AnsweringFew-Shot Learning	CodeCode Available	1	5
Generator-Retriever-Generator Approach for Open-Domain Question Answering	Jul 21, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Kformer: Knowledge Injection in Transformer Feed-Forward Layers	Jan 15, 2022	Language ModellingMedical Question Answering	CodeCode Available	1	5
Can Generative Pre-trained Language Models Serve as Knowledge Bases for Closed-book QA?	Jun 3, 2021	Question Answering	CodeCode Available	1	5
KGE-CL: Contrastive Learning of Tensor Decomposition Based Knowledge Graph Embeddings	Dec 9, 2021	Contrastive LearningGraph Embedding	CodeCode Available	1	5
CL-ReLKT: Cross-lingual Language Knowledge Transfer for Multilingual Retrieval Question Answering	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5

Show:10 25 50

← PrevPage 172 of 1082Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified