Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5676–5700 of 10817 papers

Title	Date	Tasks	Status	Hype
TABi: Type-Aware Bi-Encoders for Open-Domain Entity Retrieval	Apr 18, 2022	Entity RetrievalFact Checking	CodeCode Available	1
ArcaneQA: Dynamic Program Induction and Contextualized Encoding for Knowledge Base Question Answering	Apr 17, 2022	Knowledge Base Question AnsweringProgram induction	CodeCode Available	1
Attention Mechanism based Cognition-level Scene Understanding	Apr 17, 2022	Question AnsweringScene Understanding	—Unverified	0
WikiOmnia: generative QA corpus on the whole Russian Wikipedia	Apr 17, 2022	Question Answering	—Unverified	0
Calibrating Trust of Multi-Hop Question Answering Systems with Decompositional Probes	Apr 16, 2022	Explanation GenerationMulti-hop Question Answering	—Unverified	0
Semantic Structure based Query Graph Prediction for Question Answering over Knowledge Graph	Apr 15, 2022	Graph GenerationQuestion Answering	—Unverified	0
Characterizing the Efficiency vs. Accuracy Trade-off for Long-Context NLP Models	Apr 15, 2022	DecoderPlaying the Game of 2048	CodeCode Available	0
MoEBERT: from BERT to Mixture-of-Experts via Importance-Guided Adaptation	Apr 15, 2022	Knowledge DistillationMixture-of-Experts	CodeCode Available	1
Improving Passage Retrieval with Zero-Shot Question Generation	Apr 15, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Mixture of Experts for Biomedical Question Answering	Apr 15, 2022	Mixture-of-ExpertsQuestion Answering	—Unverified	0
Towards Fine-grained Causal Reasoning and QA	Apr 15, 2022	Question AnsweringSentence	CodeCode Available	1
Improving Cross-Modal Understanding in Visual Dialog via Contrastive Learning	Apr 15, 2022	Contrastive LearningQuestion Answering	—Unverified	0
Exploring Dual Encoder Architectures for Question Answering	Apr 14, 2022	Information RetrievalQuestion Answering	CodeCode Available	1
Measuring Compositional Consistency for Video Question Answering	Apr 14, 2022	Question AnsweringVideo Question Answering	—Unverified	0
XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based Textual Knowledge Source	Apr 14, 2022	Information RetrievalMachine Reading Comprehension	—Unverified	0
Can Question Rewriting Help Conversational Question Answering?	Apr 13, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
AGQA 2.0: An Updated Benchmark for Compositional Spatio-Temporal Reasoning	Apr 12, 2022	Question Answering	—Unverified	0
ASQA: Factoid Questions Meet Long-Form Answers	Apr 12, 2022	FormQuestion Answering	CodeCode Available	0
Solving Price Per Unit Problem Around the World: Formulating Fact Extraction as Question Answering	Apr 12, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified	0
XQA-DST: Multi-Domain and Multi-Lingual Dialogue State Tracking	Apr 12, 2022	Cross-Lingual TransferDialogue State Tracking	CodeCode Available	0
MuCoT: Multilingual Contrastive Training for Question-Answering in Low-resource Languages	Apr 12, 2022	Question Answering	CodeCode Available	0
Answering Count Queries with Explanatory Evidence	Apr 11, 2022	Question Answering	CodeCode Available	0
Uniform Complexity for Text Generation	Apr 11, 2022	Machine TranslationQuestion Answering	CodeCode Available	0
Metaethical Perspectives on 'Benchmarking' AI Ethics	Apr 11, 2022	BenchmarkingEthics	—Unverified	0
Breaking Character: Are Subwords Good Enough for MRLs After All?	Apr 10, 2022	AllExtractive Question-Answering	—Unverified	0

Show:10 25 50

← PrevPage 228 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified