Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6876–6900 of 10817 papers

Title	Date	Tasks	Status
Attention-guided Generative Models for Extractive Question Answering	Oct 12, 2021	DecoderExtractive Question-Answering	—Unverified
A Survey on Legal Question Answering Systems	Oct 12, 2021	legal outcome extractionQuestion Answering	—Unverified
Explainable Fact-checking through Question Answering	Oct 11, 2021	Decision MakingFact Checking	—Unverified
Beyond Accuracy: A Consolidated Tool for Visual Question Answering Benchmarking	Oct 11, 2021	BenchmarkingQuestion Answering	CodeCode Available
AskMe: Joint Individual-level and Community-level Behavior Interaction for Question Recommendation	Oct 11, 2021	Community Question AnsweringQuestion Answering	—Unverified
Enhance Long Text Understanding via Distilled Gist Detector from Abstractive Summarization	Oct 10, 2021	Abstractive Text SummarizationDocument Classification	—Unverified
A Framework for Rationale Extraction for Deep QA models	Oct 9, 2021	Explanation GenerationQuestion Answering	—Unverified
The Inductive Bias of In-Context Learning: Rethinking Pretraining Example Design	Oct 9, 2021	ChunkingIn-Context Learning	—Unverified
KG-FiD: Infusing Knowledge Graph in Fusion-in-Decoder for Open-Domain Question Answering	Oct 8, 2021	Answer GenerationDecoder	—Unverified
Multi-tasking Dialogue Comprehension with Discourse Parsing	Oct 7, 2021	Discourse ParsingMachine Reading Comprehension	CodeCode Available
A Comparative Study of Transformer-Based Language Models on Extractive Question Answering	Oct 7, 2021	Extractive Question-AnsweringQuestion Answering	—Unverified
Noisy Text Data: Achilles' Heel of popular transformer based NLP models	Oct 7, 2021	NEROpen-Ended Question Answering	—Unverified
GNN is a Counter? Revisiting GNN for Question Answering	Oct 7, 2021	Knowledge GraphsQuestion Answering	—Unverified
COVIDRead: A Large-scale Question Answering Dataset on COVID-19	Oct 5, 2021	ArticlesQuestion Answering	—Unverified
Perhaps PTLMs Should Go to School -- A Task to Assess Open Book and Closed Book QA	Oct 4, 2021	Question Answering	—Unverified
Encoder Adaptation of Dense Passage Retrieval for Open-Domain Question Answering	Oct 4, 2021	Domain AdaptationOpen-Domain Question Answering	—Unverified
Asking questions on handwritten document collections	Oct 2, 2021	Optical Character Recognition (OCR)Question Answering	—Unverified
Generating User-Centred Explanations via Illocutionary Question Answering: From Philosophy to Interfaces	Oct 2, 2021	Disease PredictionExplainable Artificial Intelligence (XAI)	CodeCode Available
Perhaps PTLMs Should Go to School – A Task to Assess Open Book and Closed Book QA	Oct 1, 2021	Question Answering	—Unverified
A Flexible and Extensible Framework for Multiple Answer Modes Question Answering	Oct 1, 2021	Answer GenerationQuestion Answering	—Unverified
Self-Attentive Constituency Parsing for UCCA-based Semantic Parsing	Oct 1, 2021	Constituency ParsingFew-Shot Learning	—Unverified
Generating Justifications in a Spatial Question-Answering Dialogue System for a Blocks World	Oct 1, 2021	Question Answering	—Unverified
Breaking Down Questions for Outside-Knowledge VQA	Sep 29, 2021	Graph Neural NetworkQuestion Answering	—Unverified
Variational Disentangled Attention for Regularized Visual Dialog	Sep 29, 2021	Question AnsweringVisual Dialog	—Unverified
Measuring CLEVRness: Black-box Testing of Visual Reasoning Models	Sep 29, 2021	BenchmarkingDiagnostic	—Unverified

Show:10 25 50

← PrevPage 276 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified