Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1575 of 10817 papers

Title	Date	Tasks	Status	Hype
Polyglot Prompt: Multilingual Multitask PrompTraining	Apr 29, 2022	named-entity-recognitionNamed Entity Recognition	CodeCode Available	1
Reliable Visual Question Answering: Abstain Rather Than Answer Incorrectly	Apr 28, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
GRIT: General Robust Image Task Benchmark	Apr 28, 2022	Instance SegmentationKeypoint Detection	CodeCode Available	1
KALA: Knowledge-Augmented Language Model Adaptation	Apr 22, 2022	Domain AdaptationGeneral Knowledge	CodeCode Available	1
Hypergraph Transformer: Weakly-supervised Multi-hop Reasoning for Knowledge-based Visual Question Answering	Apr 22, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
LingYi: Medical Conversational Question Answering System based on Multi-modal Knowledge Graphs	Apr 20, 2022	Conversational Question AnsweringDialogue Generation	CodeCode Available	1
Attention in Reasoning: Dataset, Analysis, and Modeling	Apr 20, 2022	Question AnsweringVisual Question Answering	CodeCode Available	1
TABi: Type-Aware Bi-Encoders for Open-Domain Entity Retrieval	Apr 18, 2022	Entity RetrievalFact Checking	CodeCode Available	1
StepGame: A New Benchmark for Robust Multi-Hop Spatial Reasoning in Texts	Apr 18, 2022	Question AnsweringSpatial Reasoning	CodeCode Available	1
ArcaneQA: Dynamic Program Induction and Contextualized Encoding for Knowledge Base Question Answering	Apr 17, 2022	Knowledge Base Question AnsweringProgram induction	CodeCode Available	1
Improving Passage Retrieval with Zero-Shot Question Generation	Apr 15, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Towards Fine-grained Causal Reasoning and QA	Apr 15, 2022	Question AnsweringSentence	CodeCode Available	1
MoEBERT: from BERT to Mixture-of-Experts via Importance-Guided Adaptation	Apr 15, 2022	Knowledge DistillationMixture-of-Experts	CodeCode Available	1
Exploring Dual Encoder Architectures for Question Answering	Apr 14, 2022	Information RetrievalQuestion Answering	CodeCode Available	1
Can Question Rewriting Help Conversational Question Answering?	Apr 13, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
RuBioRoBERTa: a pre-trained biomedical language model for Russian language biomedical text mining	Apr 8, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Using Interactive Feedback to Improve the Accuracy and Explainability of Question Answering Systems Post-Deployment	Apr 6, 2022	Overall - TestQuestion Answering	CodeCode Available	1
Knowledge Infused Decoding	Apr 6, 2022	counterfactualQuestion Answering	CodeCode Available	1
CLEVR-X: A Visual Reasoning Dataset for Natural Language Explanations	Apr 5, 2022	Explanation GenerationQuestion Answering	CodeCode Available	1
SwapMix: Diagnosing and Regularizing the Over-Reliance on Visual Context in Visual Question Answering	Apr 5, 2022	Data AugmentationQuestion Answering	CodeCode Available	1
Educational Question Generation of Children Storybooks via Question Type Distribution Learning and Event-Centric Summarization	Mar 27, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
Learning to Answer Questions in Dynamic Audio-Visual Scenarios	Mar 26, 2022	audio-visual learningAudio-visual Question Answering	CodeCode Available	1
Fantastic Questions and Where to Find Them: FairytaleQA -- An Authentic Dataset for Narrative Comprehension	Mar 26, 2022	BenchmarkingQuestion Answering	CodeCode Available	1
UKP-SQUARE: An Online Platform for Question Answering Research	Mar 25, 2022	Explainable ModelsInformation Retrieval	CodeCode Available	1
Clickbait Spoiling via Question Answering and Passage Retrieval	Mar 19, 2022	Passage RetrievalQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 63 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified