Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6351–6375 of 10817 papers

Title	Date	Tasks	Status
Improving Downstream Task Performance by Treating Numbers as Entities	May 7, 2022	ClassificationQuestion Answering	—Unverified
From Easy to Hard: Learning Language-guided Curriculum for Visual Question Answering on Remote Sensing Data	May 6, 2022	Question AnsweringVisual Question Answering	—Unverified
Translating Place-Related Questions to GeoSPARQL Queries	May 6, 2022	Geographic Question AnsweringQuestion Answering	CodeCode Available
QLEVR: A Diagnostic Dataset for Quantificational Language and Elementary Visual Reasoning	May 6, 2022	DiagnosticQuestion Answering	CodeCode Available
KECP: Knowledge Enhanced Contrastive Prompting for Few-shot Extractive Question Answering	May 6, 2022	Contrastive LearningExtractive Question-Answering	—Unverified
What is Right for Me is Not Yet Right for You: A Dataset for Grounding Relative Directions via Multi-Task Learning	May 5, 2022	Multi-Task LearningQuestion Answering	CodeCode Available
KenSwQuAD -- A Question Answering Dataset for Swahili Low Resource Language	May 4, 2022	BIG-bench Machine LearningQuestion Answering	—Unverified
Analysing the Robustness of Dual Encoders for Dense Retrieval Against Misspellings	May 4, 2022	Contrastive LearningData Augmentation	CodeCode Available
Compositional Task-Oriented Parsing as Abstractive Question Answering	May 4, 2022	abstractive question answeringQuestion Answering	CodeCode Available
Episodic Memory Question Answering	May 3, 2022	AI AgentQuestion Answering	—Unverified
XLTime: A Cross-Lingual Knowledge Transfer Framework for Temporal Expression Extraction	May 3, 2022	Causal InferenceInformation Retrieval	CodeCode Available
Answer-Me: Multi-Task Open-Vocabulary Visual Question Answering	May 2, 2022	DecoderImage Captioning	—Unverified
Clustering Examples in Multi-Dataset Benchmarks with Item Response Theory	May 1, 2022	ClusteringNatural Language Inference	—Unverified
Vision-Language Pretraining: Current Trends and the Future	May 1, 2022	Question AnsweringRepresentation Learning	—Unverified
ViLMedic: a framework for research at the intersection of vision and language in medical AI	May 1, 2022	Medical Visual Question AnsweringQuestion Answering	—Unverified
Fantastic Questions and Where to Find Them: FairytaleQA – An Authentic Dataset for Narrative Comprehension	May 1, 2022	BenchmarkingQuestion Answering	—Unverified
A Knowledge storage and semantic space alignment Method for Multi-documents dialogue generation	May 1, 2022	ArticlesDialogue Generation	—Unverified
Explainable Assessment of Healthcare Articles with QA	May 1, 2022	ArticlesExplanation Generation	—Unverified
MTL-SLT: Multi-Task Learning for Spoken Language Tasks	May 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ethics Sheets for AI Tasks	May 1, 2022	ArticlesEmotion Recognition	—Unverified
MMCoQA: Conversational Question Answering over Text, Tables, and Images	May 1, 2022	BenchmarkingConversational Question Answering	CodeCode Available
Answer-level Calibration for Free-form Multiple Choice Question Answering	May 1, 2022	FormLanguage Modeling	CodeCode Available
ELQA: A Corpus of Metalinguistic Questions and Answers about English	May 1, 2022	Answer GenerationQuestion Answering	CodeCode Available
Overview of the MedVidQA 2022 Shared Task on Medical Video Question-Answering	May 1, 2022	Question AnsweringVideo Classification	—Unverified
A Copy-Augmented Generative Model for Open-Domain Question Answering	May 1, 2022	Natural QuestionsOpen-Domain Question Answering	—Unverified

Show:10 25 50

← PrevPage 255 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified