Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5601–5625 of 10817 papers

Title	Date	Tasks	Status	Hype
XLTime: A Cross-Lingual Knowledge Transfer Framework for Temporal Expression Extraction	May 3, 2022	Causal InferenceInformation Retrieval	CodeCode Available	0
Episodic Memory Question Answering	May 3, 2022	AI AgentQuestion Answering	—Unverified	0
DrugEHRQA: A Question Answering Dataset on Structured and Unstructured Electronic Health Records For Medicine Related Queries	May 3, 2022	Question AnsweringText to SQL	CodeCode Available	1
Answer-Me: Multi-Task Open-Vocabulary Visual Question Answering	May 2, 2022	DecoderImage Captioning	—Unverified	0
Paragraph-based Transformer Pre-training for Multi-Sentence Inference	May 2, 2022	Answer SelectionFact Verification	CodeCode Available	1
Systematic Inequalities in Language Technology Performance across the World’s Languages	May 1, 2022	Dependency ParsingMachine Translation	CodeCode Available	0
Ethics Sheets for AI Tasks	May 1, 2022	ArticlesEmotion Recognition	—Unverified	0
A Copy-Augmented Generative Model for Open-Domain Question Answering	May 1, 2022	Natural QuestionsOpen-Domain Question Answering	—Unverified	0
Vision-Language Pretraining: Current Trends and the Future	May 1, 2022	Question AnsweringRepresentation Learning	—Unverified	0
Predicting Difficulty and Discrimination of Natural Language Questions	May 1, 2022	Active LearningQuestion Answering	—Unverified	0
Unsupervised multiple-choice question generation for out-of-domain Q&A fine-tuning	May 1, 2022	Multiple-choiceQuestion Answering	—Unverified	0
MMCoQA: Conversational Question Answering over Text, Tables, and Images	May 1, 2022	BenchmarkingConversational Question Answering	CodeCode Available	0
Integrating Question Rewrites in Conversational Question Answering: A Reinforcement Learning Approach	May 1, 2022	Conversational Question AnsweringQuestion Answering	—Unverified	0
HOSMEL: A Hot-Swappable Modularized Entity Linking Toolkit for Chinese	May 1, 2022	Entity LinkingQuestion Answering	CodeCode Available	1
ViLMedic: a framework for research at the intersection of vision and language in medical AI	May 1, 2022	Medical Visual Question AnsweringQuestion Answering	—Unverified	0
Clustering Examples in Multi-Dataset Benchmarks with Item Response Theory	May 1, 2022	ClusteringNatural Language Inference	—Unverified	0
Fantastic Questions and Where to Find Them: FairytaleQA – An Authentic Dataset for Narrative Comprehension	May 1, 2022	BenchmarkingQuestion Answering	—Unverified	0
A Knowledge storage and semantic space alignment Method for Multi-documents dialogue generation	May 1, 2022	ArticlesDialogue Generation	—Unverified	0
Explainable Assessment of Healthcare Articles with QA	May 1, 2022	ArticlesExplanation Generation	—Unverified	0
MTL-SLT: Multi-Task Learning for Spoken Language Tasks	May 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Answer-level Calibration for Free-form Multiple Choice Question Answering	May 1, 2022	FormLanguage Modeling	CodeCode Available	0
Towards Generalizable Methods for Automating Risk Score Calculation	May 1, 2022	Decision MakingQuestion Answering	—Unverified	0
ANNA”:" Enhanced Language Representation for Question Answering	May 1, 2022	Language ModelingLanguage Modelling	—Unverified	0
Distilling Salient Reviews with Zero Labels	May 1, 2022	Question Answering	—Unverified	0
BEEDS: Large-Scale Biomedical Event Extraction using Distant Supervision and Question Answering	May 1, 2022	Event ExtractionKnowledge Base Population	CodeCode Available	0

Show:10 25 50

← PrevPage 225 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified