Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8401–8425 of 10817 papers

Title	Date	Tasks	Status
Towards Scalable and Reliable Capsule Networks for Challenging NLP Applications	Jun 6, 2019	General ClassificationMulti-Label Text Classification	CodeCode Available
Cross-Lingual Training for Automatic Question Generation	Jun 6, 2019	Natural Language UnderstandingQuestion Answering	CodeCode Available
Towards Interpretable Reinforcement Learning Using Attention Augmented Agents	Jun 6, 2019	Image CaptioningQuestion Answering	CodeCode Available
A Neural Named Entity Recognition and Multi-Type Normalization Tool for Biomedical Text Mining	Jun 4, 2019	ArticlesInformation Retrieval	CodeCode Available
KERMIT: Generative Insertion-Based Modeling for Sequences	Jun 4, 2019	Machine TranslationQuestion Answering	—Unverified
Episodic Memory in Lifelong Language Learning	Jun 3, 2019	Continual LearningGeneral Classification	CodeCode Available
Generating Question Relevant Captions to Aid Visual Question Answering	Jun 3, 2019	General KnowledgeImage Captioning	—Unverified
Question Answering as an Automatic Evaluation Metric for News Article Summarization	Jun 2, 2019	Headline GenerationQuestion Answering	CodeCode Available
CODAH: An Adversarially-Authored Question Answering Dataset for Common Sense	Jun 1, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
CodeForTheChange at SemEval-2019 Task 8: Skip-Thoughts for Fact Checking in Community Question Answering	Jun 1, 2019	Community Question AnsweringFact Checking	—Unverified
FreebaseQA: A New Factoid QA Data Set Matching Trivia-Style Question-Answer Pairs with Freebase	Jun 1, 2019	Question Answeringset matching	CodeCode Available
Alignment over Heterogeneous Embeddings for Question Answering	Jun 1, 2019	AI2 Reasoning ChallengeARC	CodeCode Available
Fermi at SemEval-2019 Task 8: An elementary but effective approach to Question Discernment in Community QA Forums	Jun 1, 2019	Community Question AnsweringQuestion Answering	—Unverified
ProblemSolver at SemEval-2019 Task 10: Sequence-to-Sequence Learning and Expression Trees	Jun 1, 2019	MathQuestion Answering	—Unverified
Predicting Helpful Posts in Open-Ended Discussion Forums: A Neural Architecture	Jun 1, 2019	Community Question AnsweringQuestion Answering	—Unverified
Social-IQ: A Question Answering Benchmark for Artificial Social Intelligence	Jun 1, 2019	Question AnsweringVisual Reasoning	—Unverified
On Knowledge distillation from complex networks for response prediction	Jun 1, 2019	Knowledge DistillationQuestion Answering	—Unverified
AiFu at SemEval-2019 Task 10: A Symbolic and Sub-symbolic Integrated System for SAT Math Question Answering	Jun 1, 2019	MathQuestion Answering	—Unverified
Natural Questions: a Benchmark for Question Answering Research	Jun 1, 2019	Natural QuestionsQuestion Answering	—Unverified
Promotion of Answer Value Measurement with Domain Effects in Community Question Answering Systems	Jun 1, 2019	Answer SelectionCommunity Question Answering	—Unverified
Enhancing Key-Value Memory Neural Networks for Knowledge Based Question Answering	Jun 1, 2019	Question AnsweringReading Comprehension	—Unverified
DiffQue: Estimating Relative Difficulty of Questions in Community Question Answering Services	Jun 1, 2019	Community Question AnsweringQuestion Answering	CodeCode Available
BLCU\_NLP at SemEval-2019 Task 8: A Contextual Knowledge-enhanced GPT Model for Fact Checking	Jun 1, 2019	Community Question AnsweringFact Checking	—Unverified
Dynamic Fusion With Intra- and Inter-Modality Attention Flow for Visual Question Answering	Jun 1, 2019	Question AnsweringVisual Question Answering	—Unverified
DUTH at SemEval-2019 Task 8: Part-Of-Speech Features for Question Classification	Jun 1, 2019	Community Question AnsweringFact Checking	—Unverified

Show:10 25 50

← PrevPage 337 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified