Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7526–7550 of 10817 papers

Title	Date	Tasks	Status
Indic-Transformers: An Analysis of Transformer Language Models for Indian Languages	Nov 4, 2020	ClassificationGeneral Classification	CodeCode Available
Analyzing Sustainability Reports Using Natural Language Processing	Nov 3, 2020	Question Answering	CodeCode Available
Reasoning Over History: Context Aware Visual Dialog	Nov 2, 2020	coreference-resolutionCoreference Resolution	—Unverified
The Devil is in the Details: Evaluating Limitations of Transformer-based Methods for Granular Tasks	Nov 2, 2020	Question AnsweringSentiment Analysis	CodeCode Available
COSMO: Conditional SEQ2SEQ-based Mixture Model for Zero-Shot Commonsense Question Answering	Nov 2, 2020	Question Answering	CodeCode Available
Coarse-to-Fine Query Focused Multi-Document Summarization	Nov 1, 2020	Document SummarizationMulti-Document Summarization	—Unverified
CHIME: Cross-passage Hierarchical Memory Network for Generative Review Question Answering	Nov 1, 2020	Question AnsweringText Generation	CodeCode Available
Unsupervised Adaptation of Question Answering Systems via Generative Self-training	Nov 1, 2020	Question AnsweringSentence	—Unverified
PALM: Pre-training an Autoencoding\&Autoregressive Language Model for Context-conditioned Generation	Nov 1, 2020	Abstractive Text SummarizationConversational Response Generation	—Unverified
Open Domain Question Answering based on Text Enhanced Knowledge Graph with Hyperedge Infusion	Nov 1, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
CapWAP: Image Captioning with a Purpose	Nov 1, 2020	Image CaptioningQuestion Answering	—Unverified
On the effectiveness of small, discriminatively pre-trained language representation models for biomedical text mining	Nov 1, 2020	Domain AdaptationGPU	—Unverified
Event Extraction as Multi-turn Question Answering	Nov 1, 2020	Event ExtractionQuestion Answering	—Unverified
Event Extraction as Machine Reading Comprehension	Nov 1, 2020	Event Argument ExtractionEvent Extraction	—Unverified
Can Pre-training help VQA with Lexical Variations?	Nov 1, 2020	Question AnsweringVisual Question Answering	—Unverified
Towards Zero-Shot Conditional Summarization with Adaptive Multi-Task Fine-Tuning	Nov 1, 2020	Question Answering	CodeCode Available
Multi-Task Learning using Dynamic Task Weighting for Conversational Question Answering	Nov 1, 2020	Conversational Question AnsweringConversational Search	—Unverified
Enhancing Question Answering by Injecting Ontological Knowledge through Regularization	Nov 1, 2020	Question AnsweringSemantic Composition	—Unverified
Methods for Numeracy-Preserving Word Embeddings	Nov 1, 2020	Question AnsweringWord Embeddings	—Unverified
AnswerFact: Fact Checking in Product Question Answering	Nov 1, 2020	Fact CheckingMisinformation	—Unverified
Biomedical Event Extraction as Multi-turn Question Answering	Nov 1, 2020	Event ExtractionKnowledge Base Population	CodeCode Available
DSNDM: Deep Siamese Neural Discourse Model with Attention for Text Pairs Categorization and Ranking	Nov 1, 2020	Question Answering	—Unverified
Do Transformers Dream of Inference, or Can Pretrained Generative Models Learn Implicit Inferential Rules?	Nov 1, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
Don’t Read Too Much Into It: Adaptive Computation for Open-Domain Question Answering	Nov 1, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Deeply Embedded Knowledge Representation & Reasoning For Natural Language Question Answering: A Practitioner’s Perspective	Nov 1, 2020	Natural Language UnderstandingQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 302 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified