Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9026–9050 of 10817 papers

Title	Date	Tasks	Status
Multi-hop Inference for Sentence-level TextGraphs: How Challenging is Meaningfully Combining Information for Science Question Answering?	May 29, 2018	graph constructionKnowledge Graphs	—Unverified
Semantic Sentence Matching with Densely-connected Recurrent and Co-attentive Information	May 29, 2018	Natural Language InferenceParaphrase Identification	—Unverified
Dependent Gated Reading for Cloze-Style Question Answering	May 26, 2018	Decision MakingQuestion Answering	—Unverified
Think Visually: Question Answering through Virtual Imagery	May 25, 2018	Question AnsweringVisual Commonsense Reasoning	CodeCode Available
Hyperbolic Attention Networks	May 24, 2018	Machine TranslationQuestion Answering	—Unverified
Mining Procedures from Technical Support Documents	May 24, 2018	DiagnosticQuestion Answering	—Unverified
A logical representation of Arabic questions toward automatic passage extraction from the Web	May 23, 2018	Information RetrievalQuestion Answering	—Unverified
Joint Image Captioning and Question Answering	May 22, 2018	Image CaptioningQuestion Answering	—Unverified
Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"	May 21, 2018	Question AnsweringVisual Question Answering	—Unverified
Efficient and Robust Question Answering from Minimal Context over Documents	May 21, 2018	Question AnsweringReading Comprehension	CodeCode Available
Energy-Efficient Inference Accelerator for Memory-Augmented Neural Networks on an FPGA	May 21, 2018	GPUQuestion Answering	—Unverified
A Talker Ensemble: the University of Wrocław's Entry to the NIPS 2017 Conversational Intelligence Challenge	May 21, 2018	ChatbotQuestion Answering	—Unverified
Annotating Electronic Medical Records for Question Answering	May 17, 2018	Question Answering	—Unverified
Composite Semantic Relation Classification	May 16, 2018	BIG-bench Machine LearningClassification	—Unverified
CLINIQA: A Machine Intelligence Based Clinical Question Answering System	May 15, 2018	Answer SelectionInformation Retrieval	—Unverified
Did the Model Understand the Question?	May 14, 2018	modelQuestion Answering	CodeCode Available
I Have Seen Enough: A Teacher Student Network for Video Classification Using Fewer Frames	May 12, 2018	ClassificationGeneral Classification	—Unverified
New Embedded Representations and Evaluation Protocols for Inferring Transitive Relations	May 12, 2018	Question AnsweringRelation	—Unverified
Reciprocal Attention Fusion for Visual Question Answering	May 11, 2018	ObjectQuestion Answering	—Unverified
WikiPassageQA: A Benchmark Collection for Research on Non-factoid Answer Passage Retrieval	May 10, 2018	Information RetrievalOpen-Domain Question Answering	—Unverified
Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification	May 6, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
C-HTS: A Concept-based Hierarchical Text Segmentation approach	May 1, 2018	Hierarchical Text SegmentationInformation Retrieval	CodeCode Available
A Multi-Domain Framework for Textual Similarity. A Case Study on Question-to-Question and Question-Answering Similarity Tasks	May 1, 2018	Community Question AnsweringNatural Language Inference	—Unverified
M-CNER: A Corpus for Chinese Named Entity Recognition in Multi-Domains	May 1, 2018	Chinese Named Entity Recognitionnamed-entity-recognition	—Unverified
Graph Based Semi-Supervised Learning Approach for Tamil POS tagging	May 1, 2018	Graph SimilarityInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 362 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified