Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10601–10625 of 10817 papers

Title	Date	Tasks	Status
ECNUCS: Measuring Short Text Semantic Equivalence Using Multiple Similarity Measurements	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
UMCC\_DLSI: Textual Similarity based on Lexical-Semantic features	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
TruthTeller: Annotating Predicate Truth	Jun 1, 2013	Question Answering	—Unverified
SemEval-2013 Task 10: Cross-lingual Word Sense Disambiguation	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
SXUCFN-Core: STS Models Integrating FrameNet Parsing Information	Jun 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
*SEM 2013 shared task: Semantic Textual Similarity	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
UTTime: Temporal Relation Classification using Deep Syntactic Features	Jun 1, 2013	ClassificationDocument Summarization	—Unverified
SUTime: Evaluation in TempEval-3	Jun 1, 2013	Named Entity Recognition (NER)Question Answering	—Unverified
Semeval-2013 Task 8: Cross-lingual Textual Entailment for Content Synchronization	Jun 1, 2013	Document SummarizationInformation Retrieval	—Unverified
Web pages segmentation for document selection in Question Answering (Pr\'e-segmentation de pages web et s\'election de documents pertinents en Questions-R\'eponses) [in French]	Jun 1, 2013	Question Answering	—Unverified
UniMelb\_NLP-CORE: Integrating predictions from multiple domains and feature sets for estimating semantic textual similarity	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
SOFTCARDINALITY-CORE: Improving Text Overlap with Distributional Measures for Semantic Textual Similarity	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
UMCC\_DLSI-(EPS): Paraphrases Detection Based on Semantic Distance	Jun 1, 2013	Information RetrievalParaphrase Identification	—Unverified
senti.ue-en: an approach for informally written short texts in SemEval-2013 Sentiment Analysis task	Jun 1, 2013	Question AnsweringSentiment Analysis	—Unverified
Rule-Based Semantic Tagging. An Application Undergoing Dictionary Glosses	May 16, 2013	Information RetrievalQuestion Answering	—Unverified
Question Answering Against Very-Large Text Collections	Apr 26, 2013	Information RetrievalQuestion Answering	—Unverified
A Search Task Dataset for German Textual Entailment	Mar 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Annotating Modal Expressions in the Chinese Treebank	Mar 1, 2013	Question AnsweringSentiment Analysis	—Unverified
Temporal Relation Classification Based on Temporal Reasoning	Mar 1, 2013	ClassificationGeneral Classification	—Unverified
Toward Fine-grained Annotation of Modality in Text	Mar 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Subtopic Annotation in a Corpus of News Texts: Steps Towards Automatic Subtopic Segmentation	Jan 1, 2013	Information RetrievalQuestion Answering	—Unverified
Squibs: What Is a Paraphrase?	Jan 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Modeling Semantic Relations Expressed by Prepositions	Jan 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Good, Great, Excellent: Global Inference of Semantic Intensities	Jan 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Combined Distributional and Logical Semantics	Jan 1, 2013	ClusteringQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 425 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified