Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10576–10600 of 10817 papers

Title	Date	Tasks	Status
Transfer Learning Based Cross-lingual Knowledge Extraction for Wikipedia	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Leveraging Synthetic Discourse Data via Multi-task Learning for Implicit Discourse Relation Recognition	Aug 1, 2013	Auxiliary LearningMachine Translation	—Unverified
Automatic Interpretation of the English Possessive	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Name-aware Machine Translation	Aug 1, 2013	Entity LinkingMachine Translation	—Unverified
Combining Intra- and Multi-sentential Rhetorical Parsing for Document-level Discourse Analysis	Aug 1, 2013	Question AnsweringSentence Compression	—Unverified
GlossBoot: Bootstrapping Multilingual Domain Glossaries from the Web	Aug 1, 2013	Question AnsweringWord Sense Disambiguation	—Unverified
Chinese Parsing Exploiting Characters	Aug 1, 2013	Information RetrievalMachine Translation	CodeCode Available
Feature-Based Selection of Dependency Paths in Ad Hoc Information Retrieval	Aug 1, 2013	Ad-Hoc Information RetrievalDocument Ranking	—Unverified
A Novel Architecture For Question Classification Based Indexing Scheme For Efficient Question Answering	Jul 26, 2013	ClassificationGeneral Classification	—Unverified
Web pages segmentation for document selection in Question Answering (Pr\'e-segmentation de pages web et s\'election de documents pertinents en Questions-R\'eponses) [in French]	Jun 1, 2013	Question Answering	—Unverified
SXUCFN-Core: STS Models Integrating FrameNet Parsing Information	Jun 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
UTTime: Temporal Relation Classification using Deep Syntactic Features	Jun 1, 2013	ClassificationDocument Summarization	—Unverified
UniMelb\_NLP-CORE: Integrating predictions from multiple domains and feature sets for estimating semantic textual similarity	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
SemEval-2013 Task 10: Cross-lingual Word Sense Disambiguation	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
Semeval-2013 Task 8: Cross-lingual Textual Entailment for Content Synchronization	Jun 1, 2013	Document SummarizationInformation Retrieval	—Unverified
senti.ue-en: an approach for informally written short texts in SemEval-2013 Sentiment Analysis task	Jun 1, 2013	Question AnsweringSentiment Analysis	—Unverified
UMCC\_DLSI-(EPS): Paraphrases Detection Based on Semantic Distance	Jun 1, 2013	Information RetrievalParaphrase Identification	—Unverified
SUTime: Evaluation in TempEval-3	Jun 1, 2013	Named Entity Recognition (NER)Question Answering	—Unverified
*SEM 2013 shared task: Semantic Textual Similarity	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
SOFTCARDINALITY-CORE: Improving Text Overlap with Distributional Measures for Semantic Textual Similarity	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
UMCC\_DLSI: Textual Similarity based on Lexical-Semantic features	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
ECNUCS: Recognizing Cross-lingual Textual Entailment Using Multiple Text Similarity and Text Difference Measures	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
CNGL: Grading Student Answers by Acts of Translation	Jun 1, 2013	Machine TranslationQuestion Answering	—Unverified
KLUE-CORE: A regression model of semantic textual similarity	Jun 1, 2013	LemmatizationQuestion Answering	—Unverified
LIPN-CORE: Semantic Text Similarity using n-grams, WordNet, Syntactic Analysis, ESA and Information Retrieval based Features	Jun 1, 2013	Information RetrievalNatural Language Inference	—Unverified

Show:10 25 50

← PrevPage 424 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified