Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10326–10350 of 10817 papers

Title	Date	Tasks	Status
Robust Domain Adaptation for Relation Extraction via Clustering Consistency	Jun 1, 2014	ClusteringDomain Adaptation	—Unverified
Aspectual Properties of Conversational Activities	Jun 1, 2014	Question Answering	—Unverified
Knowledge-Based Question Answering as Machine Translation	Jun 1, 2014	Machine TranslationQuestion Answering	—Unverified
A Topic Model for Building Fine-grained Domain-specific Emotion Lexicon	Jun 1, 2014	Emotion ClassificationOpinion Mining	—Unverified
Inducing Neural Models of Script Knowledge	Jun 1, 2014	Common Sense ReasoningQuestion Answering	—Unverified
Bilingual Event Extraction: a Case Study on Trigger Type Determination	Jun 1, 2014	Event ExtractionInformation Retrieval	—Unverified
Freebase QA: Information Extraction or Semantic Parsing?	Jun 1, 2014	Open Information ExtractionQuestion Answering	—Unverified
Response-based Learning for Grounded Machine Translation	Jun 1, 2014	Machine TranslationQuestion Answering	—Unverified
Looking for Hyponyms in Vector Space	Jun 1, 2014	Information RetrievalQuestion Answering	—Unverified
Addressing Class Imbalance for Improved Recognition of Implicit Discourse Relations	Jun 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Decomposing Consumer Health Questions	Jun 1, 2014	Question Answering	—Unverified
Evaluation for Partial Event Coreference	Jun 1, 2014	Coreference ResolutionNatural Language Inference	—Unverified
New Word Detection for Sentiment Analysis	Jun 1, 2014	Chinese Word SegmentationEntity Extraction using GAN	—Unverified
Learning Grounded Meaning Representations with Autoencoders	Jun 1, 2014	Document ClassificationInformation Retrieval	—Unverified
A Semiparametric Gaussian Copula Regression Model for Predicting Financial Risks from Earnings Calls	Jun 1, 2014	Question Answeringregression	—Unverified
Large-scale CCG Induction from the Groningen Meaning Bank	Jun 1, 2014	Question AnsweringSemantic Parsing	—Unverified
Information Extraction over Structured Data: Question Answering with Freebase	Jun 1, 2014	Information RetrievalQuestion Answering	—Unverified
Cooking with Semantics	Jun 1, 2014	Question AnsweringSemantic Parsing	—Unverified
Bilingual Active Learning for Relation Classification via Pseudo Parallel Corpora	Jun 1, 2014	Active LearningClassification	—Unverified
How Well can We Learn Interpretable Entity Types from Text?	Jun 1, 2014	Question AnsweringRelation Extraction	—Unverified
Recognizing Implied Predicate-Argument Relationships in Textual Inference	Jun 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
DKPro Keyphrases: Flexible and Reusable Keyphrase Extraction Experiments	Jun 1, 2014	Information RetrievalKeyphrase Extraction	—Unverified
Representation Learning for Text-level Discourse Parsing	Jun 1, 2014	Discourse ParsingQuestion Answering	CodeCode Available
Information Navigation System Based on POMDP that Tracks User Focus	Jun 1, 2014	Dialogue ManagementQuestion Answering	—Unverified
Open Information Extraction for Spanish Language based on Syntactic Constraints	Jun 1, 2014	Common Sense ReasoningOpen Information Extraction	—Unverified

Show:10 25 50

← PrevPage 414 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified