Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10601–10625 of 10817 papers

Title	Date	Tasks	Status
HENRY-CORE: Domain Adaptation and Stacking for Text Similarity	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
INAOE\_UPV-CORE: Extracting Word Associations from Document Corpora to estimate Semantic Textual Similarity	Jun 1, 2013	Document SummarizationInformation Retrieval	—Unverified
JU\_CSE: A CRF Based Approach to Annotation of Temporal Expression, Event and Temporal Relations	Jun 1, 2013	Document SummarizationMachine Translation	—Unverified
LIMSIILES: Basic English Substitution for Student Answer Assessment at SemEval 2013	Jun 1, 2013	Language ModellingMachine Translation	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified
Coarse to Fine Grained Sense Disambiguation in Wikipedia	Jun 1, 2013	Coreference ResolutionInformation Retrieval	—Unverified
ECNUCS: Measuring Short Text Semantic Equivalence Using Multiple Similarity Measurements	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
DeepPurple: Lexical, String and Affective Feature Fusion for Sentence-Level Semantic Similarity Estimation	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
Combining Heterogeneous Models for Measuring Relational Similarity	Jun 1, 2013	Question Answering	—Unverified
Finding What Matters in Questions	Jun 1, 2013	Information RetrievalQuestion Answering	—Unverified
Answer Extraction as Sequence Tagging with Tree Edit Distance	Jun 1, 2013	Dependency ParsingNamed Entity Recognition (NER)	—Unverified
Large-Scale Paraphrasing for Natural Language Understanding	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Identification of Temporal Event Relationships in Biographical Accounts	Jun 1, 2013	Question Answering	—Unverified
TruthTeller: Annotating Predicate Truth	Jun 1, 2013	Question Answering	—Unverified
Rule-Based Semantic Tagging. An Application Undergoing Dictionary Glosses	May 16, 2013	Information RetrievalQuestion Answering	—Unverified
Question Answering Against Very-Large Text Collections	Apr 26, 2013	Information RetrievalQuestion Answering	—Unverified
A Search Task Dataset for German Textual Entailment	Mar 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Annotating Modal Expressions in the Chinese Treebank	Mar 1, 2013	Question AnsweringSentiment Analysis	—Unverified
Toward Fine-grained Annotation of Modality in Text	Mar 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Temporal Relation Classification Based on Temporal Reasoning	Mar 1, 2013	ClassificationGeneral Classification	—Unverified
Subtopic Annotation in a Corpus of News Texts: Steps Towards Automatic Subtopic Segmentation	Jan 1, 2013	Information RetrievalQuestion Answering	—Unverified
Squibs: What Is a Paraphrase?	Jan 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Incremental Tree Substitution Grammar for Parsing and Sentence Prediction	Jan 1, 2013	Language ModelingLanguage Modelling	—Unverified
Combined Distributional and Logical Semantics	Jan 1, 2013	ClusteringQuestion Answering	—Unverified
Modeling Semantic Relations Expressed by Prepositions	Jan 1, 2013	Natural Language InferenceQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 425 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified