Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10501–10525 of 10817 papers

Title	Date	Tasks	Status
Context Independent Term Mapper for European Languages	Sep 1, 2013	Information RetrievalMachine Translation	CodeCode Available
Mixing in Some Knowledge: Enriched Context Patterns for Bayesian Word Sense Induction	Sep 1, 2013	Information RetrievalMachine Translation	—Unverified
Optimising Tree Edit Distance with Subtrees for Textual Entailment	Sep 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
A Combined Pattern-based and Distributional Approach for Automatic Hypernym Detection in Dutch.	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
A Dataset for Arabic Textual Entailment	Sep 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Evaluation of baseline information retrieval for Polish open-domain Question Answering system	Sep 1, 2013	Answer SelectionDocument Ranking	—Unverified
Mining Fine-grained Opinion Expressions with Shallow Parsing	Sep 1, 2013	Fine-Grained Opinion AnalysisOpinion Mining	—Unverified
Confidence Estimation for Knowledge Base Population	Sep 1, 2013	Knowledge Base PopulationMachine Translation	—Unverified
Answering Questions from Multiple Documents -- the Role of Multi-Document Summarization	Sep 1, 2013	Abstractive Text SummarizationDocument Summarization	—Unverified
Automatic Evaluation of Summary Using Textual Entailment	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Towards the automatic classification of complex-type nominals	Sep 1, 2013	ClassificationGeneral Classification	—Unverified
Towards a Structured Representation of Generic Concepts and Relations in Large Text Corpora	Sep 1, 2013	Open Information ExtractionQuestion Answering	—Unverified
Using a Weighted Semantic Network for Lexical Semantic Relatedness	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Temporal Relation Classification in Persian and English contexts	Sep 1, 2013	ClassificationGeneral Classification	—Unverified
SPred: Large-scale Harvesting of Semantic Predicates	Aug 1, 2013	Information RetrievalNatural Language Inference	—Unverified
User-Controlled, Robust Natural Language Generation from an Evolving Knowledge Base	Aug 1, 2013	Question AnsweringText Generation	—Unverified
Transfer Learning Based Cross-lingual Knowledge Extraction for Wikipedia	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Why-Question Answering using Intra- and Inter-Sentential Causal Relations	Aug 1, 2013	Question Answering	—Unverified
Statistical Machine Translation Improves Question Retrieval in Community Question Answering via Matrix Factorization	Aug 1, 2013	Community Question AnsweringMachine Translation	—Unverified
Semantic Technologies in IBM Watson	Aug 1, 2013	Information RetrievalOpen-Domain Question Answering	—Unverified
Using Lexical Expansion to Learn Inference Rules from Sparse Data	Aug 1, 2013	Dimensionality ReductionQuestion Answering	—Unverified
What causes a causal relation? Detecting Causal Triggers in Biomedical Scientific Discourse	Aug 1, 2013	Coreference ResolutionNamed Entity Recognition (NER)	—Unverified
SEMILAR: The Semantic Similarity Toolkit	Aug 1, 2013	Paraphrase IdentificationQuestion Answering	—Unverified
Surface Text based Dialogue Models for Virtual Humans	Aug 1, 2013	Question Answering	—Unverified
Transducing Sentences to Syntactic Feature Vectors: an Alternative Way to ``Parse''?	Aug 1, 2013	Graph SimilarityNatural Language Inference	—Unverified

Show:10 25 50

← PrevPage 421 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified