Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10501–10525 of 10817 papers

Title	Date	Tasks	Status
A Combined Pattern-based and Distributional Approach for Automatic Hypernym Detection in Dutch.	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
A Dataset for Arabic Textual Entailment	Sep 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Context Independent Term Mapper for European Languages	Sep 1, 2013	Information RetrievalMachine Translation	CodeCode Available
Automatic Evaluation of Summary Using Textual Entailment	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Answering Questions from Multiple Documents -- the Role of Multi-Document Summarization	Sep 1, 2013	Abstractive Text SummarizationDocument Summarization	—Unverified
Using a Weighted Semantic Network for Lexical Semantic Relatedness	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Temporal Relation Classification in Persian and English contexts	Sep 1, 2013	ClassificationGeneral Classification	—Unverified
Towards a Structured Representation of Generic Concepts and Relations in Large Text Corpora	Sep 1, 2013	Open Information ExtractionQuestion Answering	—Unverified
Evaluation of baseline information retrieval for Polish open-domain Question Answering system	Sep 1, 2013	Answer SelectionDocument Ranking	—Unverified
Confidence Estimation for Knowledge Base Population	Sep 1, 2013	Knowledge Base PopulationMachine Translation	—Unverified
Mining Fine-grained Opinion Expressions with Shallow Parsing	Sep 1, 2013	Fine-Grained Opinion AnalysisOpinion Mining	—Unverified
Optimising Tree Edit Distance with Subtrees for Textual Entailment	Sep 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Mixing in Some Knowledge: Enriched Context Patterns for Bayesian Word Sense Induction	Sep 1, 2013	Information RetrievalMachine Translation	—Unverified
Towards the automatic classification of complex-type nominals	Sep 1, 2013	ClassificationGeneral Classification	—Unverified
Using a Random Forest Classifier to recognise translations of biomedical terms across languages	Aug 1, 2013	Information RetrievalMachine Translation	—Unverified
Transducing Sentences to Syntactic Feature Vectors: an Alternative Way to ``Parse''?	Aug 1, 2013	Graph SimilarityNatural Language Inference	—Unverified
Semantic Technologies in IBM Watson	Aug 1, 2013	Information RetrievalOpen-Domain Question Answering	—Unverified
Surface Text based Dialogue Models for Virtual Humans	Aug 1, 2013	Question Answering	—Unverified
Named Entity Recognition in Estonian	Aug 1, 2013	named-entity-recognitionNamed Entity Recognition	—Unverified
AIDA: Artificial Intelligent Dialogue Agent	Aug 1, 2013	Dialogue ManagementQuestion Answering	—Unverified
Frequently Asked Questions Retrieval for Croatian Based on Semantic Textual Similarity	Aug 1, 2013	Question AnsweringRetrieval	—Unverified
Answer Extraction by Recursive Parse Tree Descent	Aug 1, 2013	Language ModellingQuestion Answering	—Unverified
Leveraging Crowdsourcing for Paraphrase Recognition	Aug 1, 2013	Information RetrievalMachine Translation	—Unverified
A Multithreaded Conversational Interface for Pedestrian Navigation and Question Answering	Aug 1, 2013	Question AnsweringSpoken Dialogue Systems	—Unverified
MT Quality Estimation: The CMU System for WMT’13	Aug 1, 2013	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 421 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified