Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10301–10325 of 10817 papers

Title	Date	Tasks	Status
Building English-Vietnamese Named Entity Corpus with Aligned Bilingual News Articles	Aug 1, 2014	ArticlesInformation Retrieval	—Unverified
CMU: Arc-Factored, Discriminative Semantic Dependency Parsing	Aug 1, 2014	ARCDependency Parsing	—Unverified
Automatic Compound Processing: Compound Splitting and Semantic Analysis for Afrikaans and Dutch	Aug 1, 2014	Machine TranslationQuestion Answering	—Unverified
Towards Model Driven Architectures for Human Language Technologies	Aug 1, 2014	Code Generationmodel	—Unverified
Unsupervised Verb Inference from Nouns Crossing Root Boundary	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Towards an open-domain conversational system fully based on natural language processing	Aug 1, 2014	Open-Domain Question AnsweringQuestion Answering	—Unverified
SemEval-2014 Task 6: Supervised Semantic Parsing of Robotic Spatial Commands	Aug 1, 2014	Question AnsweringRelation Extraction	—Unverified
SemEval-2014 Task 10: Multilingual Semantic Textual Similarity	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Sense and Similarity: A Study of Sense-level Similarity Measures	Aug 1, 2014	Information RetrievalQuestion Answering	—Unverified
Word Clustering Based on Un-LP Algorithm	Aug 1, 2014	ClusteringDependency Parsing	—Unverified
SemantiKLUE: Robust Semantic Similarity at Multiple Levels Using Maximum Weight Matching	Aug 1, 2014	Question AnsweringSemantic Similarity	—Unverified
Towards Identifying Hindi/Urdu Noun Templates in Support of a Large-Scale LFG Grammar	Aug 1, 2014	Question Answering	—Unverified
Semantic Roles in Grammar Engineering	Aug 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
What or Who is Multilingual Watson?	Aug 1, 2014	Information RetrievalNamed Entity Recognition (NER)	—Unverified
UoW: Multi-task Learning Gaussian Process for Semantic Textual Similarity	Aug 1, 2014	Domain AdaptationInformation Retrieval	—Unverified
Learning Rank Functionals: An Empirical Study	Jul 23, 2014	Information RetrievalLearning-To-Rank	—Unverified
A Survey of Named Entity Recognition in Assamese and other Indian Languages	Jul 9, 2014	Document SummarizationMachine Translation	—Unverified
Natural Human-Machine Interaction for Manipulating Formal Language: Bootstrapping with Mapping (Interaction homme-machine en domaine large \`a l'aide du langage naturel : une amorce par mise en correspondance) [in French]	Jul 1, 2014	Question Answering	—Unverified
User evaluation of a multiple answer extraction system on the Web (\'Evaluation d'un syst\`eme d'extraction de r\'eponses multiples sur le Web par comparaison \`a des humains) [in French]	Jul 1, 2014	Question Answering	—Unverified
A survey on phrase structure learning methods for text classification	Jun 21, 2014	ClassificationGeneral Classification	—Unverified
Question Answering with Subgraph Embeddings	Jun 14, 2014	Question Answering	CodeCode Available
Medical Relation Extraction with Manifold Models	Jun 1, 2014	Decision MakingMedical Relation Extraction	—Unverified
Learning to Rank Answer Candidates for Automatic Resolution of Crossword Puzzles	Jun 1, 2014	Learning-To-RankQuestion Answering	—Unverified
Logical Inference on Dependency-based Compositional Semantics	Jun 1, 2014	Question Answering	—Unverified
Context-aware Learning for Sentence-level Sentiment Analysis with Posterior Regularization	Jun 1, 2014	Opinion MiningQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 413 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified