Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10301–10325 of 10817 papers

Title	Date	Tasks	Status
A Comparative Study of Conversion Aided Methods for WordNet Sentence Textual Similarity	Aug 1, 2014	Document ClassificationMachine Translation	—Unverified
Exploiting the Human Computational Effort Dedicated to Message Reply Formatting for Training Discursive Email Segmenters	Aug 1, 2014	Question Answering	—Unverified
Modelling the Semantics of Adjectives in the Ontology-Lexicon Interface	Aug 1, 2014	Question AnsweringText Generation	—Unverified
Proposition Knowledge Graphs	Aug 1, 2014	Knowledge GraphsNatural Language Inference	—Unverified
Mining temporal footprints from Wikipedia	Aug 1, 2014	Question AnsweringTemporal Information Extraction	—Unverified
CMU: Arc-Factored, Discriminative Semantic Dependency Parsing	Aug 1, 2014	ARCDependency Parsing	—Unverified
Compositional Distributional Semantics Models in Chunk-based Smoothed Tree Kernels	Aug 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
DLS@CU: Sentence Similarity from Word Alignment	Aug 1, 2014	Information RetrievalMachine Translation	—Unverified
AI-KU: Using Co-Occurrence Modeling for Semantic Similarity	Aug 1, 2014	Information RetrievalLanguage Modelling	—Unverified
UoW: Multi-task Learning Gaussian Process for Semantic Textual Similarity	Aug 1, 2014	Domain AdaptationInformation Retrieval	—Unverified
Semantic Roles in Grammar Engineering	Aug 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
SemEval-2014 Task 6: Supervised Semantic Parsing of Robotic Spatial Commands	Aug 1, 2014	Question AnsweringRelation Extraction	—Unverified
SemEval-2014 Task 10: Multilingual Semantic Textual Similarity	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Sense and Similarity: A Study of Sense-level Similarity Measures	Aug 1, 2014	Information RetrievalQuestion Answering	—Unverified
SemantiKLUE: Robust Semantic Similarity at Multiple Levels Using Maximum Weight Matching	Aug 1, 2014	Question AnsweringSemantic Similarity	—Unverified
Learning Rank Functionals: An Empirical Study	Jul 23, 2014	Information RetrievalLearning-To-Rank	—Unverified
A Survey of Named Entity Recognition in Assamese and other Indian Languages	Jul 9, 2014	Document SummarizationMachine Translation	—Unverified
Natural Human-Machine Interaction for Manipulating Formal Language: Bootstrapping with Mapping (Interaction homme-machine en domaine large \`a l'aide du langage naturel : une amorce par mise en correspondance) [in French]	Jul 1, 2014	Question Answering	—Unverified
User evaluation of a multiple answer extraction system on the Web (\'Evaluation d'un syst\`eme d'extraction de r\'eponses multiples sur le Web par comparaison \`a des humains) [in French]	Jul 1, 2014	Question Answering	—Unverified
A survey on phrase structure learning methods for text classification	Jun 21, 2014	ClassificationGeneral Classification	—Unverified
Question Answering with Subgraph Embeddings	Jun 14, 2014	Question Answering	CodeCode Available
Aspectual Properties of Conversational Activities	Jun 1, 2014	Question Answering	—Unverified
Evaluation for Partial Event Coreference	Jun 1, 2014	Coreference ResolutionNatural Language Inference	—Unverified
Decomposing Consumer Health Questions	Jun 1, 2014	Question Answering	—Unverified
Addressing Class Imbalance for Improved Recognition of Implicit Discourse Relations	Jun 1, 2014	Natural Language InferenceQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 413 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified