Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10276–10300 of 10817 papers

Title	Date	Tasks	Status
Generating Supplementary Travel Guides from Social Media	Aug 1, 2014	Community Question AnsweringDocument Summarization	—Unverified
An Analysis of Causality between Events and its Relation to Temporal Information	Aug 1, 2014	Question AnsweringRelation	—Unverified
A Hybrid Approach to Features Representation for Fine-grained Arabic Named Entity Recognition	Aug 1, 2014	named-entity-recognitionNamed Entity Recognition	—Unverified
Knowledge Sharing via Social Login: Exploiting Microblogging Service for Warming up Social Question Answering Websites	Aug 1, 2014	Community Question AnsweringQuestion Answering	—Unverified
Nerdle: Topic-Specific Question Answering Using Wikia Seeds	Aug 1, 2014	Question AnsweringSemantic Role Labeling	—Unverified
Argument structure of adverbial derivatives in Russian	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Exploring Fine-grained Entity Type Constraints for Distantly Supervised Relation Extraction	Aug 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Learning to Summarise Related Sentences	Aug 1, 2014	Question AnsweringSentence Compression	—Unverified
Biomedical/Clinical NLP	Aug 1, 2014	Coreference ResolutionPart-Of-Speech Tagging	—Unverified
Dependency Parsing: Past, Present, and Future	Aug 1, 2014	Dependency ParsingDomain Adaptation	—Unverified
HARPY: Hypernyms and Alignment of Relational Paraphrases	Aug 1, 2014	Question Answering	—Unverified
Converting Phrase Structures to Dependency Structures in Sanskrit	Aug 1, 2014	Machine TranslationQuestion Answering	—Unverified
Unsupervised Verb Inference from Nouns Crossing Root Boundary	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Towards an open-domain conversational system fully based on natural language processing	Aug 1, 2014	Open-Domain Question AnsweringQuestion Answering	—Unverified
What or Who is Multilingual Watson?	Aug 1, 2014	Information RetrievalNamed Entity Recognition (NER)	—Unverified
Hierarchical Topical Segmentation with Affinity Propagation	Aug 1, 2014	Information RetrievalQuestion Answering	—Unverified
A Three-Step Transition-Based System for Non-Projective Dependency Parsing	Aug 1, 2014	Dependency ParsingQuestion Answering	—Unverified
Group Non-negative Matrix Factorization with Natural Categories for Question Retrieval in Community Question Answer Archives	Aug 1, 2014	Community Question AnsweringInformation Retrieval	—Unverified
Building English-Vietnamese Named Entity Corpus with Aligned Bilingual News Articles	Aug 1, 2014	ArticlesInformation Retrieval	—Unverified
Automatic Compound Processing: Compound Splitting and Semantic Analysis for Afrikaans and Dutch	Aug 1, 2014	Machine TranslationQuestion Answering	—Unverified
Experiments with Easy-first nonprojective constituent parsing	Aug 1, 2014	Dependency ParsingMachine Translation	—Unverified
Annotate and Identify Modalities, Speech Acts and Finer-Grained Event Types in Chinese Text	Aug 1, 2014	Machine TranslationQuestion Answering	—Unverified
Towards Identifying Hindi/Urdu Noun Templates in Support of a Large-Scale LFG Grammar	Aug 1, 2014	Question Answering	—Unverified
Word Clustering Based on Un-LP Algorithm	Aug 1, 2014	ClusteringDependency Parsing	—Unverified
Towards Model Driven Architectures for Human Language Technologies	Aug 1, 2014	Code Generationmodel	—Unverified

Show:10 25 50

← PrevPage 412 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified