Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10451–10475 of 10817 papers

Title	Date	Tasks	Status
Aligning Verb Senses in Two Italian Lexical Semantic Resources	Nov 1, 2013	Question AnsweringVocal Bursts Valence Prediction	—Unverified
Determining is-a relationships for Textual Entailment	Nov 1, 2013	Information RetrievalMachine Translation	—Unverified
From Textual Entailment to Knowledgeable Machines	Nov 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Semantic Textual Similarity: past present and future	Nov 1, 2013	Document SummarizationMachine Translation	—Unverified
Textual Inference and Meaning Representation in Human Robot Interaction	Nov 1, 2013	Abstract Meaning RepresentationNatural Language Understanding	—Unverified
Semi-Supervised Answer Extraction from Discussion Forums	Oct 1, 2013	Community Question AnsweringQuestion Answering	—Unverified
University Entrance Examinations as a Benchmark Resource for NLP-based Problem Solving	Oct 1, 2013	Machine TranslationNatural Language Inference	—Unverified
What Information is Helpful for Dependency Based Semantic Role Labeling	Oct 1, 2013	ChunkingDependency Parsing	—Unverified
Using Shallow Semantic Parsing and Relation Extraction for Finding Contradiction in Text	Oct 1, 2013	Document SummarizationMulti-Document Summarization	—Unverified
Exploiting User Search Sessions for the Semantic Categorization of Question-like Informational Search Queries	Oct 1, 2013	Question Answering	—Unverified
Effect of Non-linear Deep Architecture in Sequence Labeling	Oct 1, 2013	ChunkingNamed Entity Recognition (NER)	—Unverified
Learning Based Approaches for Vietnamese Question Classification Using Keywords Extraction from the Web	Oct 1, 2013	General ClassificationQuestion Answering	—Unverified
A Factoid Question Answering System Using Answer Pattern Matching	Oct 1, 2013	Question Answering	—Unverified
Natural Language Query Refinement for Problem Resolution from Crowd-Sourced Semi-Structured Data	Oct 1, 2013	Medical DiagnosisQuestion Answering	—Unverified
Labeled Alignment for Recognizing Textual Entailment	Oct 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Cross-Domain Answer Ranking using Importance Sampling	Oct 1, 2013	Community Question AnsweringQuestion Answering	—Unverified
Mining Japanese Compound Words and Their Pronunciations from Web Pages and Tweets	Oct 1, 2013	Machine TranslationQuestion Answering	—Unverified
A Novel Approach Towards Incorporating Context Processing Capabilities in NLIDB System	Oct 1, 2013	Question Answering	—Unverified
A Lexicon-based Investigation of Research Issues in Japanese Factuality Analysis	Oct 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Chinese Named Entity Abbreviation Generation Using First-Order Logic	Oct 1, 2013	Question AnsweringSentiment Analysis	—Unverified
High Quality Dependency Selection from Automatic Parses	Oct 1, 2013	Dependency ParsingQuestion Answering	—Unverified
Automatically Developing a Fine-grained Arabic Named Entity Corpus and Gazetteer by utilizing Wikipedia	Oct 1, 2013	Question AnsweringTransliteration	—Unverified
An Empirical Study of Combing Multiple Models in Bengali Question Classification	Oct 1, 2013	Decision MakingGeneral Classification	—Unverified
An Empirical Assessment of Contemporary Online Media in Ad-Hoc Corpus Creation for Social Events	Oct 1, 2013	Information RetrievalMachine Translation	—Unverified
An Efficient Active Learning Framework for New Relation Types	Oct 1, 2013	Active LearningQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 419 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified