Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10726–10750 of 10817 papers

Title	Date	Tasks	Status
Community Answer Summarization for Multi-Sentence Question with Group L1 Regularization	Jul 1, 2012	Community Question AnsweringQuestion Answering	—Unverified
A Discriminative Hierarchical Model for Fast Coreference at Large Scale	Jul 1, 2012	Coreference ResolutionQuestion Answering	—Unverified
Improving Word Representations via Global Context and Multiple Word Prototypes	Jul 1, 2012	Document ClassificationInformation Retrieval	—Unverified
Bayesian Symbol-Refined Tree Substitution Grammars for Syntactic Parsing	Jul 1, 2012	Machine TranslationQuestion Answering	—Unverified
Efficient Search for Transformation-based Inference	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Crosslingual Induction of Semantic Roles	Jul 1, 2012	Machine TranslationMorphological Analysis	—Unverified
Pattern Learning for Relation Extraction with a Hierarchical Topic Model	Jul 1, 2012	Information RetrievalOpen Information Extraction	—Unverified
Sentence Dependency Tagging in Online Question Answering Forums	Jul 1, 2012	Question AnsweringSentence	—Unverified
Text-level Discourse Parsing with Rich Linguistic Features	Jul 1, 2012	Discourse ParsingInformation Retrieval	—Unverified
Unsupervised Relation Discovery with Sense Disambiguation	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Typologie des questions \`a r\'eponses multiples pour un syst\`eme de question-r\'eponse (Typology of Multiple Answer Questions for a Question-answering System) [in French]	Jun 1, 2012	Question Answering	—Unverified
A Study of Heterogeneous Similarity Measures for Semantic Relation Extraction	Jun 1, 2012	Question AnsweringRelation	—Unverified
Constructing a Textual KB from a Biology TextBook	Jun 1, 2012	Question Answering	—Unverified
Knowledge Extraction and Joint Inference Using Tractable Markov Logic	Jun 1, 2012	Decision MakingQuestion Answering	—Unverified
Probabilistic Databases of Universal Schema	Jun 1, 2012	Collaborative FilteringQuestion Answering	—Unverified
Analyzing Patient Records to Establish If and When a Patient Suffered from a Medical Condition	Jun 1, 2012	Information RetrievalQuestion Answering	—Unverified
PREFER: Using a Graph-Based Approach to Generate Paraphrases for Language Learning	Jun 1, 2012	Machine TranslationParaphrase Generation	—Unverified
On-Demand Distributional Semantic Distance and Paraphrasing	Jun 1, 2012	Document SummarizationInformation Retrieval	—Unverified
Predicting Structures in NLP: Constrained Conditional Models and Integer Linear Programming in NLP	Jun 1, 2012	Dependency ParsingFeature Engineering	—Unverified
Natural Language Processing in Watson	Jun 1, 2012	Information RetrievalOpen-Domain Question Answering	—Unverified
Nudging the Envelope of Direct Transfer Methods for Multilingual Named Entity Recognition	Jun 1, 2012	Information RetrievalMachine Translation	—Unverified
100 Things You Always Wanted to Know about Linguistics But Were Afraid to Ask*	Jun 1, 2012	Question AnsweringSentiment Analysis	—Unverified
Grammatical structures for word-level sentiment detection	Jun 1, 2012	Opinion MiningQuestion Answering	—Unverified
Structured Event Retrieval over Microblog Archives	Jun 1, 2012	Question AnsweringRetrieval	—Unverified
Topical Segmentation: a Study of Human Performance and a New Measure of Quality.	Jun 1, 2012	Information RetrievalQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 430 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified