Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10551–10575 of 10817 papers

Title	Date	Tasks	Status
Frequently Asked Questions Retrieval for Croatian Based on Semantic Textual Similarity	Aug 1, 2013	Question AnsweringRetrieval	—Unverified
Extracting Definitions and Hypernym Relations relying on Syntactic Dependencies and Support Vector Machines	Aug 1, 2013	Question AnsweringRelation Extraction	—Unverified
Learning Adaptable Patterns for Passage Reranking	Aug 1, 2013	Feature EngineeringPassage Reranking	—Unverified
Leveraging Crowdsourcing for Paraphrase Recognition	Aug 1, 2013	Information RetrievalMachine Translation	—Unverified
Evaluating Text Segmentation using Boundary Edit Distance	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Joint Inference for Heterogeneous Dependency Parsing	Aug 1, 2013	Dependency ParsingMachine Translation	—Unverified
PLIS: a Probabilistic Lexical Inference System	Aug 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Cross-lingual Transfer of Semantic Role Labeling Models	Aug 1, 2013	Cross-Lingual TransferLanguage Modelling	—Unverified
Learning Semantic Textual Similarity with Structural Representations	Aug 1, 2013	Feature EngineeringNatural Language Inference	—Unverified
A Structured Distributional Semantic Model for Event Co-reference	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
A Structured Distributional Semantic Model : Integrating Structure with Semantics	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Aggregated Word Pair Features for Implicit Discourse Relation Disambiguation	Aug 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Align, Disambiguate and Walk: A Unified Approach for Measuring Semantic Similarity	Aug 1, 2013	Information RetrievalLexical Simplification	—Unverified
FrameNet on the Way to Babel: Creating a Bilingual FrameNet Using Wiktionary as Interlingual Connection	Aug 1, 2013	Cross-Lingual TransferQuestion Answering	—Unverified
Combining Intra- and Multi-sentential Rhetorical Parsing for Document-level Discourse Analysis	Aug 1, 2013	Question AnsweringSentence Compression	—Unverified
Question Answering Using Enhanced Lexical Semantic Models	Aug 1, 2013	Answer SelectionOpen-Domain Question Answering	—Unverified
Philosophers are Mortal: Inferring the Truth of Unseen Facts	Aug 1, 2013	Common Sense ReasoningMachine Translation	—Unverified
Interpreting Consumer Health Questions: The Role of Anaphora and Ellipsis	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
A Case Study Towards Turkish Paraphrase Alignment	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
A Lightweight and High Performance Monolingual Word Aligner	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Exploiting Qualitative Information from Automatic Word Alignment for Cross-lingual NLP Tasks	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Question Classification Transfer	Aug 1, 2013	ClassificationGeneral Classification	—Unverified
Leveraging Synthetic Discourse Data via Multi-task Learning for Implicit Discourse Relation Recognition	Aug 1, 2013	Auxiliary LearningMachine Translation	—Unverified
Multilingual WSD-like Constraints for Paraphrase Extraction	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
AIDA: Artificial Intelligent Dialogue Agent	Aug 1, 2013	Dialogue ManagementQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 423 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified