Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10676–10700 of 10817 papers

Title	Date	Tasks	Status
Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides	Jul 1, 2012	Dialogue ManagementQuestion Answering	—Unverified
Integrating Location, Visibility, and Question-Answering in a Spoken Dialogue System for Pedestrian City Exploration	Jul 1, 2012	Question Answering	—Unverified
Contingency and Comparison Relation Labeling and Structure Prediction in Chinese Sentences	Jul 1, 2012	Opinion MiningQuestion Answering	—Unverified
A Reranking Model for Discourse Segmentation using Subtree Features	Jul 1, 2012	ChunkingDialogue Generation	—Unverified
Improving Implicit Discourse Relation Recognition Through Feature Set Optimization	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Learning to Model Multilingual Unrestricted Coreference in OntoNotes	Jul 1, 2012	Coreference ResolutionMachine Translation	—Unverified
A New Minimally-Supervised Framework for Domain Word Sense Disambiguation	Jul 1, 2012	Machine TranslationQuestion Answering	—Unverified
Excitatory or Inhibitory: A New Semantic Orientation Extracts Contradiction and Causality from the Web	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Learning Constraints for Consistent Timeline Extraction	Jul 1, 2012	Question AnsweringSlot Filling	—Unverified
Learning Verb Inference Rules from Linguistically-Motivated Evidence	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Collocation Polarity Disambiguation Using Web-based Pseudo Contexts	Jul 1, 2012	Question AnsweringSentiment Analysis	—Unverified
Answering Opinion Questions on Products by Exploiting Hierarchical Organization of Consumer Reviews	Jul 1, 2012	Question Answering	—Unverified
Identifying Constant and Unique Relations by using Time-Series Text	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Entity based Q\&A Retrieval	Jul 1, 2012	Question AnsweringRetrieval	—Unverified
PATTY: A Taxonomy of Relational Patterns with Semantic Types	Jul 1, 2012	Question Answering	—Unverified
Explore Person Specific Evidence in Web Person Name Disambiguation	Jul 1, 2012	Entity LinkingInformation Retrieval	—Unverified
Extracting Opinion Expressions with semi-Markov Conditional Random Fields	Jul 1, 2012	Fine-Grained Opinion AnalysisQuestion Answering	—Unverified
A Novel Discriminative Framework for Sentence-Level Discourse Analysis	Jul 1, 2012	Question AnsweringSentence	—Unverified
No Noun Phrase Left Behind: Detecting and Typing Unlinkable Entities	Jul 1, 2012	Entity LinkingNamed Entity Recognition (NER)	—Unverified
Mixed Membership Markov Models for Unsupervised Conversation Modeling	Jul 1, 2012	Question AnsweringTopic Models	—Unverified
Why Question Answering using Sentiment Analysis and Word Classes	Jul 1, 2012	Question AnsweringSentiment Analysis	—Unverified
SAGAN: An approach to Semantic Textual Similarity based on Textual Entailment	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
SemEval-2012 Task 6: A Pilot on Semantic Textual Similarity	Jul 1, 2012	Coreference ResolutionMachine Translation	—Unverified
SAGAN: A Machine Translation Approach for Cross-Lingual Textual Entailment	Jul 1, 2012	Document SummarizationInformation Retrieval	—Unverified
Semeval-2012 Task 8: Cross-lingual Textual Entailment for Content Synchronization	Jul 1, 2012	Document SummarizationInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 428 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified