Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10701–10725 of 10817 papers

Title	Date	Tasks	Status
UMichigan: A Conditional Random Field Model for Resolving the Scope of Negation	Jul 1, 2012	NegationQuestion Answering	—Unverified
UMCC\_DLSI: Multidimensional Lexical-Semantic Textual Similarity	Jul 1, 2012	Machine TranslationNamed Entity Recognition (NER)	—Unverified
sranjans : Semantic Textual Similarity using Maximal Weighted Bipartite Graph Matching	Jul 1, 2012	Graph MatchingNatural Language Inference	—Unverified
University\_Of\_Sheffield: Two Approaches to Semantic Text Similarity	Jul 1, 2012	Information RetrievalNatural Language Inference	—Unverified
Tiantianzhu7:System Description of Semantic Textual Similarity (STS) in the SemEval-2012 (Task 6)	Jul 1, 2012	Machine TranslationQuestion Answering	—Unverified
UAlacant: Using Online Machine Translation for Cross-Lingual Textual Entailment	Jul 1, 2012	Information RetrievalMachine Translation	—Unverified
UKP: Computing Semantic Textual Similarity by Combining Multiple Content Similarity Measures	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
PolyUCOMP: Combining Semantic Vectors with Skip bigrams for Semantic Textual Similarity	Jul 1, 2012	Question AnsweringSemantic Textual Similarity	—Unverified
DeepPurple: Estimating Sentence Semantic Similarity using N-gram Regression Models and Web Snippets	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
DERI\&UPM: Pushing Corpus Based Relatedness to Similarity: Shared Task System Description	Jul 1, 2012	Document SummarizationMachine Translation	—Unverified
ETS: Discriminative Edit Models for Paraphrase Scoring	Jul 1, 2012	Machine TranslationQuestion Answering	—Unverified
Adaptive Clustering for Coreference Resolution with Deterministic Rules and Web-Based Language Models	Jul 1, 2012	Clusteringcoreference-resolution	—Unverified
Monolingual Distributional Similarity for Text-to-Text Generation	Jul 1, 2012	Document SummarizationMulti-Document Summarization	—Unverified
A Probabilistic Lexical Model for Ranking Textual Inferences	Jul 1, 2012	modelNatural Language Inference	—Unverified
An Unsupervised Ranking Model for Noun-Noun Compositionality	Jul 1, 2012	Information RetrievalMachine Translation	—Unverified
Towards Building a Multilingual Semantic Network: Identifying Interlingual Links in Wikipedia	Jul 1, 2012	Information RetrievalNamed Entity Recognition (NER)	—Unverified
UWN: A Large Multilingual Lexical Knowledge Base	Jul 1, 2012	Information RetrievalLink Prediction	—Unverified
IRIS: a Chat-oriented Dialogue System based on the Vector Space Model	Jul 1, 2012	Question AnsweringSpeech Recognition	—Unverified
Qualitative Modeling of Spatial Prepositions and Motion Expressions	Jul 1, 2012	Information RetrievalQuestion Answering	—Unverified
Computational Approaches to Sentence Completion	Jul 1, 2012	Language ModellingQuestion Answering	—Unverified
Learning to Temporally Order Medical Events in Clinical Text	Jul 1, 2012	Document SummarizationInformation Retrieval	—Unverified
Efficient Tree-based Approximation for Entailment Graph Learning	Jul 1, 2012	Graph LearningNatural Language Inference	—Unverified
Crowdsourcing Inference-Rule Evaluation	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Joint Learning of a Dual SMT System for Paraphrase Generation	Jul 1, 2012	Machine TranslationParaphrase Generation	—Unverified
Movie-DiC: a Movie Dialogue Corpus for Research and Development	Jul 1, 2012	Information RetrievalMachine Translation	—Unverified

Show:10 25 50

← PrevPage 429 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified