Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10551–10600 of 10817 papers

Title	Date	Tasks	Status
Evaluating a City Exploration Dialogue System with Integrated Question-Answering and Pedestrian Navigation	Aug 1, 2013	Question Answering	—Unverified
Paraphrase-Driven Learning for Open Question Answering	Aug 1, 2013	Open-Domain Question AnsweringOpen-Ended Question Answering	—Unverified
Decipherment	Aug 1, 2013	DeciphermentPart-Of-Speech Tagging	—Unverified
Extracting Definitions and Hypernym Relations relying on Syntactic Dependencies and Support Vector Machines	Aug 1, 2013	Question AnsweringRelation Extraction	—Unverified
Evaluating Text Segmentation using Boundary Edit Distance	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Meet EDGAR, a tutoring agent at MONSERRATE	Aug 1, 2013	Question AnsweringSpeech Recognition	—Unverified
Automatic Coupling of Answer Extraction and Information Retrieval	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
PARMA: A Predicate Argument Aligner	Aug 1, 2013	Coreference ResolutionEntity Linking	CodeCode Available
Joint Inference for Heterogeneous Dependency Parsing	Aug 1, 2013	Dependency ParsingMachine Translation	—Unverified
Question Answering Using Enhanced Lexical Semantic Models	Aug 1, 2013	Answer SelectionOpen-Domain Question Answering	—Unverified
Exploiting Qualitative Information from Automatic Word Alignment for Cross-lingual NLP Tasks	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
ParaQuery: Making Sense of Paraphrase Collections	Aug 1, 2013	Document SummarizationInformation Retrieval	—Unverified
Generating Synthetic Comparable Questions for News Articles	Aug 1, 2013	ArticlesQuestion Answering	—Unverified
FrameNet on the Way to Babel: Creating a Bilingual FrameNet Using Wiktionary as Interlingual Connection	Aug 1, 2013	Cross-Lingual TransferQuestion Answering	—Unverified
Aggregated Word Pair Features for Implicit Discourse Relation Disambiguation	Aug 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Joint Inference for Fine-grained Opinion Extraction	Aug 1, 2013	Fine-Grained Opinion AnalysisQuestion Answering	—Unverified
PLIS: a Probabilistic Lexical Inference System	Aug 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Align, Disambiguate and Walk: A Unified Approach for Measuring Semantic Similarity	Aug 1, 2013	Information RetrievalLexical Simplification	—Unverified
SEMILAR: The Semantic Similarity Toolkit	Aug 1, 2013	Paraphrase IdentificationQuestion Answering	—Unverified
What causes a causal relation? Detecting Causal Triggers in Biomedical Scientific Discourse	Aug 1, 2013	Coreference ResolutionNamed Entity Recognition (NER)	—Unverified
Why-Question Answering using Intra- and Inter-Sentential Causal Relations	Aug 1, 2013	Question Answering	—Unverified
Statistical Machine Translation Improves Question Retrieval in Community Question Answering via Matrix Factorization	Aug 1, 2013	Community Question AnsweringMachine Translation	—Unverified
SPred: Large-scale Harvesting of Semantic Predicates	Aug 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Using Lexical Expansion to Learn Inference Rules from Sparse Data	Aug 1, 2013	Dimensionality ReductionQuestion Answering	—Unverified
Universal Conceptual Cognitive Annotation (UCCA)	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Transfer Learning Based Cross-lingual Knowledge Extraction for Wikipedia	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Name-aware Machine Translation	Aug 1, 2013	Entity LinkingMachine Translation	—Unverified
GlossBoot: Bootstrapping Multilingual Domain Glossaries from the Web	Aug 1, 2013	Question AnsweringWord Sense Disambiguation	—Unverified
Chinese Parsing Exploiting Characters	Aug 1, 2013	Information RetrievalMachine Translation	CodeCode Available
Automatic Interpretation of the English Possessive	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Combining Intra- and Multi-sentential Rhetorical Parsing for Document-level Discourse Analysis	Aug 1, 2013	Question AnsweringSentence Compression	—Unverified
Feature-Based Selection of Dependency Paths in Ad Hoc Information Retrieval	Aug 1, 2013	Ad-Hoc Information RetrievalDocument Ranking	—Unverified
Leveraging Synthetic Discourse Data via Multi-task Learning for Implicit Discourse Relation Recognition	Aug 1, 2013	Auxiliary LearningMachine Translation	—Unverified
A Novel Architecture For Question Classification Based Indexing Scheme For Efficient Question Answering	Jul 26, 2013	ClassificationGeneral Classification	—Unverified
Web pages segmentation for document selection in Question Answering (Pr\'e-segmentation de pages web et s\'election de documents pertinents en Questions-R\'eponses) [in French]	Jun 1, 2013	Question Answering	—Unverified
SemEval-2013 Task 10: Cross-lingual Word Sense Disambiguation	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
UniMelb\_NLP-CORE: Integrating predictions from multiple domains and feature sets for estimating semantic textual similarity	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
UTTime: Temporal Relation Classification using Deep Syntactic Features	Jun 1, 2013	ClassificationDocument Summarization	—Unverified
SOFTCARDINALITY-CORE: Improving Text Overlap with Distributional Measures for Semantic Textual Similarity	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
SUTime: Evaluation in TempEval-3	Jun 1, 2013	Named Entity Recognition (NER)Question Answering	—Unverified
SXUCFN-Core: STS Models Integrating FrameNet Parsing Information	Jun 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
senti.ue-en: an approach for informally written short texts in SemEval-2013 Sentiment Analysis task	Jun 1, 2013	Question AnsweringSentiment Analysis	—Unverified
*SEM 2013 shared task: Semantic Textual Similarity	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Semeval-2013 Task 8: Cross-lingual Textual Entailment for Content Synchronization	Jun 1, 2013	Document SummarizationInformation Retrieval	—Unverified
UMCC\_DLSI: Textual Similarity based on Lexical-Semantic features	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
UMCC\_DLSI-(EPS): Paraphrases Detection Based on Semantic Distance	Jun 1, 2013	Information RetrievalParaphrase Identification	—Unverified
LIMSIILES: Basic English Substitution for Student Answer Assessment at SemEval 2013	Jun 1, 2013	Language ModellingMachine Translation	—Unverified
CNGL: Grading Student Answers by Acts of Translation	Jun 1, 2013	Machine TranslationQuestion Answering	—Unverified
Coarse to Fine Grained Sense Disambiguation in Wikipedia	Jun 1, 2013	Coreference ResolutionInformation Retrieval	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 212 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified