Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10551–10600 of 10817 papers

Title	Date	Tasks	Status
AIDA: Artificial Intelligent Dialogue Agent	Aug 1, 2013	Dialogue ManagementQuestion Answering	—Unverified
A Lightweight and High Performance Monolingual Word Aligner	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Paraphrase-Driven Learning for Open Question Answering	Aug 1, 2013	Open-Domain Question AnsweringOpen-Ended Question Answering	—Unverified
Automatic Coupling of Answer Extraction and Information Retrieval	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Minimum Bayes Risk based Answer Re-ranking for Question Answering	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Joint Inference for Fine-grained Opinion Extraction	Aug 1, 2013	Fine-Grained Opinion AnalysisQuestion Answering	—Unverified
Philosophers are Mortal: Inferring the Truth of Unseen Facts	Aug 1, 2013	Common Sense ReasoningMachine Translation	—Unverified
Automatic Interpretation of the English Possessive	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Reinforcement Learning of Two-Issue Negotiation Dialogue Policies	Aug 1, 2013	Question Answeringreinforcement-learning	—Unverified
Answer Extraction by Recursive Parse Tree Descent	Aug 1, 2013	Language ModellingQuestion Answering	—Unverified
Latent Semantic Tensor Indexing for Community-based Question Answering	Aug 1, 2013	Question Answering	—Unverified
Question Analysis for Polish Question Answering	Aug 1, 2013	Question AnsweringReading Comprehension	—Unverified
Interpreting Consumer Health Questions: The Role of Anaphora and Ellipsis	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Cross-lingual Transfer of Semantic Role Labeling Models	Aug 1, 2013	Cross-Lingual TransferLanguage Modelling	—Unverified
Joint Inference for Heterogeneous Dependency Parsing	Aug 1, 2013	Dependency ParsingMachine Translation	—Unverified
Combining Intra- and Multi-sentential Rhetorical Parsing for Document-level Discourse Analysis	Aug 1, 2013	Question AnsweringSentence Compression	—Unverified
Evaluating Text Segmentation using Boundary Edit Distance	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Feature-Based Selection of Dependency Paths in Ad Hoc Information Retrieval	Aug 1, 2013	Ad-Hoc Information RetrievalDocument Ranking	—Unverified
Aggregated Word Pair Features for Implicit Discourse Relation Disambiguation	Aug 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
FrameNet on the Way to Babel: Creating a Bilingual FrameNet Using Wiktionary as Interlingual Connection	Aug 1, 2013	Cross-Lingual TransferQuestion Answering	—Unverified
Decipherment	Aug 1, 2013	DeciphermentPart-Of-Speech Tagging	—Unverified
Name-aware Machine Translation	Aug 1, 2013	Entity LinkingMachine Translation	—Unverified
Learning Adaptable Patterns for Passage Reranking	Aug 1, 2013	Feature EngineeringPassage Reranking	—Unverified
Deceptive Answer Prediction with User Preference Graph	Aug 1, 2013	Answer SelectionCommunity Question Answering	—Unverified
Evaluating a City Exploration Dialogue System with Integrated Question-Answering and Pedestrian Navigation	Aug 1, 2013	Question Answering	—Unverified
Leveraging Synthetic Discourse Data via Multi-task Learning for Implicit Discourse Relation Recognition	Aug 1, 2013	Auxiliary LearningMachine Translation	—Unverified
PLIS: a Probabilistic Lexical Inference System	Aug 1, 2013	Information RetrievalNatural Language Inference	—Unverified
A Case Study Towards Turkish Paraphrase Alignment	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Meet EDGAR, a tutoring agent at MONSERRATE	Aug 1, 2013	Question AnsweringSpeech Recognition	—Unverified
Frequently Asked Questions Retrieval for Croatian Based on Semantic Textual Similarity	Aug 1, 2013	Question AnsweringRetrieval	—Unverified
MT Quality Estimation: The CMU System for WMT’13	Aug 1, 2013	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
A Multithreaded Conversational Interface for Pedestrian Navigation and Question Answering	Aug 1, 2013	Question AnsweringSpoken Dialogue Systems	—Unverified
Exploiting Qualitative Information from Automatic Word Alignment for Cross-lingual NLP Tasks	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
A Novel Architecture For Question Classification Based Indexing Scheme For Efficient Question Answering	Jul 26, 2013	ClassificationGeneral Classification	—Unverified
ECNUCS: Measuring Short Text Semantic Equivalence Using Multiple Similarity Measurements	Jun 1, 2013	Information RetrievalMachine Translation	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified
Finding What Matters in Questions	Jun 1, 2013	Information RetrievalQuestion Answering	—Unverified
HENRY-CORE: Domain Adaptation and Stacking for Text Similarity	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
KLUE-CORE: A regression model of semantic textual similarity	Jun 1, 2013	LemmatizationQuestion Answering	—Unverified
INAOE\_UPV-CORE: Extracting Word Associations from Document Corpora to estimate Semantic Textual Similarity	Jun 1, 2013	Document SummarizationInformation Retrieval	—Unverified
CNGL: Grading Student Answers by Acts of Translation	Jun 1, 2013	Machine TranslationQuestion Answering	—Unverified
Coarse to Fine Grained Sense Disambiguation in Wikipedia	Jun 1, 2013	Coreference ResolutionInformation Retrieval	—Unverified
JU\_CSE: A CRF Based Approach to Annotation of Temporal Expression, Event and Temporal Relations	Jun 1, 2013	Document SummarizationMachine Translation	—Unverified
Large-Scale Paraphrasing for Natural Language Understanding	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
DeepPurple: Lexical, String and Affective Feature Fusion for Sentence-Level Semantic Similarity Estimation	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
Combining Heterogeneous Models for Measuring Relational Similarity	Jun 1, 2013	Question Answering	—Unverified
LIPN-CORE: Semantic Text Similarity using n-grams, WordNet, Syntactic Analysis, ESA and Information Retrieval based Features	Jun 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Answer Extraction as Sequence Tagging with Tree Edit Distance	Jun 1, 2013	Dependency ParsingNamed Entity Recognition (NER)	—Unverified
LIMSIILES: Basic English Substitution for Student Answer Assessment at SemEval 2013	Jun 1, 2013	Language ModellingMachine Translation	—Unverified
ECNUCS: Recognizing Cross-lingual Textual Entailment Using Multiple Text Similarity and Text Difference Measures	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified

Show:10 25 50

← PrevPage 212 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified