Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10576–10600 of 10817 papers

Title	Date	Tasks	Status
A Java Framework for Multilingual Definition and Hypernym Extraction	Aug 1, 2013	Question AnsweringRelation Extraction	—Unverified
Multimodal DBN for Predicting High-Quality Answers in cQA portals	Aug 1, 2013	Question AnsweringText Classification	—Unverified
Minimum Bayes Risk based Answer Re-ranking for Question Answering	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
GlossBoot: Bootstrapping Multilingual Domain Glossaries from the Web	Aug 1, 2013	Question AnsweringWord Sense Disambiguation	—Unverified
MT Quality Estimation: The CMU System for WMT’13	Aug 1, 2013	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
Automatic Interpretation of the English Possessive	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Reinforcement Learning of Two-Issue Negotiation Dialogue Policies	Aug 1, 2013	Question Answeringreinforcement-learning	—Unverified
Dynamic Knowledge-Base Alignment for Coreference Resolution	Aug 1, 2013	coreference-resolutionCoreference Resolution	—Unverified
A Novel Architecture For Question Classification Based Indexing Scheme For Efficient Question Answering	Jul 26, 2013	ClassificationGeneral Classification	—Unverified
CNGL: Grading Student Answers by Acts of Translation	Jun 1, 2013	Machine TranslationQuestion Answering	—Unverified
Finding What Matters in Questions	Jun 1, 2013	Information RetrievalQuestion Answering	—Unverified
DLS@CU-CORE: A Simple Machine Learning Model of Semantic Textual Similarity	Jun 1, 2013	BIG-bench Machine LearningInformation Retrieval	—Unverified
Combining Heterogeneous Models for Measuring Relational Similarity	Jun 1, 2013	Question Answering	—Unverified
HENRY-CORE: Domain Adaptation and Stacking for Text Similarity	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
KLUE-CORE: A regression model of semantic textual similarity	Jun 1, 2013	LemmatizationQuestion Answering	—Unverified
DeepPurple: Lexical, String and Affective Feature Fusion for Sentence-Level Semantic Similarity Estimation	Jun 1, 2013	Domain AdaptationMachine Translation	—Unverified
Identification of Temporal Event Relationships in Biographical Accounts	Jun 1, 2013	Question Answering	—Unverified
Large-Scale Paraphrasing for Natural Language Understanding	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
INAOE\_UPV-CORE: Extracting Word Associations from Document Corpora to estimate Semantic Textual Similarity	Jun 1, 2013	Document SummarizationInformation Retrieval	—Unverified
LIMSIILES: Basic English Substitution for Student Answer Assessment at SemEval 2013	Jun 1, 2013	Language ModellingMachine Translation	—Unverified
Coarse to Fine Grained Sense Disambiguation in Wikipedia	Jun 1, 2013	Coreference ResolutionInformation Retrieval	—Unverified
Answer Extraction as Sequence Tagging with Tree Edit Distance	Jun 1, 2013	Dependency ParsingNamed Entity Recognition (NER)	—Unverified
ECNUCS: Recognizing Cross-lingual Textual Entailment Using Multiple Text Similarity and Text Difference Measures	Jun 1, 2013	Machine TranslationNatural Language Inference	—Unverified
LIPN-CORE: Semantic Text Similarity using n-grams, WordNet, Syntactic Analysis, ESA and Information Retrieval based Features	Jun 1, 2013	Information RetrievalNatural Language Inference	—Unverified
JU\_CSE: A CRF Based Approach to Annotation of Temporal Expression, Event and Temporal Relations	Jun 1, 2013	Document SummarizationMachine Translation	—Unverified

Show:10 25 50

← PrevPage 424 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified