Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10501–10550 of 10817 papers

Title	Date	Tasks	Status
Automatic Evaluation of Summary Using Textual Entailment	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Answering Questions from Multiple Documents -- the Role of Multi-Document Summarization	Sep 1, 2013	Abstractive Text SummarizationDocument Summarization	—Unverified
Context Independent Term Mapper for European Languages	Sep 1, 2013	Information RetrievalMachine Translation	CodeCode Available
A Dataset for Arabic Textual Entailment	Sep 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
A Combined Pattern-based and Distributional Approach for Automatic Hypernym Detection in Dutch.	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Using a Weighted Semantic Network for Lexical Semantic Relatedness	Sep 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Towards a Structured Representation of Generic Concepts and Relations in Large Text Corpora	Sep 1, 2013	Open Information ExtractionQuestion Answering	—Unverified
Temporal Relation Classification in Persian and English contexts	Sep 1, 2013	ClassificationGeneral Classification	—Unverified
Optimising Tree Edit Distance with Subtrees for Textual Entailment	Sep 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Confidence Estimation for Knowledge Base Population	Sep 1, 2013	Knowledge Base PopulationMachine Translation	—Unverified
Evaluation of baseline information retrieval for Polish open-domain Question Answering system	Sep 1, 2013	Answer SelectionDocument Ranking	—Unverified
Mining Fine-grained Opinion Expressions with Shallow Parsing	Sep 1, 2013	Fine-Grained Opinion AnalysisOpinion Mining	—Unverified
Mixing in Some Knowledge: Enriched Context Patterns for Bayesian Word Sense Induction	Sep 1, 2013	Information RetrievalMachine Translation	—Unverified
Towards the automatic classification of complex-type nominals	Sep 1, 2013	ClassificationGeneral Classification	—Unverified
Using a Random Forest Classifier to recognise translations of biomedical terms across languages	Aug 1, 2013	Information RetrievalMachine Translation	—Unverified
Surface Text based Dialogue Models for Virtual Humans	Aug 1, 2013	Question Answering	—Unverified
Semantic Technologies in IBM Watson	Aug 1, 2013	Information RetrievalOpen-Domain Question Answering	—Unverified
Transducing Sentences to Syntactic Feature Vectors: an Alternative Way to ``Parse''?	Aug 1, 2013	Graph SimilarityNatural Language Inference	—Unverified
Frequently Asked Questions Retrieval for Croatian Based on Semantic Textual Similarity	Aug 1, 2013	Question AnsweringRetrieval	—Unverified
Leveraging Crowdsourcing for Paraphrase Recognition	Aug 1, 2013	Information RetrievalMachine Translation	—Unverified
Open-Domain Information Access with Talking Robots	Aug 1, 2013	Dialogue ManagementQuestion Answering	—Unverified
A Structured Distributional Semantic Model : Integrating Structure with Semantics	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
Answer Extraction by Recursive Parse Tree Descent	Aug 1, 2013	Language ModellingQuestion Answering	—Unverified
AIDA: Artificial Intelligent Dialogue Agent	Aug 1, 2013	Dialogue ManagementQuestion Answering	—Unverified
Reinforcement Learning of Two-Issue Negotiation Dialogue Policies	Aug 1, 2013	Question Answeringreinforcement-learning	—Unverified
Named Entity Recognition in Estonian	Aug 1, 2013	named-entity-recognitionNamed Entity Recognition	—Unverified
MT Quality Estimation: The CMU System for WMT’13	Aug 1, 2013	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
A Multithreaded Conversational Interface for Pedestrian Navigation and Question Answering	Aug 1, 2013	Question AnsweringSpoken Dialogue Systems	—Unverified
A Case Study Towards Turkish Paraphrase Alignment	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Interpreting Consumer Health Questions: The Role of Anaphora and Ellipsis	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
User-Controlled, Robust Natural Language Generation from an Evolving Knowledge Base	Aug 1, 2013	Question AnsweringText Generation	—Unverified
The KBGen Challenge	Aug 1, 2013	Question AnsweringText Generation	—Unverified
Multilingual WSD-like Constraints for Paraphrase Extraction	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Learning Adaptable Patterns for Passage Reranking	Aug 1, 2013	Feature EngineeringPassage Reranking	—Unverified
Philosophers are Mortal: Inferring the Truth of Unseen Facts	Aug 1, 2013	Common Sense ReasoningMachine Translation	—Unverified
Dynamic Knowledge-Base Alignment for Coreference Resolution	Aug 1, 2013	coreference-resolutionCoreference Resolution	—Unverified
Cross-lingual Transfer of Semantic Role Labeling Models	Aug 1, 2013	Cross-Lingual TransferLanguage Modelling	—Unverified
A Structured Distributional Semantic Model for Event Co-reference	Aug 1, 2013	Information RetrievalQuestion Answering	—Unverified
A Java Framework for Multilingual Definition and Hypernym Extraction	Aug 1, 2013	Question AnsweringRelation Extraction	—Unverified
Minimum Bayes Risk based Answer Re-ranking for Question Answering	Aug 1, 2013	Machine TranslationQuestion Answering	—Unverified
Question Classification Transfer	Aug 1, 2013	ClassificationGeneral Classification	—Unverified
Question Analysis for Polish Question Answering	Aug 1, 2013	Question AnsweringReading Comprehension	—Unverified
A Lightweight and High Performance Monolingual Word Aligner	Aug 1, 2013	Machine TranslationNatural Language Inference	—Unverified
Learning Semantic Textual Similarity with Structural Representations	Aug 1, 2013	Feature EngineeringNatural Language Inference	—Unverified
Latent Semantic Tensor Indexing for Community-based Question Answering	Aug 1, 2013	Question Answering	—Unverified
Multimodal DBN for Predicting High-Quality Answers in cQA portals	Aug 1, 2013	Question AnsweringText Classification	—Unverified
A Two Level Model for Context Sensitive Inference Rules	Aug 1, 2013	Natural Language InferenceQuestion Answering	—Unverified
Punctuation Prediction with Transition-based Parsing	Aug 1, 2013	Dependency ParsingLanguage Modelling	—Unverified
Learning to Order Natural Language Texts	Aug 1, 2013	Concept-To-Text GenerationDocument Summarization	—Unverified
Deceptive Answer Prediction with User Preference Graph	Aug 1, 2013	Answer SelectionCommunity Question Answering	—Unverified

Show:10 25 50

← PrevPage 211 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified