Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10651–10700 of 10817 papers

Title	Date	Tasks	Status
Towards Two-step Multi-document Summarisation for Evidence Based Medicine: A Quantitative Analysis	Dec 1, 2012	Question Answering	—Unverified
The Use of Dependency Relation Graph to Enhance the Term Weighting in Question Retrieval	Dec 1, 2012	Information RetrievalQuestion Answering	—Unverified
Simple or Complex? Classifying Questions by Answering Complexity	Dec 1, 2012	Question Answering	—Unverified
Towards a thematic role based target identification model for question answering	Dec 1, 2012	Question Answering	—Unverified
Structured and Logical Representations of Assamese Text for Question-Answering System	Dec 1, 2012	Question Answering	—Unverified
WikiTalk: A Spoken Wikipedia-based Open-Domain Knowledge Access System	Dec 1, 2012	Question Answering	—Unverified
Thread Specific Features are Helpful for Identifying Subjectivity Orientation of Online Forum Threads	Dec 1, 2012	Document SummarizationMulti-Document Summarization	—Unverified
Thai Sentence Paraphrasing from the Lexical Resource	Nov 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Anaphora Annotation in Hindi Dependency TreeBank	Nov 1, 2012	Question AnsweringText Summarization	—Unverified
Combining Social Cognitive Theories with Linguistic Features for Multi-genre Sentiment Analysis	Nov 1, 2012	Question AnsweringSentiment Analysis	—Unverified
Answering Questions Requiring Cross-passage Evidence	Nov 1, 2012	Information RetrievalQuestion Answering	—Unverified
Annotation Scheme for Constructing Sentiment Corpus in Korean	Nov 1, 2012	Document ClassificationQuestion Answering	—Unverified
A Model of Vietnamese Person Named Entity Question Answering System	Nov 1, 2012	ChunkingQuestion Answering	—Unverified
Predicting Answer Location Using Shallow Semantic Analogical Reasoning in a Factoid Question Answering System	Nov 1, 2012	Answer SelectionInformation Retrieval	—Unverified
Language Independent Sentence-Level Subjectivity Analysis with Feature Selection	Nov 1, 2012	feature selectionMachine Translation	—Unverified
Introduction of a Probabilistic Language Model to Non-Factoid Question Answering Using Example Q\&A Pairs	Nov 1, 2012	Language ModelingLanguage Modelling	—Unverified
Explore Person Specific Evidence in Web Person Name Disambiguation	Jul 1, 2012	Entity LinkingInformation Retrieval	—Unverified
Joint Learning of a Dual SMT System for Paraphrase Generation	Jul 1, 2012	Machine TranslationParaphrase Generation	—Unverified
Graph Based Similarity Measures for Synonym Extraction from Parsed Text	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Learning Constraints for Consistent Timeline Extraction	Jul 1, 2012	Question AnsweringSlot Filling	—Unverified
Crowdsourcing Inference-Rule Evaluation	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Improving Word Representations via Global Context and Multiple Word Prototypes	Jul 1, 2012	Document ClassificationInformation Retrieval	—Unverified
No Noun Phrase Left Behind: Detecting and Typing Unlinkable Entities	Jul 1, 2012	Entity LinkingNamed Entity Recognition (NER)	—Unverified
Community Answer Summarization for Multi-Sentence Question with Group L1 Regularization	Jul 1, 2012	Community Question AnsweringQuestion Answering	—Unverified
Qualitative Modeling of Spatial Prepositions and Motion Expressions	Jul 1, 2012	Information RetrievalQuestion Answering	—Unverified
An Unsupervised Ranking Model for Noun-Noun Compositionality	Jul 1, 2012	Information RetrievalMachine Translation	—Unverified
Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides	Jul 1, 2012	Dialogue ManagementQuestion Answering	—Unverified
Collocation Polarity Disambiguation Using Web-based Pseudo Contexts	Jul 1, 2012	Question AnsweringSentiment Analysis	—Unverified
DeepPurple: Estimating Sentence Semantic Similarity using N-gram Regression Models and Web Snippets	Jul 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Efficient Search for Transformation-based Inference	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Crosslingual Induction of Semantic Roles	Jul 1, 2012	Machine TranslationMorphological Analysis	—Unverified
An End-to-End Evaluation of Two Situated Dialog Systems	Jul 1, 2012	Question AnsweringVocal Bursts Valence Prediction	—Unverified
Identifying Constant and Unique Relations by using Time-Series Text	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
How to Evaluate Opinionated Keyphrase Extraction?	Jul 1, 2012	Keyphrase ExtractionMachine Translation	—Unverified
Improving Implicit Discourse Relation Recognition Through Feature Set Optimization	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Efficient Tree-based Approximation for Entailment Graph Learning	Jul 1, 2012	Graph LearningNatural Language Inference	—Unverified
PolyUCOMP: Combining Semantic Vectors with Skip bigrams for Semantic Textual Similarity	Jul 1, 2012	Question AnsweringSemantic Textual Similarity	—Unverified
Prior versus Contextual Emotion of a Word in a Sentence	Jul 1, 2012	Emotion RecognitionQuestion Answering	—Unverified
Adaptive Clustering for Coreference Resolution with Deterministic Rules and Web-Based Language Models	Jul 1, 2012	Clusteringcoreference-resolution	—Unverified
DERI\&UPM: Pushing Corpus Based Relatedness to Similarity: Shared Task System Description	Jul 1, 2012	Document SummarizationMachine Translation	—Unverified
A Probabilistic Lexical Model for Ranking Textual Inferences	Jul 1, 2012	modelNatural Language Inference	—Unverified
How do Negation and Modality Impact on Opinions?	Jul 1, 2012	Natural Language InferenceNegation	—Unverified
Exploring Temporal Vagueness with Mechanical Turk	Jul 1, 2012	Question AnsweringText Summarization	—Unverified
English-Korean Named Entity Transliteration Using Substring Alignment and Re-ranking Methods	Jul 1, 2012	Information RetrievalMachine Translation	—Unverified
ETS: Discriminative Edit Models for Paraphrase Scoring	Jul 1, 2012	Machine TranslationQuestion Answering	—Unverified
Annotating Coordination in the Penn Treebank	Jul 1, 2012	Machine TranslationQuestion Answering	—Unverified
A Reranking Model for Discourse Segmentation using Subtree Features	Jul 1, 2012	ChunkingDialogue Generation	—Unverified
Integrating Location, Visibility, and Question-Answering in a Spoken Dialogue System for Pedestrian City Exploration	Jul 1, 2012	Question Answering	—Unverified
Learning to Temporally Order Medical Events in Clinical Text	Jul 1, 2012	Document SummarizationInformation Retrieval	—Unverified
Mixed Membership Markov Models for Unsupervised Conversation Modeling	Jul 1, 2012	Question AnsweringTopic Models	—Unverified

Show:10 25 50

← PrevPage 214 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified