Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9051–9100 of 10817 papers

Title	Date	Tasks	Status	Hype
Systems' Agreements and Disagreements in Temporal Processing: An Extensive Error Analysis of the TempEval-3 Task	May 1, 2018	Natural Language InferenceQuestion Answering	—Unverified	0
Towards AMR-BR: A SemBank for Brazilian Portuguese Language	May 1, 2018	Entity LinkingMachine Reading Comprehension	—Unverified	0
Retrofitting Word Representations for Unsupervised Sense Aware Word Similarities	May 1, 2018	Named Entity Recognition (NER)Question Answering	—Unverified	0
A Large Automatically-Acquired All-Words List of Multiword Expressions Scored for Compositionality	May 1, 2018	AllInformation Retrieval	—Unverified	0
Fine-grained Semantic Textual Similarity for Serbian	May 1, 2018	Information RetrievalMachine Translation	—Unverified	0
Automatic Thesaurus Construction for Modern Hebrew	May 1, 2018	Machine TranslationQuestion Answering	—Unverified	0
Enhancing the AI2 Diagrams Dataset Using Rhetorical Structure Theory	May 1, 2018	Question AnsweringVisual Question Answering (VQA)	CodeCode Available	0
Abstract Meaning Representation of Constructions: The More We Include, the Better the Representation	May 1, 2018	Abstract Meaning RepresentationMachine Translation	—Unverified	0
A Corpus to Learn Refer-to-as Relations for Nominals	May 1, 2018	Coreference ResolutionLearning Semantic Representations	—Unverified	0
KRAUTS: A German Temporally Annotated News Corpus	May 1, 2018	Information RetrievalQuestion Answering	CodeCode Available	0
Huge Automatically Extracted Training-Sets for Multilingual Word SenseDisambiguation	May 1, 2018	Question AnsweringSemantic Parsing	—Unverified	0
No more beating about the bush : A Step towards Idiom Handling for Indian Language NLP	May 1, 2018	Machine TranslationQuestion Answering	—Unverified	0
C-HTS: A Concept-based Hierarchical Text Segmentation approach	May 1, 2018	Hierarchical Text SegmentationInformation Retrieval	CodeCode Available	0
Action Verb Corpus	May 1, 2018	Action ClassificationLanguage Acquisition	—Unverified	0
EventWiki: A Knowledge Base of Major Events	May 1, 2018	Question AnsweringSemantic Parsing	—Unverified	0
ETPC - A Paraphrase Identification Corpus Annotated with Extended Paraphrase Typology and Negation	May 1, 2018	Natural Language InferenceNegation	CodeCode Available	0
Korean TimeBank Including Relative Temporal Information	May 1, 2018	Question AnsweringTemporal Information Extraction	—Unverified	0
Weaver: Deep Co-Encoding of Questions and Documents for Machine Reading	Apr 27, 2018	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
An ASP Methodology for Understanding Narratives about Stereotypical Activities	Apr 26, 2018	Question Answering	—Unverified	0
Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents	Apr 25, 2018	Question AnsweringVideo Question Answering	—Unverified	0
End-Task Oriented Textual Entailment via Deep Explorations of Inter-Sentence Interactions	Apr 24, 2018	Natural Language InferencePosition	CodeCode Available	0
TempQuestions: A Benchmark for Temporal Question Answering	Apr 23, 2018	Question Answering	—Unverified	0
How to Seq2seq for SQL	Apr 23, 2018	Question AnsweringTable-based Question Answering	—Unverified	0
Large Scale Scene Text Verification with Guided Attention	Apr 23, 2018	Question AnsweringScene Text Detection	—Unverified	0
Mixing Context Granularities for Improved Entity Linking on Question Answering Data across Entity Categories	Apr 23, 2018	Entity DisambiguationEntity Linking	CodeCode Available	0
QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension	Apr 23, 2018	Machine TranslationQuestion Answering	CodeCode Available	1
Analyzing and Characterizing User Intent in Information-seeking Conversations	Apr 23, 2018	Conversational SearchQuestion Answering	—Unverified	0
Adversarial Training for Community Question Answer Selection Based on Multi-scale Matching	Apr 22, 2018	Answer SelectionGeneral Classification	—Unverified	0
NE-Table: A Neural key-value table for Named Entities	Apr 22, 2018	Goal-Oriented DialogQuestion Answering	CodeCode Available	0
Expert Finding in Community Question Answering: A Review	Apr 21, 2018	Community Question AnsweringEnsemble Learning	—Unverified	0
Generative Stock Question Answering	Apr 21, 2018	DecoderQuestion Answering	—Unverified	0
Unsupervised Natural Language Generation with Denoising Autoencoders	Apr 21, 2018	DenoisingQuestion Answering	CodeCode Available	0
Learning Semantic Textual Similarity from Conversations	Apr 20, 2018	Community Question AnsweringNatural Language Inference	CodeCode Available	0
Phrase-Indexed Question Answering: A New Challenge for Scalable Document Comprehension	Apr 20, 2018	Question AnsweringReading Comprehension	CodeCode Available	0
Putting Question-Answering Systems into Practice: Transfer Learning for Efficient Domain Customization	Apr 19, 2018	Information RetrievalManagement	—Unverified	0
Video based Contextual Question Answering	Apr 19, 2018	Question Answering	—Unverified	0
Robust Machine Comprehension Models via Adversarial Training	Apr 17, 2018	Data AugmentationQuestion Answering	—Unverified	0
Training a Ranking Function for Open-Domain Question Answering	Apr 12, 2018	Information RetrievalOpen-Domain Question Answering	—Unverified	0
QA4IE: A Question Answering based Framework for Information Extraction	Apr 10, 2018	Question AnsweringRelation	CodeCode Available	0
Question Answering over Freebase via Attentive RNN with Similarity Matrix based CNN	Apr 10, 2018	Question Answering	—Unverified	0
Question Type Guided Attention in Visual Question Answering	Apr 6, 2018	Activity RecognitionQuestion Answering	—Unverified	0
Simple and Effective Semi-Supervised Question Answering	Apr 2, 2018	Extractive Question-AnsweringQuestion Answering	—Unverified	0
Spoken SQuAD: A Study of Mitigating the Impact of Speech Recognition Errors on Listening Comprehension	Apr 1, 2018	Question AnsweringReading Comprehension	CodeCode Available	1
Differential Attention for Visual Question Answering	Apr 1, 2018	Question AnsweringVisual Question Answering	CodeCode Available	0
Visual Question Reasoning on General Dependency Tree	Mar 31, 2018	Question AnsweringVisual Question Answering	—Unverified	0
A Language for Function Signature Representations	Mar 31, 2018	Natural Language UnderstandingQuestion Answering	CodeCode Available	0
QDEE: Question Difficulty and Expertise Estimation in Community Question Answering Sites	Mar 31, 2018	Community Question AnsweringQuestion Answering	CodeCode Available	0
DDRprog: A CLEVR Differentiable Dynamic Reasoning Programmer	Mar 30, 2018	Question AnsweringVisual Question Answering	—Unverified	0
Motion-Appearance Co-Memory Networks for Video Question Answering	Mar 29, 2018	Question AnsweringVideo Question Answering	—Unverified	0
Two can play this Game: Visual Dialog with Discriminative Question Generation and Answering	Mar 29, 2018	Image CaptioningQuestion Answering	—Unverified	0

Show:10 25 50

← PrevPage 182 of 217Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified