Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9501–9525 of 10817 papers

Title	Date	Tasks	Status
C-VQA: A Compositional Split of the Visual Question Answering (VQA) v1.0 Dataset	Apr 26, 2017	Question AnsweringVisual Question Answering	—Unverified
Ruminating Reader: Reasoning with Gated Multi-Hop Attention	Apr 24, 2017	Question AnsweringReading Comprehension	—Unverified
Being Negative but Constructively: Lessons Learnt from Creating Better Visual Question Answering Datasets	Apr 24, 2017	Multiple-choiceQuestion Answering	—Unverified
Learning to Skim Text	Apr 23, 2017	Document ClassificationGeneral Classification	CodeCode Available
Improved Neural Relation Detection for Knowledge Base Question Answering	Apr 20, 2017	Entity LinkingKnowledge Base Question Answering	—Unverified
Answering Complex Questions Using Open Information Extraction	Apr 19, 2017	Open Information ExtractionQuestion Answering	CodeCode Available
SearchQA: A New Q&A Dataset Augmented with Context from a Search Engine	Apr 18, 2017	Open-Domain Question AnsweringQuestion Answering	CodeCode Available
TGIF-QA: Toward Spatio-Temporal Reasoning in Visual Question Answering	Apr 14, 2017	Question AnsweringVisual Question Answering	CodeCode Available
Mining Object Parts from CNNs via Active Question-Answering	Apr 11, 2017	Active LearningObject	—Unverified
Leveraging Term Banks for Answering Complex Questions: A Case for Sparse Vectors	Apr 11, 2017	Open-Domain Question AnsweringQuestion Answering	—Unverified
An Empirical Evaluation of Visual Question Answering for Novel Objects	Apr 8, 2017	Question AnsweringVisual Question Answering	—Unverified
Combining Lexical and Syntactic Features for Detecting Content-dense Texts in News	Apr 3, 2017	ArticlesQuestion Answering	—Unverified
It Takes Two to Tango: Towards Theory of AI's Mind	Apr 3, 2017	AttributeQuestion Answering	—Unverified
Aligned Image-Word Representations Improve Inductive Transfer Across Vision-Language Tasks	Apr 2, 2017	Multi-Task LearningQuestion Answering	—Unverified
Integer Linear Programming formulations in Natural Language Processing	Apr 1, 2017	Dependency ParsingNatural Language Inference	—Unverified
Event-Related Features in Feedforward Neural Networks Contribute to Identifying Causal Relations in Discourse	Apr 1, 2017	PositionQuestion Answering	—Unverified
Assessing SRL Frameworks with Automatic Training Data Expansion	Apr 1, 2017	Question AnsweringSemantic Role Labeling	—Unverified
ParaDi: Dictionary of Paraphrases of Czech Complex Predicates with Light Verbs	Apr 1, 2017	Information RetrievalMachine Translation	—Unverified
Inducing Script Structure from Crowdsourced Event Descriptions via Semi-Supervised Clustering	Apr 1, 2017	ClusteringQuestion Answering	—Unverified
Improving Clinical Diagnosis Inference through Integration of Structured and Unstructured Knowledge	Apr 1, 2017	Information RetrievalQuestion Answering	—Unverified
Discriminating between Similar Languages with Word-level Convolutional Neural Networks	Apr 1, 2017	Language IdentificationQuestion Answering	—Unverified
Arabic Textual Entailment with Word Embeddings	Apr 1, 2017	Machine TranslationNatural Language Inference	—Unverified
Universal Dependencies for Arabic	Apr 1, 2017	Machine TranslationQuestion Answering	—Unverified
Word Similarity Datasets for Indian Languages: Annotation and Baseline Systems	Apr 1, 2017	Dependency ParsingMachine Translation	—Unverified
CASSANDRA: A multipurpose configurable voice-enabled human-computer-interface	Apr 1, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 381 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified