Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7176–7200 of 10817 papers

Title	Date	Tasks	Status	Hype
Medical Knowledge-enriched Textual Entailment Framework	Nov 10, 2020	Data AugmentationMedical Question Answering	—Unverified	0
Don't Read Too Much into It: Adaptive Computation for Open-Domain Question Answering	Nov 10, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified	0
Generating Fact Checking Briefs	Nov 10, 2020	Fact CheckingQuestion Answering	—Unverified	0
CapWAP: Captioning with a Purpose	Nov 9, 2020	Image CaptioningQuestion Answering	—Unverified	0
Automated Discovery of Mathematical Definitions in Text with Deep Neural Networks	Nov 9, 2020	Binary ClassificationDefinition Extraction	—Unverified	0
VisBERT: Hidden-State Visualizations for Transformers	Nov 9, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles	Nov 7, 2020	Natural Language InferenceQuestion Answering	CodeCode Available	0
Knowledge-driven Data Construction for Zero-shot Evaluation in Commonsense Question Answering	Nov 7, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Explainable Artificial Intelligence Recommendation System by Leveraging the Semantics of Adverse Childhood Experiences: Proof-of-Concept Prototype Development	Nov 6, 2020	Explainable artificial intelligenceGraph Generation	—Unverified	0
Disentangling 3D Prototypical Networks For Few-Shot Concept Learning	Nov 6, 2020	3D geometry3D Object Detection	CodeCode Available	1
Explain by Evidence: An Explainable Memory-based Neural Network for Question Answering	Nov 5, 2020	Question Answering	—Unverified	0
EXAMS: A Multi-Subject High School Examinations Dataset for Cross-Lingual and Multilingual Question Answering	Nov 5, 2020	Question AnsweringTransfer Learning	CodeCode Available	1
Language Model is All You Need: Natural Language Understanding as Question Answering	Nov 5, 2020	AllLanguage Modeling	—Unverified	0
Improving Commonsense Question Answering by Graph-based Iterative Retrieval over Multiple Knowledge Sources	Nov 5, 2020	Language ModelingLanguage Modelling	—Unverified	0
Context-Aware Answer Extraction in Question Answering	Nov 5, 2020	Multi-Task LearningPrediction	CodeCode Available	1
JNLP Team: Deep Learning for Legal Processing in COLIEE 2020	Nov 4, 2020	Deep LearningInformation Retrieval	CodeCode Available	0
Muti-view Mouse Social Behaviour Recognition with Deep Graphical Model	Nov 4, 2020	Question Answering	CodeCode Available	0
An Improved Attention for Visual Question Answering	Nov 4, 2020	DecoderQuestion Answering	CodeCode Available	0
Indic-Transformers: An Analysis of Transformer Language Models for Indian Languages	Nov 4, 2020	ClassificationGeneral Classification	CodeCode Available	0
Analyzing Sustainability Reports Using Natural Language Processing	Nov 3, 2020	Question Answering	CodeCode Available	0
CharBERT: Character-aware Pre-trained Language Model	Nov 3, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
The Devil is in the Details: Evaluating Limitations of Transformer-based Methods for Granular Tasks	Nov 2, 2020	Question AnsweringSentiment Analysis	CodeCode Available	0
Reasoning Over History: Context Aware Visual Dialog	Nov 2, 2020	coreference-resolutionCoreference Resolution	—Unverified	0
COSMO: Conditional SEQ2SEQ-based Mixture Model for Zero-Shot Commonsense Question Answering	Nov 2, 2020	Question Answering	CodeCode Available	0
Constructing A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps	Nov 2, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1

Show:10 25 50

← PrevPage 288 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified