Question Answering

Question answering can be segmented into domain-specific tasks like community question answering and knowledge-base question answering. Popular benchmark datasets for evaluation question answering systems include SQuAD, HotPotQA, bAbI, TriviaQA, WikiQA, and many others. Models for question answering are typically evaluated on metrics like EM and F1. Some recent top performing models are T5 and XLNet.

( Image credit: SQuAD )

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7326–7350 of 10817 papers

Title	Date	Tasks	Status	Hype
SRLGRN: Semantic Role Labeling Graph Reasoning Network	Oct 7, 2020	Multi-hop Question AnsweringQuestion Answering	CodeCode Available	1
MOCHA: A Dataset for Training and Evaluating Generative Reading Comprehension Metrics	Oct 7, 2020	Question AnsweringReading Comprehension	CodeCode Available	1
Cross-Thought for Sentence Encoder Pre-training	Oct 7, 2020	Information RetrievalLanguage Modeling	CodeCode Available	1
Unsupervised Evaluation for Question Answering with Transformers	Oct 7, 2020	Question Answering	—Unverified	0
Learning to Explain: Datasets and Models for Identifying Valid Reasoning Chains in Multihop Question-Answering	Oct 7, 2020	Question AnsweringReasoning Chain Explanations	CodeCode Available	1
DiPair: Fast and Accurate Distillation for Trillion-Scale Text Matching and Pair Modeling	Oct 7, 2020	Knowledge DistillationQuestion Answering	—Unverified	0
Learning a Cost-Effective Annotation Policy for Question Answering	Oct 7, 2020	Question Answering	CodeCode Available	0
Improving QA Generalization by Concurrent Modeling of Multiple Biases	Oct 7, 2020	Extractive Question-AnsweringQuestion Answering	CodeCode Available	0
Pathological Visual Question Answering	Oct 6, 2020	AI AgentQuestion Answering	—Unverified	0
Neural Mask Generator: Learning to Generate Adaptive Word Maskings for Language Model Adaptation	Oct 6, 2020	Language ModelingLanguage Modelling	CodeCode Available	1
Multi-Fact Correction in Abstractive Text Summarization	Oct 6, 2020	Abstractive Text SummarizationNews Summarization	—Unverified	0
Efficient One-Pass End-to-End Entity Linking for Questions	Oct 6, 2020	CPUEntity Linking	CodeCode Available	2
Efficient Meta Lifelong-Learning with Limited Memory	Oct 6, 2020	Lifelong learningMulti-Task Learning	—Unverified	0
PolicyQA: A Reading Comprehension Dataset for Privacy Policies	Oct 6, 2020	Question AnsweringReading Comprehension	CodeCode Available	1
BERT Knows Punta Cana is not just beautiful, it's gorgeous: Ranking Scalar Adjectives with Contextualised Representations	Oct 6, 2020	Natural Language UnderstandingQuestion Answering	CodeCode Available	0
Universal Natural Language Processing with Limited Annotations: Try Few-shot Textual Entailment as a Start	Oct 6, 2020	coreference-resolutionCoreference Resolution	CodeCode Available	1
Joint Semantics and Data-Driven Path Representation for Knowledge Graph Inference	Oct 6, 2020	Link PredictionQuestion Answering	—Unverified	0
UnQovering Stereotyping Biases via Underspecified Questions	Oct 6, 2020	Question Answering	CodeCode Available	1
DaNetQA: a yes/no Question Answering Dataset for the Russian Language	Oct 6, 2020	Question AnsweringSentence	—Unverified	0
Context Modeling with Evidence Filter for Multiple Choice Question Answering	Oct 6, 2020	Machine Reading ComprehensionMultiple-choice	—Unverified	0
Finding the Evidence: Localization-aware Answer Prediction for Text Visual Question Answering	Oct 6, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified	0
InfoBERT: Improving Robustness of Language Models from An Information Theoretic Perspective	Oct 5, 2020	Natural Language InferenceQuestion Answering	CodeCode Available	1
Attention Guided Semantic Relationship Parsing for Visual Question Answering	Oct 5, 2020	ObjectQuestion Answering	—Unverified	0
When in Doubt, Ask: Generating Answerable and Unanswerable Questions, Unsupervised	Oct 4, 2020	Language ModelingLanguage Modelling	CodeCode Available	0
Tell Me How to Ask Again: Question Data Augmentation with Controllable Rewriting in Continuous Space	Oct 4, 2020	Data AugmentationMachine Reading Comprehension	CodeCode Available	0

Show:10 25 50

← PrevPage 294 of 433Next →

All datasets SQuAD2.0 SQuAD1.1 HotpotQA PIQA BoolQ COPA TriviaQA SQuAD1.1 dev Natural Questions OpenBookQA TruthfulQA MultiRC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	IE-Net (ensemble)	EM	90.94	—	Unverified
2	FPNet (ensemble)	EM	90.87	—	Unverified
3	IE-NetV2 (ensemble)	EM	90.86	—	Unverified
4	SA-Net on Albert (ensemble)	EM	90.72	—	Unverified
5	SA-Net-V2 (ensemble)	EM	90.68	—	Unverified
6	FPNet (ensemble)	EM	90.6	—	Unverified
7	Retro-Reader (ensemble)	EM	90.58	—	Unverified
8	EntitySpanFocusV2 (ensemble)	EM	90.52	—	Unverified
9	TransNets + SFVerifier + SFEnsembler (ensemble)	EM	90.49	—	Unverified
10	EntitySpanFocus+AT (ensemble)	EM	90.45	—	Unverified