Reading Comprehension

Most current question answering datasets frame the task as reading comprehension where the question is about a paragraph or document and the answer often is a span in the document.

Some specific tasks of reading comprehension include multi-modal machine reading comprehension and textual machine reading comprehension, among others. In the literature, machine reading comprehension can be divide into four categories: cloze style, multiple choice, span prediction, and free-form answer. Read more about each category here.

Benchmark datasets used for testing a model's reading comprehension abilities include MovieQA, ReCoRD, and RACE, among others.

The Machine Reading group at UCL also provides an overview of reading comprehension tasks.

Figure source: A Survey on Machine Reading Comprehension: Tasks, Evaluation Metrics and Benchmark Datasets

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 1760 papers

Title	Date	Tasks	Status	Hype
XLNet: Generalized Autoregressive Pretraining for Language Understanding	Jun 19, 2019	Audio Question AnsweringChinese Reading Comprehension	CodeCode Available	1
Pre-Training with Whole Word Masking for Chinese BERT	Jun 19, 2019	Document ClassificationGeneral Classification	CodeCode Available	3
Automatic learner summary assessment for reading comprehension	Jun 18, 2019	Reading Comprehension	—Unverified	0
Zero-Shot Entity Linking by Reading Entity Descriptions	Jun 18, 2019	Entity LinkingReading Comprehension	CodeCode Available	1
Structured Pruning of Recurrent Neural Networks through Neuron Selection	Jun 17, 2019	Language ModelingLanguage Modelling	—Unverified	0
Learning to Ask Unanswerable Questions for Machine Reading Comprehension	Jun 14, 2019	Data AugmentationMachine Reading Comprehension	—Unverified	0
Augmenting Neural Networks with First-order Logic	Jun 14, 2019	ChunkingNatural Language Inference	CodeCode Available	0
E3: Entailment-driven Extracting and Editing for Conversational Machine Reading	Jun 12, 2019	Reading Comprehension	CodeCode Available	1
Explore, Propose, and Assemble: An Interpretable Model for Multi-Hop Reading Comprehension	Jun 12, 2019	Multi-Hop Reading ComprehensionReading Comprehension	CodeCode Available	0
Neural Arabic Question Answering	Jun 12, 2019	ArticlesInformation Retrieval	CodeCode Available	0
Retrieve, Read, Rerank: Towards End-to-End Multi-Document Reading Comprehension	Jun 11, 2019	Question AnsweringReading Comprehension	CodeCode Available	0
A Survey on Neural Machine Reading Comprehension	Jun 10, 2019	Machine Reading ComprehensionReading Comprehension	—Unverified	0
RankQA: Neural Question Answering with Answer Re-Ranking	Jun 7, 2019	Question AnsweringReading Comprehension	CodeCode Available	0
Multi-hop Reading Comprehension through Question Decomposition and Rescoring	Jun 7, 2019	Decision MakingMulti-Hop Reading Comprehension	CodeCode Available	0
Compositional Questions Do Not Necessitate Multi-hop Reasoning	Jun 7, 2019	Information RetrievalMulti-Hop Reading Comprehension	CodeCode Available	0
Conversing by Reading: Contentful Neural Conversation with On-demand Machine Reading	Jun 6, 2019	DiversityInformativeness	CodeCode Available	0
Generating Question-Answer Hierarchies	Jun 6, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
ChID: A Large-scale Chinese IDiom Dataset for Cloze Test	Jun 4, 2019	Cloze TestReading Comprehension	CodeCode Available	0
Question Answering as an Automatic Evaluation Metric for News Article Summarization	Jun 2, 2019	Headline GenerationQuestion Answering	CodeCode Available	0
Understanding the Polarity of Events in the Biomedical Literature: Deep Learning vs. Linguistically-informed Methods	Jun 1, 2019	Deep LearningReading Comprehension	—Unverified	0
Eidos, INDRA, \& Delphi: From Free Text to Executable Causal Models	Jun 1, 2019	Decision MakingReading Comprehension	CodeCode Available	0
Document-Level N-ary Relation Extraction with Multiscale Representation Learning	Jun 1, 2019	Reading ComprehensionRelation	—Unverified	0
Online Distilling from Checkpoints for Neural Machine Translation	Jun 1, 2019	Knowledge DistillationMachine Translation	—Unverified	0
Yimmon at SemEval-2019 Task 9: Suggestion Mining with Hybrid Augmented Approaches	Jun 1, 2019	Machine Reading ComprehensionReading Comprehension	—Unverified	0
Is It Dish Washer Safe? Automatically Answering ``Yes/No'' Questions Using Customer Reviews	Jun 1, 2019	Question AnsweringReading Comprehension	—Unverified	0
Enhancing Key-Value Memory Neural Networks for Knowledge Based Question Answering	Jun 1, 2019	Question AnsweringReading Comprehension	—Unverified	0
MultiQA: An Empirical Investigation of Generalization and Transfer in Reading Comprehension	May 31, 2019	Reading Comprehension	CodeCode Available	0
A Simple but Effective Method to Incorporate Multi-turn Context with BERT for Conversational Machine Comprehension	May 30, 2019	Language ModelingLanguage Modelling	—Unverified	0
DSReg: Using Distant Supervision as a Regularizer	May 28, 2019	Multi-Task LearningReading Comprehension	—Unverified	0
Simple and Effective Curriculum Pointer-Generator Networks for Reading Comprehension over Long Narratives	May 26, 2019	Reading Comprehension	—Unverified	0
Controlling Risk of Web Question Answering	May 24, 2019	Machine Reading ComprehensionQuestion Answering	—Unverified	0
BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions	May 24, 2019	Question AnsweringReading Comprehension	CodeCode Available	1
MCScript2.0: A Machine Comprehension Corpus Focused on Script Events and Participants	May 23, 2019	Reading Comprehension	—Unverified	0
Multi-hop Reading Comprehension via Deep Reinforcement Learning based Document Traversal	May 23, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Answering while Summarizing: Multi-task Learning for Multi-hop QA with Evidence Extraction	May 21, 2019	Answer SelectionExtractive Summarization	—Unverified	0
Adaptation of Deep Bidirectional Multilingual Transformers for Russian Language	May 17, 2019	Natural Language InferenceParaphrase Identification	CodeCode Available	0
Multi-hop Reading Comprehension across Multiple Documents by Reasoning over Heterogeneous Graphs	May 17, 2019	Multi-Hop Reading ComprehensionReading Comprehension	—Unverified	0
Learning Open Information Extraction of Implicit Relations from Reading Comprehension Datasets	May 15, 2019	Common Sense ReasoningImplicit Relations	—Unverified	0
Multi-step Retriever-Reader Interaction for Scalable Open-domain Question Answering	May 14, 2019	Open-Domain Question AnsweringQuestion Answering	CodeCode Available	0
Entity-Relation Extraction as Multi-Turn Question Answering	May 14, 2019	Machine Reading ComprehensionQuestion Answering	CodeCode Available	0
Cognitive Graph for Multi-Hop Reading Comprehension at Scale	May 14, 2019	Graph Neural NetworkMulti-hop Question Answering	CodeCode Available	0
The relational processing limits of classic and contemporary neural network models of language processing	May 12, 2019	Reading ComprehensionRelational Reasoning	CodeCode Available	0
Scalable Neural Theorem Proving on Knowledge Bases and Natural Language	May 1, 2019	Automated Theorem ProvingLink Prediction	—Unverified	0
Routing Networks and the Challenges of Modular and Compositional Computation	Apr 29, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
Understanding Dataset Design Choices for Multi-hop Reasoning	Apr 27, 2019	Multi-hop Question AnsweringMultiple-choice	—Unverified	0
Investigating Prior Knowledge for Challenging Chinese Machine Reading Comprehension	Apr 21, 2019	Data AugmentationLanguage Modelling	CodeCode Available	0
Improving Human Text Comprehension through Semi-Markov CRF-based Neural Section Title Generation	Apr 15, 2019	DecoderReading Comprehension	—Unverified	0
ElimiNet: A Model for Eliminating Options for Reading Comprehension with Multiple Choice Questions	Apr 4, 2019	Multiple-choiceReading Comprehension	CodeCode Available	0
Frustratingly Poor Performance of Reading Comprehension Models on Non-adversarial Examples	Apr 4, 2019	Reading Comprehension	—Unverified	0
Document-Level N-ary Relation Extraction with Multiscale Representation Learning	Apr 4, 2019	Reading ComprehensionRelation	—Unverified	0

Show:10 25 50

← PrevPage 25 of 36Next →

All datasets ReClor RACE MuSeRC AdversarialQA CrowdSource QA RadQA

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Rational Reasoner / IDOL	Test	80.6	—	Unverified
2	AMR-LE-Ensemble	Test	80	—	Unverified
3	MERIt(MERIt-deberta-v2-xxlarge )	Test	79.3	—	Unverified
4	MERIt-deberta-v2-xxlarge deberta.v2.xxlarge.path.override_True.norm_1.1.0.w2.A100.cp200.s42	Test	79.3	—	Unverified
5	Knowledge model	Test	79.2	—	Unverified
6	DeBERTa-v2-xxlarge-AMR-LE-Contraposition	Test	77.2	—	Unverified
7	LReasoner ensemble	Test	76.1	—	Unverified
8	ELECTRA and ALBERT	Test	71	—	Unverified
9	WWZ	Test	69.7	—	Unverified
10	xlnet-large-uncased [extended data]	Test	69.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ALBERT (Ensemble)	Accuracy	91.4	—	Unverified
2	Megatron-BERT (ensemble)	Accuracy	90.9	—	Unverified
3	ALBERTxxlarge+DUMA(ensemble)	Accuracy	89.8	—	Unverified
4	Megatron-BERT	Accuracy	89.5	—	Unverified
5	XLNet	Accuracy (Middle)	88.6	—	Unverified
6	DeBERTalarge	Accuracy	86.8	—	Unverified
7	B10-10-10	Accuracy	85.7	—	Unverified
8	RoBERTa	Accuracy	83.2	—	Unverified
9	Orca 2-13B	Accuracy	82.87	—	Unverified
10	Orca 2-7B	Accuracy	80.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Golden Transformer	Average F1	0.94	—	Unverified
2	MT5 Large	Average F1	0.84	—	Unverified
3	ruRoberta-large finetune	Average F1	0.83	—	Unverified
4	ruT5-large-finetune	Average F1	0.82	—	Unverified
5	Human Benchmark	Average F1	0.81	—	Unverified
6	ruT5-base-finetune	Average F1	0.77	—	Unverified
7	ruBert-large finetune	Average F1	0.76	—	Unverified
8	ruBert-base finetune	Average F1	0.74	—	Unverified
9	RuGPT3XL few-shot	Average F1	0.74	—	Unverified
10	RuGPT3Large	Average F1	0.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RoBERTa-Large	Overall: F1	64.4	—	Unverified
2	BERT-Large	Overall: F1	62.7	—	Unverified
3	BiDAF	Overall: F1	28.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT	MSE	0.05	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT pretrained on MIMIC-III	Answer F1	63.55	—	Unverified