Reading Comprehension

Most current question answering datasets frame the task as reading comprehension where the question is about a paragraph or document and the answer often is a span in the document.

Some specific tasks of reading comprehension include multi-modal machine reading comprehension and textual machine reading comprehension, among others. In the literature, machine reading comprehension can be divide into four categories: cloze style, multiple choice, span prediction, and free-form answer. Read more about each category here.

Benchmark datasets used for testing a model's reading comprehension abilities include MovieQA, ReCoRD, and RACE, among others.

The Machine Reading group at UCL also provides an overview of reading comprehension tasks.

Figure source: A Survey on Machine Reading Comprehension: Tasks, Evaluation Metrics and Benchmark Datasets

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 1760 papers

Title	Date	Tasks	Status
基于话头话体共享结构信息的机器阅读理解研究(Rearch on Machine reading comprehension based on shared structure information between Naming and Telling)	Oct 1, 2022	Machine Reading ComprehensionReading Comprehension	—Unverified
基于篇章结构攻击的阅读理解任务探究(Analysis of Reading Comprehension Tasks based on passage structure attacks)	Aug 1, 2021	Reading Comprehension	—Unverified
基于相似度进行句子选择的机器阅读理解数据增强(Machine reading comprehension data Augmentation for sentence selection based on similarity)	Oct 1, 2022	Data AugmentationMachine Reading Comprehension	—Unverified
基于小句复合体的中文机器阅读理解研究(Machine Reading Comprehension Based on Clause Complex)	Aug 1, 2021	Machine Reading ComprehensionReading Comprehension	—Unverified
基于阅读理解的汉越跨语言新闻事件要素抽取方法(News Events Element Extraction of Chinese-Vietnamese Cross-language Using Reading Comprehension)	Aug 1, 2021	Reading Comprehension	—Unverified
基于阅读理解框架的中文事件论元抽取(Chinese Event Argument Extraction using Reading Comprehension Framework)	Oct 1, 2020	Event Argument ExtractionReading Comprehension	—Unverified
Joint Inference for Event Timeline Construction	Jul 1, 2012	Reading Comprehension	—Unverified
Joint Training of Candidate Extraction and Answer Selection for Reading Comprehension	May 16, 2018	Answer SelectionReading Comprehension	—Unverified
Judging the Quality of Automatically Generated Gap-fill Question using Active Learning	Jun 1, 2015	Active LearningReading Comprehension	—Unverified
KARNA at COIN Shared Task 1: Bidirectional Encoder Representations from Transformers with relational knowledge for machine comprehension with common sense	Nov 1, 2019	Common Sense ReasoningReading Comprehension	—Unverified
KECP: Knowledge Enhanced Contrastive Prompting for Few-shot Extractive Question Answering	May 6, 2022	Contrastive LearningExtractive Question-Answering	—Unverified
KenSwQuAD -- A Question Answering Dataset for Swahili Low Resource Language	May 4, 2022	BIG-bench Machine LearningQuestion Answering	—Unverified
Keyword-based Query Comprehending via Multiple Optimized-Demand Augmentation	Nov 1, 2017	Machine Reading ComprehensionMachine Translation	—Unverified
Keyword Highlighting Improves Comprehension for People with Dyslexia	Apr 1, 2014	Reading Comprehension	—Unverified
KgPLM: Knowledge-guided Language Model Pre-training via Generative and Discriminative Learning	Dec 7, 2020	Language ModelingLanguage Modelling	—Unverified
KILDST: Effective Knowledge-Integrated Learning for Dialogue State Tracking using Gazetteer and Speaker Information	Jan 18, 2023	Dialogue State TrackingMachine Reading Comprehension	—Unverified
Know-Center at SemEval-2017 Task 10: Sequence Classification with the CODE Annotator	Aug 1, 2017	General ClassificationInformation Retrieval	—Unverified
Knowledgeable Reader: Enhancing Cloze-Style Reading Comprehension with External Commonsense Knowledge	May 21, 2018	Reading Comprehension	—Unverified
Knowledge-Aided Open-Domain Question Answering	Jun 9, 2020	Open-Domain Question AnsweringQuestion Answering	—Unverified
Knowledge as A Bridge: Improving Cross-domain Answer Selection with External Knowledge	Aug 1, 2018	Answer SelectionInformation Retrieval	—Unverified
Knowledge Based Machine Reading Comprehension	Sep 12, 2018	Machine Reading ComprehensionQuestion Answering	—Unverified
Knowledge Condensation and Reasoning for Knowledge-based VQA	Mar 15, 2024	Question AnsweringReading Comprehension	—Unverified
Knowledge Distillation for Improved Accuracy in Spoken Question Answering	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Knowledge Efficient Deep Learning for Natural Language Processing	Aug 28, 2020	Deep LearningLanguage Modelling	—Unverified
Know your tools well: Better and faster QA with synthetic examples	Oct 16, 2021	DiversityKnowledge Distillation	—Unverified
Korean FrameNet Expansion Based on Projection of Japanese FrameNet	Dec 1, 2016	Machine TranslationReading Comprehension	—Unverified
Korean L2 Vocabulary Prediction: Can a Large Annotated Corpus be Used to Train Better Models for Predicting Unknown Words?	May 1, 2018	Language AcquisitionLexical Simplification	—Unverified
KorQuAD1.0: Korean QA Dataset for Machine Reading Comprehension	Sep 16, 2019	ArticlesMachine Reading Comprehension	—Unverified
KOSMOS-2.5: A Multimodal Literate Model	Sep 20, 2023	document understandingmodel	—Unverified
Label Dependent Deep Variational Paraphrase Generation	Nov 27, 2019	Machine Reading ComprehensionParaphrase Generation	—Unverified
LagunTest: A NLP Based Application to Enhance Reading Comprehension	May 1, 2020	Reading Comprehension	—Unverified
Language Models are Causal Knowledge Extractors for Zero-shot Video Question Answering	Apr 7, 2023	Question AnsweringQuestion Generation	—Unverified
Large Language Models are Null-Shot Learners	Jan 16, 2024	Arithmetic ReasoningBenchmarking	—Unverified
Large Language Models as Misleading Assistants in Conversation	Jul 16, 2024	Reading Comprehension	—Unverified
Large-Scale Information Extraction from Textual Definitions through Deep Syntactic and Semantic Analysis	Jan 1, 2015	Open Information ExtractionReading Comprehension	—Unverified
Latent Question Reformulation and Information Accumulation for Multi-Hop Machine Reading	Sep 25, 2019	Question AnsweringReading Comprehension	—Unverified
LawLuo: A Multi-Agent Collaborative Framework for Multi-Round Chinese Legal Consultation	Jul 23, 2024	HallucinationRAG	—Unverified
LC-Score: Reference-less estimation of Text Comprehension Difficulty	Oct 4, 2023	Reading ComprehensionText Simplification	—Unverified
Learning and Knowledge Transfer with Memory Networks for Machine Comprehension	Apr 1, 2017	Question AnsweringReading Comprehension	—Unverified
Learning Answer-Entailing Structures for Machine Comprehension	Jul 1, 2015	Multi-Task LearningQuestion Answering	—Unverified
Learning-based Multi-Sieve Co-reference Resolution with Knowledge	Jul 1, 2012	Coreference ResolutionReading Comprehension	—Unverified
Learning from Demonstration with Weakly Supervised Disentanglement	Jun 16, 2020	DisentanglementReading Comprehension	—Unverified
Learning Grounded Meaning Representations with Autoencoders	Jun 1, 2014	Document ClassificationInformation Retrieval	—Unverified
Learning Open Domain Multi-hop Search Using Reinforcement Learning	May 30, 2022	Information RetrievalReading Comprehension	—Unverified
Learning Open Information Extraction of Implicit Relations from Reading Comprehension Datasets	May 15, 2019	Common Sense ReasoningImplicit Relations	—Unverified
Learning Representations for Zero-Shot Retrieval over Structured Data	Oct 29, 2021	Passage RetrievalQuestion Answering	—Unverified
Learning to Ask Unanswerable Questions for Machine Reading Comprehension	Jun 14, 2019	Data AugmentationMachine Reading Comprehension	—Unverified
Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training	May 31, 2024	Machine Reading ComprehensionQuestion Answering	—Unverified
Learning to Compute Word Embeddings On the Fly	Jun 1, 2017	Language ModelingLanguage Modelling	—Unverified
Learning to Generate Questions by Recovering Answer-containing Sentences	Jan 1, 2021	Machine Reading ComprehensionQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 25 of 36Next →

All datasets ReClor RACE MuSeRC AdversarialQA CrowdSource QA RadQA

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Rational Reasoner / IDOL	Test	80.6	—	Unverified
2	AMR-LE-Ensemble	Test	80	—	Unverified
3	MERIt-deberta-v2-xxlarge deberta.v2.xxlarge.path.override_True.norm_1.1.0.w2.A100.cp200.s42	Test	79.3	—	Unverified
4	MERIt(MERIt-deberta-v2-xxlarge )	Test	79.3	—	Unverified
5	Knowledge model	Test	79.2	—	Unverified
6	DeBERTa-v2-xxlarge-AMR-LE-Contraposition	Test	77.2	—	Unverified
7	LReasoner ensemble	Test	76.1	—	Unverified
8	ELECTRA and ALBERT	Test	71	—	Unverified
9	WWZ	Test	69.7	—	Unverified
10	xlnet-large-uncased [extended data]	Test	69.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ALBERT (Ensemble)	Accuracy	91.4	—	Unverified
2	Megatron-BERT (ensemble)	Accuracy	90.9	—	Unverified
3	ALBERTxxlarge+DUMA(ensemble)	Accuracy	89.8	—	Unverified
4	Megatron-BERT	Accuracy	89.5	—	Unverified
5	XLNet	Accuracy (Middle)	88.6	—	Unverified
6	DeBERTalarge	Accuracy	86.8	—	Unverified
7	B10-10-10	Accuracy	85.7	—	Unverified
8	RoBERTa	Accuracy	83.2	—	Unverified
9	Orca 2-13B	Accuracy	82.87	—	Unverified
10	Orca 2-7B	Accuracy	80.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Golden Transformer	Average F1	0.94	—	Unverified
2	MT5 Large	Average F1	0.84	—	Unverified
3	ruRoberta-large finetune	Average F1	0.83	—	Unverified
4	ruT5-large-finetune	Average F1	0.82	—	Unverified
5	Human Benchmark	Average F1	0.81	—	Unverified
6	ruT5-base-finetune	Average F1	0.77	—	Unverified
7	ruBert-large finetune	Average F1	0.76	—	Unverified
8	ruBert-base finetune	Average F1	0.74	—	Unverified
9	RuGPT3XL few-shot	Average F1	0.74	—	Unverified
10	RuGPT3Large	Average F1	0.73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RoBERTa-Large	Overall: F1	64.4	—	Unverified
2	BERT-Large	Overall: F1	62.7	—	Unverified
3	BiDAF	Overall: F1	28.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT	MSE	0.05	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT pretrained on MIMIC-III	Answer F1	63.55	—	Unverified