Automated Essay Scoring

Essay scoring: Automated Essay Scoring is the task of assigning a score to an essay, usually in the context of assessing the language ability of a language learner. The quality of an essay is affected by the following four primary dimensions: topic relevance, organization and coherence, word usage and sentence complexity, and grammar and mechanics.

Source: A Joint Model for Multimodal Document Quality Assessment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 104 papers

Title	Date	Tasks	Status	Hype
Human-AI Collaborative Essay Scoring: A Dual-Process Framework with LLMs	Jan 12, 2024	Automated Essay Scoring	CodeCode Available	1
Prompt- and Trait Relation-aware Cross-prompt Essay Trait Scoring	May 26, 2023	Automated Essay ScoringRelation	CodeCode Available	1
Automated Essay Scoring via Pairwise Contrastive Regression	Oct 1, 2022	Automated Essay ScoringContrastive Learning	CodeCode Available	1
On the Use of BERT for Automated Essay Scoring: Joint Learning of Multi-Scale Essay Representation	May 8, 2022	Automated Essay ScoringTransfer Learning	CodeCode Available	1
Countering the Influence of Essay Length in Neural Essay Scoring	Nov 1, 2021	Automated Essay Scoring	CodeCode Available	1
Automated Essay Scoring Using Transformer Models	Oct 13, 2021	Automated Essay ScoringBIG-bench Machine Learning	CodeCode Available	1
A Prompt-independent and Interpretable Automated Essay Scoring Method for Chinese Second Language Writing	Aug 1, 2021	Automated Essay Scoring	CodeCode Available	1
EXPATS: A Toolkit for Explainable Automated Text Scoring	Apr 7, 2021	Automated Essay Scoring	CodeCode Available	1
Many Hands Make Light Work: Using Essay Traits to Automatically Score Essays	Feb 1, 2021	Automated Essay ScoringMulti-Task Learning	CodeCode Available	1
Evaluation Toolkit For Robustness Testing Of Automatic Essay Scoring Systems	Jul 14, 2020	Automated Essay ScoringCommon Sense Reasoning	CodeCode Available	1
Automated Essay Scoring based on Two-Stage Learning	Jan 23, 2019	Automated Essay ScoringVocal Bursts Valence Prediction	CodeCode Available	1
Enhancing Marker Scoring Accuracy through Ordinal Confidence Modelling in Educational Assessments	May 29, 2025	Automated Essay Scoring	—Unverified	0
Automated Essay Scoring Incorporating Annotations from Automated Feedback Systems	May 28, 2025	Automated Essay ScoringLanguage Modeling	—Unverified	0
Composable Cross-prompt Essay Scoring by Merging Models	May 24, 2025	AllAutomated Essay Scoring	—Unverified	0
CAFES: A Collaborative Multi-Agent Framework for Multi-Granular Multimodal Essay Scoring	May 20, 2025	Automated Essay ScoringDiversity	—Unverified	0
TRATES: Trait-Specific Rubric-Assisted Cross-Prompt Essay Scoring	May 20, 2025	Automated Essay ScoringLanguage Modeling	—Unverified	0
LCES: Zero-shot Automated Essay Scoring via Pairwise Comparisons Using Large Language Models	May 13, 2025	Automated Essay ScoringComputational Efficiency	—Unverified	0
Do We Need a Detailed Rubric for Automated Essay Scoring using Large Language Models?	May 2, 2025	Automated Essay Scoring	—Unverified	0
Does the Prompt-based Large Language Model Recognize Students' Demographics and Introduce Bias in Essay Scoring?	Apr 30, 2025	Automated Essay ScoringFairness	—Unverified	0
Evolution of AI in Education: Agentic Workflows	Apr 25, 2025	Automated Essay Scoring	—Unverified	0
ARWI: Arabic Write and Improve	Apr 16, 2025	Automated Essay ScoringGrammatical Error Detection	—Unverified	0
Enhancing Arabic Automated Essay Scoring with Synthetic Data and Error Injection	Mar 22, 2025	Automated Essay ScoringType prediction	—Unverified	0
EssayJudge: A Multi-Granular Benchmark for Assessing Automated Essay Scoring Capabilities of Multimodal Large Language Models	Feb 17, 2025	Automated Essay ScoringFeature Engineering	—Unverified	0
How well can LLMs Grade Essays in Arabic?	Jan 27, 2025	Automated Essay ScoringIn-Context Learning	—Unverified	0
On the Suitability of pre-trained foundational LLMs for Analysis in German Legal Education	Dec 20, 2024	Argument MiningAutomated Essay Scoring	—Unverified	0

Show:10 25 50

← PrevPage 1 of 5Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Neural Pairwise Contrastive Regression (NPCR)	Quadratic Weighted Kappa	0.82	—	Unverified
2	Tran-BERT-MS-ML-R	Quadratic Weighted Kappa	0.79	—	Unverified
3	Considering-Content-XLNet	Quadratic Weighted Kappa	0.79	—	Unverified
4	HISK+BOSWE	Quadratic Weighted Kappa	0.79	—	Unverified
5	SkipFlow	Quadratic Weighted Kappa	0.76	—	Unverified
6	MHMLW	Quadratic Weighted Kappa	0.76	—	Unverified
7	AF	Quadratic Weighted Kappa	0.73	—	Unverified
8	FDA	Quadratic Weighted Kappa	0.71	—	Unverified