Automated Essay Scoring

Essay scoring: Automated Essay Scoring is the task of assigning a score to an essay, usually in the context of assessing the language ability of a language learner. The quality of an essay is affected by the following four primary dimensions: topic relevance, organization and coherence, word usage and sentence complexity, and grammar and mechanics.

Source: A Joint Model for Multimodal Document Quality Assessment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 104 papers

Title	Date	Tasks	Status	Hype
Human-AI Collaborative Essay Scoring: A Dual-Process Framework with LLMs	Jan 12, 2024	Automated Essay Scoring	CodeCode Available	1
Prompt- and Trait Relation-aware Cross-prompt Essay Trait Scoring	May 26, 2023	Automated Essay ScoringRelation	CodeCode Available	1
Automated Essay Scoring via Pairwise Contrastive Regression	Oct 1, 2022	Automated Essay ScoringContrastive Learning	CodeCode Available	1
On the Use of BERT for Automated Essay Scoring: Joint Learning of Multi-Scale Essay Representation	May 8, 2022	Automated Essay ScoringTransfer Learning	CodeCode Available	1
Countering the Influence of Essay Length in Neural Essay Scoring	Nov 1, 2021	Automated Essay Scoring	CodeCode Available	1
Automated Essay Scoring Using Transformer Models	Oct 13, 2021	Automated Essay ScoringBIG-bench Machine Learning	CodeCode Available	1
A Prompt-independent and Interpretable Automated Essay Scoring Method for Chinese Second Language Writing	Aug 1, 2021	Automated Essay Scoring	CodeCode Available	1
EXPATS: A Toolkit for Explainable Automated Text Scoring	Apr 7, 2021	Automated Essay Scoring	CodeCode Available	1
Many Hands Make Light Work: Using Essay Traits to Automatically Score Essays	Feb 1, 2021	Automated Essay ScoringMulti-Task Learning	CodeCode Available	1
Evaluation Toolkit For Robustness Testing Of Automatic Essay Scoring Systems	Jul 14, 2020	Automated Essay ScoringCommon Sense Reasoning	CodeCode Available	1
Automated Essay Scoring based on Two-Stage Learning	Jan 23, 2019	Automated Essay ScoringVocal Bursts Valence Prediction	CodeCode Available	1
Enhancing Marker Scoring Accuracy through Ordinal Confidence Modelling in Educational Assessments	May 29, 2025	Automated Essay Scoring	—Unverified	0
Automated Essay Scoring Incorporating Annotations from Automated Feedback Systems	May 28, 2025	Automated Essay ScoringLanguage Modeling	—Unverified	0
Composable Cross-prompt Essay Scoring by Merging Models	May 24, 2025	AllAutomated Essay Scoring	—Unverified	0
CAFES: A Collaborative Multi-Agent Framework for Multi-Granular Multimodal Essay Scoring	May 20, 2025	Automated Essay ScoringDiversity	—Unverified	0
TRATES: Trait-Specific Rubric-Assisted Cross-Prompt Essay Scoring	May 20, 2025	Automated Essay ScoringLanguage Modeling	—Unverified	0
LCES: Zero-shot Automated Essay Scoring via Pairwise Comparisons Using Large Language Models	May 13, 2025	Automated Essay ScoringComputational Efficiency	—Unverified	0
Do We Need a Detailed Rubric for Automated Essay Scoring using Large Language Models?	May 2, 2025	Automated Essay Scoring	—Unverified	0
Does the Prompt-based Large Language Model Recognize Students' Demographics and Introduce Bias in Essay Scoring?	Apr 30, 2025	Automated Essay ScoringFairness	—Unverified	0
Evolution of AI in Education: Agentic Workflows	Apr 25, 2025	Automated Essay Scoring	—Unverified	0
ARWI: Arabic Write and Improve	Apr 16, 2025	Automated Essay ScoringGrammatical Error Detection	—Unverified	0
Enhancing Arabic Automated Essay Scoring with Synthetic Data and Error Injection	Mar 22, 2025	Automated Essay ScoringType prediction	—Unverified	0
EssayJudge: A Multi-Granular Benchmark for Assessing Automated Essay Scoring Capabilities of Multimodal Large Language Models	Feb 17, 2025	Automated Essay ScoringFeature Engineering	—Unverified	0
How well can LLMs Grade Essays in Arabic?	Jan 27, 2025	Automated Essay ScoringIn-Context Learning	—Unverified	0
On the Suitability of pre-trained foundational LLMs for Analysis in German Legal Education	Dec 20, 2024	Argument MiningAutomated Essay Scoring	—Unverified	0
The Impact of Example Selection in Few-Shot Prompting on Automated Essay Scoring Using GPT Models	Nov 28, 2024	Automated Essay Scoring	—Unverified	0
Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMs	Oct 18, 2024	Automated Essay ScoringLanguage Modeling	—Unverified	0
Autoregressive Multi-trait Essay Scoring via Reinforcement Learning with Scoring-aware Multiple Rewards	Sep 26, 2024	Automated Essay Scoringreinforcement-learning	—Unverified	0
Are Large Language Models Good Essay Graders?	Sep 19, 2024	Automated Essay ScoringFew-Shot Learning	—Unverified	0
Automated essay scoring in Arabic: a dataset and analysis of a BERT-based system	Jul 15, 2024	Automated Essay Scoring	—Unverified	0
Is GPT-4 Alone Sufficient for Automated Essay Scoring?: A Comparative Judgment Approach Based on Rater Cognition	Jul 8, 2024	Automated Essay Scoring	—Unverified	0
Automated Essay Scoring Using Grammatical Variety and Errors with Multi-Task Learning and Item Response Theory	Jun 13, 2024	Automated Essay ScoringMulti-Task Learning	—Unverified	0
Automatic Essay Multi-dimensional Scoring with Fine-tuning and Multiple Regression	Jun 3, 2024	Automated Essay Scoringregression	—Unverified	0
Beyond Agreement: Diagnosing the Rationale Alignment of Automated Essay Scoring Methods based on Linguistically-informed Counterfactuals	May 29, 2024	Automated Essay Scoringcounterfactual	CodeCode Available	0
Graded Relevance Scoring of Written Essays with Dense Retrieval	May 8, 2024	Automated Essay ScoringContrastive Learning	—Unverified	0
Can GPT-4 do L2 analytic assessment?	Apr 29, 2024	Automated Essay Scoring	—Unverified	0
Exploring LLM Prompting Strategies for Joint Essay Scoring and Feedback Generation	Apr 24, 2024	Automated Essay Scoring	CodeCode Available	0
Unleashing Large Language Models' Proficiency in Zero-shot Essay Scoring	Apr 7, 2024	Automated Essay Scoring	—Unverified	0
Transformer-based Joint Modelling for Automatic Essay Scoring and Off-Topic Detection	Mar 24, 2024	Automated Essay Scoring	—Unverified	0
Autoregressive Score Generation for Multi-trait Essay Scoring	Mar 13, 2024	Automated Essay Scoring	CodeCode Available	0
Can Large Language Models Automatically Score Proficiency of Written Essays?	Mar 10, 2024	Automated Essay ScoringPrompt Engineering	CodeCode Available	0
Frustratingly Simple Prompting-based Text Denoising	Feb 24, 2024	Automated Essay ScoringDenoising	—Unverified	0
DREsS: Dataset for Rubric-based Essay Scoring on EFL Writing	Feb 21, 2024	Automated Essay Scoring	—Unverified	0
VerAs: Verify then Assess STEM Lab Reports	Feb 7, 2024	Automated Essay ScoringOpen-Domain Question Answering	CodeCode Available	0
Unveiling the Tapestry of Automated Essay Scoring: A Comprehensive Investigation of Accuracy, Fairness, and Generalizability	Jan 11, 2024	Automated Essay ScoringFairness	CodeCode Available	0
Empirical Study of Large Language Models as Automated Essay Scoring Tools in English Composition__Taking TOEFL Independent Writing Task for Example	Jan 7, 2024	Automated Essay ScoringPrompt Learning	—Unverified	0
Enhancing Essay Scoring with Adversarial Weights Perturbation and Metric-specific AttentionPooling	Jan 6, 2024	Automated Essay ScoringLanguage Modelling	—Unverified	0
Learning to love diligent trolls: Accounting for rater effects in the dialogue safety task	Oct 30, 2023	Automated Essay ScoringChatbot	CodeCode Available	0
LLM-as-a-tutor in EFL Writing Education: Focusing on Evaluation of Student-LLM Interaction	Oct 8, 2023	Automated Essay Scoring	—Unverified	0
Rubric-Specific Approach to Automated Essay Scoring with Augmentation Training	Sep 6, 2023	Automated Essay ScoringData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Neural Pairwise Contrastive Regression (NPCR)	Quadratic Weighted Kappa	0.82	—	Unverified
2	Tran-BERT-MS-ML-R	Quadratic Weighted Kappa	0.79	—	Unverified
3	Considering-Content-XLNet	Quadratic Weighted Kappa	0.79	—	Unverified
4	HISK+BOSWE	Quadratic Weighted Kappa	0.79	—	Unverified
5	SkipFlow	Quadratic Weighted Kappa	0.76	—	Unverified
6	MHMLW	Quadratic Weighted Kappa	0.76	—	Unverified
7	AF	Quadratic Weighted Kappa	0.73	—	Unverified
8	FDA	Quadratic Weighted Kappa	0.71	—	Unverified