Automated Essay Scoring

Essay scoring: Automated Essay Scoring is the task of assigning a score to an essay, usually in the context of assessing the language ability of a language learner. The quality of an essay is affected by the following four primary dimensions: topic relevance, organization and coherence, word usage and sentence complexity, and grammar and mechanics.

Source: A Joint Model for Multimodal Document Quality Assessment

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 104 papers

Title	Date	Tasks	Status
Enhancing Marker Scoring Accuracy through Ordinal Confidence Modelling in Educational Assessments	May 29, 2025	Automated Essay Scoring	—Unverified
Automated Essay Scoring Incorporating Annotations from Automated Feedback Systems	May 28, 2025	Automated Essay ScoringLanguage Modeling	—Unverified
Composable Cross-prompt Essay Scoring by Merging Models	May 24, 2025	AllAutomated Essay Scoring	—Unverified
TRATES: Trait-Specific Rubric-Assisted Cross-Prompt Essay Scoring	May 20, 2025	Automated Essay ScoringLanguage Modeling	—Unverified
CAFES: A Collaborative Multi-Agent Framework for Multi-Granular Multimodal Essay Scoring	May 20, 2025	Automated Essay ScoringDiversity	—Unverified
LCES: Zero-shot Automated Essay Scoring via Pairwise Comparisons Using Large Language Models	May 13, 2025	Automated Essay ScoringComputational Efficiency	—Unverified
Do We Need a Detailed Rubric for Automated Essay Scoring using Large Language Models?	May 2, 2025	Automated Essay Scoring	—Unverified
Does the Prompt-based Large Language Model Recognize Students' Demographics and Introduce Bias in Essay Scoring?	Apr 30, 2025	Automated Essay ScoringFairness	—Unverified
Evolution of AI in Education: Agentic Workflows	Apr 25, 2025	Automated Essay Scoring	—Unverified
ARWI: Arabic Write and Improve	Apr 16, 2025	Automated Essay ScoringGrammatical Error Detection	—Unverified
Enhancing Arabic Automated Essay Scoring with Synthetic Data and Error Injection	Mar 22, 2025	Automated Essay ScoringType prediction	—Unverified
EssayJudge: A Multi-Granular Benchmark for Assessing Automated Essay Scoring Capabilities of Multimodal Large Language Models	Feb 17, 2025	Automated Essay ScoringFeature Engineering	—Unverified
How well can LLMs Grade Essays in Arabic?	Jan 27, 2025	Automated Essay ScoringIn-Context Learning	—Unverified
On the Suitability of pre-trained foundational LLMs for Analysis in German Legal Education	Dec 20, 2024	Argument MiningAutomated Essay Scoring	—Unverified
The Impact of Example Selection in Few-Shot Prompting on Automated Essay Scoring Using GPT Models	Nov 28, 2024	Automated Essay Scoring	—Unverified
Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMs	Oct 18, 2024	Automated Essay ScoringLanguage Modeling	—Unverified
Autoregressive Multi-trait Essay Scoring via Reinforcement Learning with Scoring-aware Multiple Rewards	Sep 26, 2024	Automated Essay Scoringreinforcement-learning	—Unverified
Are Large Language Models Good Essay Graders?	Sep 19, 2024	Automated Essay ScoringFew-Shot Learning	—Unverified
Automated essay scoring in Arabic: a dataset and analysis of a BERT-based system	Jul 15, 2024	Automated Essay Scoring	—Unverified
Is GPT-4 Alone Sufficient for Automated Essay Scoring?: A Comparative Judgment Approach Based on Rater Cognition	Jul 8, 2024	Automated Essay Scoring	—Unverified
Automated Essay Scoring Using Grammatical Variety and Errors with Multi-Task Learning and Item Response Theory	Jun 13, 2024	Automated Essay ScoringMulti-Task Learning	—Unverified
Automatic Essay Multi-dimensional Scoring with Fine-tuning and Multiple Regression	Jun 3, 2024	Automated Essay Scoringregression	—Unverified
Beyond Agreement: Diagnosing the Rationale Alignment of Automated Essay Scoring Methods based on Linguistically-informed Counterfactuals	May 29, 2024	Automated Essay Scoringcounterfactual	CodeCode Available
Graded Relevance Scoring of Written Essays with Dense Retrieval	May 8, 2024	Automated Essay ScoringContrastive Learning	—Unverified
Can GPT-4 do L2 analytic assessment?	Apr 29, 2024	Automated Essay Scoring	—Unverified

Show:10 25 50

← PrevPage 1 of 5Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Neural Pairwise Contrastive Regression (NPCR)	Quadratic Weighted Kappa	0.82	—	Unverified
2	Tran-BERT-MS-ML-R	Quadratic Weighted Kappa	0.79	—	Unverified
3	Considering-Content-XLNet	Quadratic Weighted Kappa	0.79	—	Unverified
4	HISK+BOSWE	Quadratic Weighted Kappa	0.79	—	Unverified
5	SkipFlow	Quadratic Weighted Kappa	0.76	—	Unverified
6	MHMLW	Quadratic Weighted Kappa	0.76	—	Unverified
7	AF	Quadratic Weighted Kappa	0.73	—	Unverified
8	FDA	Quadratic Weighted Kappa	0.71	—	Unverified