Grammatical Error Correction

Grammatical Error Correction (GEC) is the task of correcting different kinds of errors in text such as spelling, punctuation, grammatical, and word choice errors.

GEC is typically formulated as a sentence correction task. A GEC system takes a potentially erroneous sentence as input and is expected to transform it to its corrected version. See the example given below:

| Input (Erroneous) | Output (Corrected) | | ------------------------- | ---------------------- | |She see Tom is catched by policeman in park at last night. | She saw Tom caught by a policeman in the park last night.|

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 415 papers

Title	Date	Tasks	Status	Hype
An Extended Sequence Tagging Vocabulary for Grammatical Error Correction	Feb 12, 2023	Grammatical Error CorrectionMorphological Inflection	CodeCode Available	4
Mining Error Templates for Grammatical Error Correction	Jun 23, 2022	Grammatical Error CorrectionLanguage Modeling	CodeCode Available	2
CCTC: A Cross-Sentence Chinese Text Correction Dataset for Native Speakers	Oct 1, 2022	Grammatical Error CorrectionSentence	CodeCode Available	2
MuCGEC: a Multi-Reference Multi-Source Evaluation Dataset for Chinese Grammatical Error Correction	Apr 23, 2022	Grammatical Error CorrectionSentence	CodeCode Available	2
Stronger Baselines for Grammatical Error Correction Using Pretrained Encoder-Decoder Model	May 24, 2020	DecoderGrammatical Error Correction	CodeCode Available	1
Towards Automated Document Revision: Grammatical Error Correction, Fluency Edits, and Beyond	May 23, 2022	Grammatical Error CorrectionLanguage Modelling	CodeCode Available	1
Towards standardizing Korean Grammatical Error Correction: Datasets and Annotation	Oct 25, 2022	AttributeDiversity	CodeCode Available	1
GrammarGPT: Exploring Open-Source LLMs for Native Chinese Grammatical Error Correction with Supervised Fine-Tuning	Jul 26, 2023	Grammatical Error Correction	CodeCode Available	1
mEdIT: Multilingual Text Editing via Instruction Tuning	Feb 26, 2024	Grammatical Error CorrectionText Simplification	CodeCode Available	1
LM-Critic: Language Models for Unsupervised Grammatical Error Correction	Sep 14, 2021	Grammatical Error CorrectionLanguage Modeling	CodeCode Available	1
Rethinking Evaluation Metrics for Grammatical Error Correction: Why Use a Different Evaluation Process than Human?	Feb 13, 2025	Grammatical Error CorrectionSentence	CodeCode Available	1
RobustGEC: Robust Grammatical Error Correction Against Subtle Context Perturbation	Oct 11, 2023	Grammatical Error CorrectionSentence	CodeCode Available	1
Synthetic Data Generation for Grammatical Error Correction with Tagged Corruption Models	May 27, 2021	DiversityGrammatical Error Correction	CodeCode Available	1
The CoNLL-2014 Shared Task on Grammatical Error Correction	Jun 1, 2014	Coreference ResolutionDependency Parsing	CodeCode Available	1
Encoder-Decoder Models Can Benefit from Pre-trained Masked Language Models in Grammatical Error Correction	May 3, 2020	DecoderGrammatical Error Correction	CodeCode Available	1
ErAConD: Error Annotated Conversational Dialog Dataset for Grammatical Error Correction	Jul 1, 2022	ChatbotGrammatical Error Correction	CodeCode Available	1
CoEdIT: Text Editing by Task-Specific Instruction Tuning	May 17, 2023	Formality Style TransferGrammatical Error Correction	CodeCode Available	1
Ensembling and Knowledge Distilling of Large Sequence Taggers for Grammatical Error Correction	Mar 24, 2022	Grammatical Error CorrectionKnowledge Distillation	CodeCode Available	1
FlaCGEC: A Chinese Grammatical Error Correction Dataset with Fine-grained Linguistic Annotation	Sep 26, 2023	DiagnosticGrammatical Error Correction	CodeCode Available	1
GECTurk: Grammatical Error Correction and Detection Dataset for Turkish	Sep 20, 2023	ArticlesDecoder	CodeCode Available	1
Improving Seq2Seq Grammatical Error Correction via Decoding Interventions	Oct 23, 2023	DecoderGrammatical Error Correction	CodeCode Available	1
Linguistic Rules-Based Corpus Generation for Native Chinese Grammatical Error Correction	Oct 19, 2022	Grammatical Error Correction	CodeCode Available	1
NaSGEC: a Multi-Domain Chinese Grammatical Error Correction Dataset from Native Speaker Texts	May 25, 2023	Grammatical Error Correction	CodeCode Available	1
Pillars of Grammatical Error Correction: Comprehensive Inspection Of Contemporary Approaches In The Era of Large Language Models	Apr 23, 2024	Grammatical Error Correction	CodeCode Available	1
Revisiting Grammatical Error Correction Evaluation and Beyond	Nov 3, 2022	Grammatical Error CorrectionMachine Translation	CodeCode Available	1
Chinese grammatical error correction based on knowledge distillation	Jul 31, 2022	Grammatical Error CorrectionKnowledge Distillation	CodeCode Available	1
Alirector: Alignment-Enhanced Chinese Grammatical Error Corrector	Feb 7, 2024	DecoderGrammatical Error Correction	CodeCode Available	1
SynGEC: Syntax-Enhanced Grammatical Error Correction with a Tailored GEC-Oriented Parser	Oct 22, 2022	Grammatical Error CorrectionSyntax Representation	CodeCode Available	1
System Combination via Quality Estimation for Grammatical Error Correction	Oct 23, 2023	Grammatical Error CorrectionSentence	CodeCode Available	1
Tail-to-Tail Non-Autoregressive Sequence Prediction for Chinese Grammatical Error Correction	Jun 3, 2021	Grammatical Error CorrectionSentence	CodeCode Available	1
CLEME2.0: Towards More Interpretable Evaluation by Disentangling Edits for Grammatical Error Correction	Jul 1, 2024	Grammatical Error Correction	CodeCode Available	1
Detection-Correction Structure via General Language Model for Grammatical Error Correction	May 28, 2024	Grammatical Error CorrectionLanguage Modeling	CodeCode Available	1
Are Pre-trained Language Models Useful for Model Ensemble in Chinese Grammatical Error Correction?	May 24, 2023	Grammatical Error CorrectionSentence	CodeCode Available	1
CLEME: Debiasing Multi-reference Evaluation for Grammatical Error Correction	May 18, 2023	Grammatical Error Correction	CodeCode Available	1
Advancements in Arabic Grammatical Error Detection and Correction: An Empirical Investigation	May 24, 2023	Grammatical Error CorrectionGrammatical Error Detection	CodeCode Available	1
Document-level grammatical error correction	Apr 1, 2021	Grammatical Error CorrectionNMT	CodeCode Available	1
A Simple Recipe for Multilingual Grammatical Error Correction	Jun 7, 2021	Grammatical Error Correction	CodeCode Available	1
Enhancing Grammatical Error Correction Systems with Explanations	May 25, 2023	Grammatical Error Correction	CodeCode Available	1
Automatic Error Type Annotation for Arabic	Sep 16, 2021	Grammatical Error CorrectionVocal Bursts Type Prediction	CodeCode Available	1
A Survey on Non-Autoregressive Generation for Neural Machine Translation and Beyond	Apr 20, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Frustratingly Easy System Combination for Grammatical Error Correction	Jul 1, 2022	Binary ClassificationGrammatical Error Correction	CodeCode Available	1
GECToR -- Grammatical Error Correction: Tag, Not Rewrite	May 26, 2020	Grammatical Error CorrectionTAG	CodeCode Available	1
Improved grammatical error correction by ranking elementary edits	Nov 16, 2021	DecoderGrammatical Error Correction	CodeCode Available	1
Improving Iterative Text Revision by Learning Where to Edit from Other Revision Tasks	Dec 2, 2022	Grammatical Error CorrectionSentence	CodeCode Available	1
Instantaneous Grammatical Error Correction with Shallow Aggressive Decoding	Jun 9, 2021	DecoderGrammatical Error Correction	CodeCode Available	1
Interpretability for Language Learners Using Example-Based Grammatical Error Correction	Mar 14, 2022	Grammatical Error Correction	CodeCode Available	1
MixEdit: Revisiting Data Augmentation and Beyond for Grammatical Error Correction	Oct 18, 2023	Data AugmentationDiversity	CodeCode Available	1
FCGEC: Fine-Grained Corpus for Chinese Grammatical Error Correction	Oct 22, 2022	Grammatical Error CorrectionGrammatical Error Detection	CodeCode Available	1
Neural Quality Estimation with Multiple Hypotheses for Grammatical Error Correction	May 10, 2021	Grammatical Error CorrectionGrammatical Error Detection	CodeCode Available	1
UA-GEC: Grammatical Error Correction and Fluency Corpus for the Ukrainian Language	Mar 31, 2021	Grammatical Error Correction	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 9Next →

All datasets CoNLL-2014 Shared Task BEA-2019 (test)Falko-MERLIN JFLEG UA-GEC CoNLL-2014 Shared Task (10 annotations)Restricted Unrestricted _Restricted_EstGEC-L2 FCGEC MuCGEC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Ensembles of best 7 models + GRECO + GTP-rerank	F0.5	72.8	—	Unverified
2	Majority-voting ensemble on best 7 models	F0.5	71.8	—	Unverified
3	GRECO (voting+ESC)	F0.5	71.12	—	Unverified
4	GEC-DI (LM+GED)	F0.5	69.6	—	Unverified
5	Unsupervised GEC + cLang8	F0.5	69.6	—	Unverified
6	ESC	F0.5	69.51	—	Unverified
7	T5	F0.5	68.87	—	Unverified
8	MoECE	F0.5	67.79	—	Unverified
9	SynGEC	F0.5	67.6	—	Unverified
10	Sequence tagging + token-level transformations + two-stage fine-tuning (+BERT, RoBERTa, XLNet)	F0.5	66.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Majority-voting ensemble on best 7 models	F0.5	81.4	—	Unverified
2	GRECO (voting+ESC)	F0.5	80.84	—	Unverified
3	ESC	F0.5	79.9	—	Unverified
4	RedPenNet	F0.5	77.6	—	Unverified
5	clang_large_ft2-gector	F0.5	77.1	—	Unverified
6	Unsupervised GEC + cLang8	F0.5	76.5	—	Unverified
7	DeBERTa + RoBERTa + XLNet	F0.5	76.05	—	Unverified
8	MoECE	F0.5	74.07	—	Unverified
9	Sequence tagging + token-level transformations + two-stage fine-tuning (+RoBERTa, XLNet)	F0.5	73.7	—	Unverified
10	BEA Combination	F0.5	73.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Llama + 1M BT + gold	F0.5	76.75	—	Unverified
2	mT5-based multimodal MoE	F0.5	76.3	—	Unverified
3	gT5 xxl	F0.5	75.96	—	Unverified
4	Transformer	F0.5	73.71	—	Unverified
5	Transformer - synthetic pretrain only	F0.5	51.41	—	Unverified
6	Multilayer Convolutional Encoder-Decoder	F0.5	43.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	VERNet	GLEU	62.1	—	Unverified
2	Transformer + Pre-train with Pseudo Data + BERT	GLEU	62	—	Unverified
3	SMT + BiGRU	GLEU	61.5	—	Unverified
4	Copy-augmented Model (4 Ensemble +Denoising Autoencoder)	GLEU	61	—	Unverified
5	Transformer	GLEU	59.9	—	Unverified
6	CNN Seq2Seq	GLEU	57.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Llama + 1M BT + gold	F0.5	74.09	—	Unverified
2	mBART-based model with synthetic data	F0.5	68.17	—	Unverified
3	mT5 large + 10M synth	F0.5	68.09	—	Unverified
4	RedPenNet	F0.5	67.71	—	Unverified
5	ChatGPT (zero-shot)	F0.5	27.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GRECO (vote+ESC)	F0.5	85.21	—	Unverified
2	SMT + BiGRU	F0.5	72.04	—	Unverified
3	CNN Seq2Seq	F0.5	70.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN Seq2Seq + Quality Estimation	F0.5	56.52	—	Unverified
2	Transformer	F0.5	55.8	—	Unverified
3	+ BIFI with no critic	F0.5	18.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CNN Seq2Seq + Fluency Boost and inference	GLEU	62.37	—	Unverified
2	CNN Seq2Seq + Fluency Boost	F0.5	61.34	—	Unverified
3	+ BIFI (ours)	F0.5	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Transformer	GLEU	59.9	—	Unverified
2	CNN Seq2Seq	GLEU	57.47	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Llama + 1M BT + gold	F0.5	69.97	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STG-Joint	exact match	34.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GEC-DI (LM+GED)	F0.5	48.61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RedPenNet	F0.5	77.6	—	Unverified