Continual Pretraining

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 70 papers

Title	Date	Tasks	Status	Score
Robust Data Watermarking in Language Models by Injecting Fictitious Knowledge	Mar 6, 2025	Continual PretrainingMemorization	CodeCode Available	5
RomanSetu: Efficiently unlocking multilingual capabilities of Large Language Models via Romanization	Jan 25, 2024	Continual PretrainingSentiment Analysis	CodeCode Available	5
Towards Democratizing Multilingual Large Language Models For Medicine Through A Two-Stage Instruction Fine-tuning Approach	Sep 9, 2024	Computational EfficiencyContinual Pretraining	CodeCode Available	5
Fortunately, Discourse Markers Can Enhance Language Models for Sentiment Analysis	Jan 6, 2022	Continual PretrainingSentiment Analysis	CodeCode Available	5
Simulating Training Data Leakage in Multiple-Choice Benchmarks for LLM Evaluation	May 30, 2025	Continual PretrainingFairness	CodeCode Available	5
Hierarchical Label-wise Attention Transformer Model for Explainable ICD Coding	Apr 22, 2022	Continual Pretraining	CodeCode Available	5
Unsupervised Domain Adaptation for Sparse Retrieval by Filling Vocabulary and Word Frequency Gaps	Nov 8, 2022	Continual PretrainingDomain Adaptation	CodeCode Available	5
PECoP: Parameter Efficient Continual Pretraining for Action Quality Assessment	Nov 11, 2023	Action Quality AssessmentContinual Pretraining	CodeCode Available	5
AF Adapter: Continual Pretraining for Building Chinese Biomedical Language Model	Nov 21, 2022	Continual PretrainingLanguage Modeling	CodeCode Available	5
LangSAMP: Language-Script Aware Multilingual Pretraining	Sep 26, 2024	Continual PretrainingLanguage Modeling	CodeCode Available	5
Alchemy: Amplifying Theorem-Proving Capability through Symbolic Mutation	Oct 21, 2024	Automated Theorem ProvingContinual Pretraining	CodeCode Available	5
PARAMANU-AYN: Pretrain from scratch or Continual Pretraining of LLMs for Legal Domain Adaptation?	Mar 20, 2024	Abstractive Text SummarizationContinual Pretraining	—Unverified	0
Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain	Apr 12, 2024	Continual PretrainingGeneral Knowledge	—Unverified	0
RedWhale: An Adapted Korean LLM Through Efficient Continual Pretraining	Aug 21, 2024	Continual PretrainingCross-Lingual Transfer	—Unverified	0
Revisiting Pretraining with Adapters	Aug 1, 2021	Continual PretrainingTransfer Learning	—Unverified	0
AfroXLMR-Social: Adapting Pre-trained Language Models for African Languages Social Media Text	Mar 24, 2025	Continual PretrainingEmotion Classification	—Unverified	0
The Construction of Instruction-tuned LLMs for Finance without Instruction Data Using Continual Pretraining and Model Merging	Sep 30, 2024	Continual Pretraining	—Unverified	0
AdaPrompt: Adaptive Model Training for Prompt-based NLP	Feb 10, 2022	Continual PretrainingLanguage Modeling	—Unverified	0
BAMBINO-LM: (Bilingual-)Human-Inspired Continual Pretraining of BabyLM	Jun 17, 2024	Continual Pretrainingzero-shot-classification	—Unverified	0
Bilingual Adaptation of Monolingual Foundation Models	Jul 13, 2024	Continual PretrainingCross-Lingual Transfer	—Unverified	0
Breaking the Stage Barrier: A Novel Single-Stage Approach to Long Context Extension for Large Language Models	Dec 10, 2024	Continual PretrainingLanguage Modeling	—Unverified	0
Biomed-Enriched: A Biomedical Dataset Enriched with LLMs for Pretraining and Extracting Rare and Hidden Content	Jun 25, 2025	ArticlesContinual Pretraining	—Unverified	0
ChuXin: 1.6B Technical Report	May 8, 2024	Continual PretrainingLanguage Modeling	—Unverified	0
Continual Learning for Large Language Models: A Survey	Feb 2, 2024	Continual LearningContinual Pretraining	—Unverified	0
70B-parameter large language models in Japanese medical question-answering	Jun 21, 2024	Continual PretrainingDomain Adaptation	—Unverified	0

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets ACL ARC AG News SciERC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DAS	F1 (macro)	0.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CPT	F1 - macro	63.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAS	F1 (macro)	0.71	—	Unverified