Continual Pretraining

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 70 papers

Title	Date	Tasks	Status
ChuXin: 1.6B Technical Report	May 8, 2024	Continual PretrainingLanguage Modeling	—Unverified
Continual Learning for Large Language Models: A Survey	Feb 2, 2024	Continual LearningContinual Pretraining	—Unverified
70B-parameter large language models in Japanese medical question-answering	Jun 21, 2024	Continual PretrainingDomain Adaptation	—Unverified
Understanding the RoPE Extensions of Long-Context LLMs: An Attention Perspective	Jun 19, 2024	BenchmarkingContinual Pretraining	—Unverified
Cross-sensor self-supervised training and alignment for remote sensing	May 16, 2024	Continual PretrainingEarth Observation	—Unverified
Aurora-M: Open Source Continual Pre-training for Multilingual Language and Code	Mar 30, 2024	Continual PretrainingLanguage Modelling	—Unverified
DD-TIG at Constraint@ACL2022: Multimodal Understanding and Reasoning for Role Labeling of Entities in Hateful Memes	May 1, 2022	Continual PretrainingData Augmentation	—Unverified
DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining	Sep 30, 2024	Continual PretrainingDomain Adaptation	—Unverified
Efficient Domain-adaptive Continual Pretraining for the Process Industry in the German Language	Apr 28, 2025	Continual PretrainingGPU	—Unverified
Enhance Mobile Agents Thinking Process Via Iterative Preference Learning	May 18, 2025	Continual Pretraining	—Unverified
On the Robustness of Reading Comprehension Models to Entity Renaming	Nov 16, 2021	Continual PretrainingMachine Reading Comprehension	—Unverified
Open Generative Large Language Models for Galician	Jun 19, 2024	Continual PretrainingDiversity	—Unverified
Overcoming Vocabulary Mismatch: Vocabulary-agnostic Teacher Guided Language Modeling	Mar 24, 2025	Continual PretrainingLanguage Modeling	—Unverified
PARAMANU-AYN: Pretrain from scratch or Continual Pretraining of LLMs for Legal Domain Adaptation?	Mar 20, 2024	Abstractive Text SummarizationContinual Pretraining	—Unverified
Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain	Apr 12, 2024	Continual PretrainingGeneral Knowledge	—Unverified
Breaking the Stage Barrier: A Novel Single-Stage Approach to Long Context Extension for Large Language Models	Dec 10, 2024	Continual PretrainingLanguage Modeling	—Unverified
Revisiting Pretraining with Adapters	Aug 1, 2021	Continual PretrainingTransfer Learning	—Unverified
AfroXLMR-Social: Adapting Pre-trained Language Models for African Languages Social Media Text	Mar 24, 2025	Continual PretrainingEmotion Classification	—Unverified
The Construction of Instruction-tuned LLMs for Finance without Instruction Data Using Continual Pretraining and Model Merging	Sep 30, 2024	Continual Pretraining	—Unverified
AdaPrompt: Adaptive Model Training for Prompt-based NLP	Feb 10, 2022	Continual PretrainingLanguage Modeling	—Unverified
BAMBINO-LM: (Bilingual-)Human-Inspired Continual Pretraining of BabyLM	Jun 17, 2024	Continual Pretrainingzero-shot-classification	—Unverified
Bilingual Adaptation of Monolingual Foundation Models	Jul 13, 2024	Continual PretrainingCross-Lingual Transfer	—Unverified
Biomed-Enriched: A Biomedical Dataset Enriched with LLMs for Pretraining and Extracting Rare and Hidden Content	Jun 25, 2025	ArticlesContinual Pretraining	—Unverified
Investigating Continual Pretraining in Large Language Models: Insights and Implications	Feb 27, 2024	Continual LearningContinual Pretraining	—Unverified
Is Domain Adaptation Worth Your Investment? Comparing BERT and FinBERT on Financial Tasks	Nov 1, 2021	Continual PretrainingDomain Adaptation	—Unverified

Show:10 25 50

← PrevPage 2 of 3Next →

All datasets ACL ARC AG News SciERC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DAS	F1 (macro)	0.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CPT	F1 - macro	63.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAS	F1 (macro)	0.71	—	Unverified