Continual Pretraining

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–70 of 70 papers

Title	Date	Tasks	Status
ChuXin: 1.6B Technical Report	May 8, 2024	Continual PretrainingLanguage Modeling	—Unverified
Pretraining and Updates of Domain-Specific LLM: A Case Study in the Japanese Business Domain	Apr 12, 2024	Continual PretrainingGeneral Knowledge	—Unverified
CEM: A Data-Efficient Method for Large Language Models to Continue Evolving From Mistakes	Apr 11, 2024	Continual LearningContinual Pretraining	—Unverified
Aurora-M: Open Source Continual Pre-training for Multilingual Language and Code	Mar 30, 2024	Continual PretrainingLanguage Modelling	—Unverified
PARAMANU-AYN: Pretrain from scratch or Continual Pretraining of LLMs for Legal Domain Adaptation?	Mar 20, 2024	Abstractive Text SummarizationContinual Pretraining	—Unverified
Investigating Continual Pretraining in Large Language Models: Insights and Implications	Feb 27, 2024	Continual LearningContinual Pretraining	—Unverified
Continual Learning for Large Language Models: A Survey	Feb 2, 2024	Continual LearningContinual Pretraining	—Unverified
RomanSetu: Efficiently unlocking multilingual capabilities of Large Language Models via Romanization	Jan 25, 2024	Continual PretrainingSentiment Analysis	CodeCode Available
PECoP: Parameter Efficient Continual Pretraining for Action Quality Assessment	Nov 11, 2023	Action Quality AssessmentContinual Pretraining	CodeCode Available
AF Adapter: Continual Pretraining for Building Chinese Biomedical Language Model	Nov 21, 2022	Continual PretrainingLanguage Modeling	CodeCode Available
Unsupervised Domain Adaptation for Sparse Retrieval by Filling Vocabulary and Word Frequency Gaps	Nov 8, 2022	Continual PretrainingDomain Adaptation	CodeCode Available
DD-TIG at Constraint@ACL2022: Multimodal Understanding and Reasoning for Role Labeling of Entities in Hateful Memes	May 1, 2022	Continual PretrainingData Augmentation	—Unverified
Hierarchical Label-wise Attention Transformer Model for Explainable ICD Coding	Apr 22, 2022	Continual Pretraining	CodeCode Available
AdaPrompt: Adaptive Model Training for Prompt-based NLP	Feb 10, 2022	Continual PretrainingLanguage Modeling	—Unverified
Fortunately, Discourse Markers Can Enhance Language Models for Sentiment Analysis	Jan 6, 2022	Continual PretrainingSentiment Analysis	CodeCode Available
On the Robustness of Reading Comprehension Models to Entity Renaming	Nov 16, 2021	Continual PretrainingMachine Reading Comprehension	—Unverified
Is Domain Adaptation Worth Your Investment? Comparing BERT and FinBERT on Financial Tasks	Nov 1, 2021	Continual PretrainingDomain Adaptation	—Unverified
Lifelong Pretraining: Continually Adapting Language Models to Emerging Corpora	Oct 16, 2021	Continual LearningContinual Pretraining	—Unverified
Revisiting Pretraining with Adapters	Aug 1, 2021	Continual PretrainingTransfer Learning	—Unverified
Domain-Specific Language Model Pretraining for Biomedical Natural Language Processing	Jul 31, 2020	Continual Pretraining	CodeCode Available

Show:10 25 50

← PrevPage 3 of 3Next →

All datasets ACL ARC AG News SciERC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DAS	F1 (macro)	0.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CPT	F1 - macro	63.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAS	F1 (macro)	0.71	—	Unverified