SOTAVerified|Agents Browse Leaderboard About

Continual Pretraining

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 41–50 of 70 papers

Title	Date	Tasks	Status	Hype
LangSAMP: Language-Script Aware Multilingual Pretraining	Sep 26, 2024	Continual PretrainingLanguage Modeling	CodeCode Available	0
Towards Democratizing Multilingual Large Language Models For Medicine Through A Two-Stage Instruction Fine-tuning Approach	Sep 9, 2024	Computational EfficiencyContinual Pretraining	CodeCode Available	0
RedWhale: An Adapted Korean LLM Through Efficient Continual Pretraining	Aug 21, 2024	Continual PretrainingCross-Lingual Transfer	—Unverified	0
Bilingual Adaptation of Monolingual Foundation Models	Jul 13, 2024	Continual PretrainingCross-Lingual Transfer	—Unverified	0
70B-parameter large language models in Japanese medical question-answering	Jun 21, 2024	Continual PretrainingDomain Adaptation	—Unverified	0
Open Generative Large Language Models for Galician	Jun 19, 2024	Continual PretrainingDiversity	—Unverified	0
Understanding the RoPE Extensions of Long-Context LLMs: An Attention Perspective	Jun 19, 2024	BenchmarkingContinual Pretraining	—Unverified	0
BAMBINO-LM: (Bilingual-)Human-Inspired Continual Pretraining of BabyLM	Jun 17, 2024	Continual Pretrainingzero-shot-classification	—Unverified	0
LongSkywork: A Training Recipe for Efficiently Extending Context Length in Large Language Models	Jun 2, 2024	Continual PretrainingInformation Retrieval	—Unverified	0
Cross-sensor self-supervised training and alignment for remote sensing	May 16, 2024	Continual PretrainingEarth Observation	—Unverified	0

Show:10 25 50

← PrevPage 5 of 7Next →

All datasets ACL ARC AG News SciERC

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DAS	F1 (macro)	0.69	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CPT	F1 - macro	63.77	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DAS	F1 (macro)	0.71	—	Unverified