Masked Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 475 papers

Title	Date	Tasks	Status
Dynamic Masking Rate Schedules for MLM Pretraining	May 24, 2023	Language ModelingLanguage Modelling	—Unverified
ClickPrompt: CTR Models are Strong Prompt Generators for Adapting Language Models to CTR Prediction	Oct 13, 2023	Click-Through Rate PredictionLanguage Modeling	—Unverified
A Progressive Transformer for Unifying Binary Code Embedding and Knowledge Transfer	Dec 15, 2024	Feature EngineeringLanguage Modeling	—Unverified
Causal Distillation for Language Models	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified
DS-TOD: Efficient Domain Specialization for Task-Oriented Dialog	Nov 16, 2021	dialog state trackingLanguage Modeling	—Unverified
Adversarial Soft Prompt Tuning for Cross-Domain Sentiment Analysis	May 1, 2022	Domain AdaptationLanguage Modeling	—Unverified
BPDec: Unveiling the Potential of Masked Language Modeling Decoder in BERT pretraining	Jan 29, 2024	DecoderLanguage Modeling	—Unverified
A Primer on Contrastive Pretraining in Language Processing: Methods, Lessons Learned and Perspectives	Feb 25, 2021	Contrastive LearningLanguage Modeling	—Unverified
LakotaBERT: A Transformer-based Model for Low Resource Lakota Language	Mar 23, 2025	Language ModelingLanguage Modelling	—Unverified
LAnoBERT: System Log Anomaly Detection based on BERT Masked Language Model	Nov 18, 2021	Anomaly DetectionLanguage Modeling	—Unverified
Do Transformers Parse while Predicting the Masked Word?	Mar 14, 2023	Constituency ParsingLanguage Modeling	—Unverified
Looking Right is Sometimes Right: Investigating the Capabilities of Decoder-only LLMs for Sequence Labeling	Jan 25, 2024	Causal Language ModelingDecoder	—Unverified
Capturing Topic Framing via Masked Language Modeling	Feb 7, 2023	ArticlesLanguage Modeling	—Unverified
Domain-Specific Japanese ELECTRA Model Using a Small Corpus	Sep 1, 2021	ArticlesComputational Efficiency	—Unverified
APOLLO: A Simple Approach for Adaptive Pretraining of Language Models for Logical Reasoning	Dec 19, 2022	Data AugmentationLanguage Modeling	—Unverified
Domain-adapted large language models for classifying nuclear medicine reports	Mar 1, 2023	Domain AdaptationLanguage Modeling	—Unverified
Does Pre-training Induce Systematic Inference? How Masked Language Models Acquire Commonsense Knowledge	Dec 16, 2021	Language ModelingLanguage Modelling	—Unverified
CamemBERT 2.0: A Smarter French Language Model Aged to Perfection	Nov 13, 2024	Language ModelingLanguage Modelling	—Unverified
Adversarial Generation and Encoding of Nested Texts	Jun 1, 2019	Language ModelingLanguage Modelling	—Unverified
A Pilot Study on Dialogue-Level Dependency Parsing for Chinese	May 21, 2023	Dependency ParsingLanguage Modeling	—Unverified
Knowledgeable Prompt-tuning: Incorporating Knowledge into Prompt Verbalizer for Text Classification	Nov 16, 2021	Few-Shot Text ClassificationLanguage Modeling	—Unverified
Knowledge Distillation vs. Pretraining from Scratch under a Fixed (Computation) Budget	Apr 30, 2024	Knowledge DistillationLanguage Modeling	—Unverified
KUL@SMM4H’22: Template Augmented Adaptive Pre-training for Tweet Classification	Oct 1, 2022	Data AugmentationLanguage Modeling	—Unverified
Discovering Financial Hypernyms by Prompting Masked Language Models	Jun 1, 2022	Domain AdaptationLanguage Modeling	—Unverified
AntLM: Bridging Causal and Masked Language Models	Dec 4, 2024	Causal Language ModelingDecoder	—Unverified

Show:10 25 50

← PrevPage 7 of 19Next →

No leaderboard results yet.