Masked Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 475 papers

Title	Date	Tasks	Status	Hype
GigaAM: Efficient Self-Supervised Learner for Speech Recognition	Jun 1, 2025	Automatic Speech RecognitionLanguage Modeling	CodeCode Available	4
Simple and Effective Masked Diffusion Language Models	Jun 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	4
Towards No.1 in CLUE Semantic Matching Challenge: Pre-trained Language Model Erlangshen with Propensity-Corrected Loss	Aug 5, 2022	Language ModelingLanguage Modelling	CodeCode Available	4
GLIPv2: Unifying Localization and Vision-Language Understanding	Jun 12, 2022	2D Object DetectionContrastive Learning	CodeCode Available	4
Long-VITA: Scaling Large Multi-modal Models to 1 Million Tokens with Leading Short-Context Accuray	Feb 7, 2025	4kGeneral Knowledge	CodeCode Available	3
Cramming: Training a Language Model on a Single GPU in One Day	Dec 28, 2022	GPULanguage Modeling	CodeCode Available	3
W2v-BERT: Combining Contrastive Learning and Masked Language Modeling for Self-Supervised Speech Pre-Training	Aug 7, 2021	Contrastive LearningLanguage Modeling	CodeCode Available	3
ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding	Oct 23, 2020	Language ModelingLanguage Modelling	CodeCode Available	3
BMFM-RNA: An Open Framework for Building and Evaluating Transcriptomic Foundation Models	Jun 17, 2025	BenchmarkingLanguage Modeling	CodeCode Available	2
GPT or BERT: why not both?	Oct 31, 2024	Causal Language ModelingLanguage Modeling	CodeCode Available	2
MosaicBERT: A Bidirectional Encoder Optimized for Fast Pretraining	Dec 29, 2023	GPULanguage Modeling	CodeCode Available	2
Cross-Modal Implicit Relation Reasoning and Aligning for Text-to-Image Person Retrieval	Mar 22, 2023	Image-text matchingLanguage Modeling	CodeCode Available	2
Retrieval Oriented Masking Pre-training Language Model for Dense Passage Retrieval	Oct 27, 2022	Language ModelingLanguage Modelling	CodeCode Available	2
Deep Bidirectional Language-Knowledge Graph Pretraining	Oct 17, 2022	Common Sense ReasoningKnowledge Graphs	CodeCode Available	2
RetroMAE: Pre-Training Retrieval-oriented Language Models Via Masked Auto-Encoder	May 24, 2022	DecoderInformation Retrieval	CodeCode Available	2
LinkBERT: Pretraining Language Models with Document Links	Mar 29, 2022	Document ClassificationLanguage Modeling	CodeCode Available	2
MPNet: Masked and Permuted Pre-training for Language Understanding	Apr 20, 2020	Language ModelingLanguage Modelling	CodeCode Available	2
Self-Supervised Log Parsing	Mar 17, 2020	Anomaly DetectionFault Detection	CodeCode Available	2
Diffusion Sequence Models for Enhanced Protein Representation and Generation	Jun 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
CreoPep: A Universal Deep Learning Framework for Target-Specific Peptide Design and Optimization	May 5, 2025	DiversityLanguage Modeling	CodeCode Available	1
Long-context Protein Language Modeling Using Bidirectional Mamba with Shared Projection Layers	Oct 29, 2024	Drug DesignLanguage Modeling	CodeCode Available	1
DomURLs_BERT: Pre-trained BERT-based Model for Malicious Domains and URLs Detection and Classification	Sep 13, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
AutoScale: Scale-Aware Data Mixing for Pre-Training LLMs	Jul 29, 2024	Bilevel OptimizationLanguage Modelling	CodeCode Available	1
Retrieval-style In-Context Learning for Few-shot Hierarchical Text Classification	Jun 25, 2024	Contrastive Learningfew-shot-htc	CodeCode Available	1
VCR: A Task for Pixel-Level Complex Reasoning in Vision Language Models via Restoring Occluded Text	Jun 10, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Merging Text Transformer Models from Different Initializations	Mar 1, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
NextLevelBERT: Masked Language Modeling with Higher-Level Representations for Long Documents	Feb 27, 2024	Document ClassificationLanguage Modeling	CodeCode Available	1
CodeArt: Better Code Models by Attention Regularization When Symbols Are Lacking	Feb 19, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Interpretation of Intracardiac Electrograms Through Textual Representations	Feb 2, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Endowing Protein Language Models with Structural Knowledge	Jan 26, 2024	Drug DesignLanguage Modeling	CodeCode Available	1
ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training	Dec 20, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Labrador: Exploring the Limits of Masked Language Modeling for Laboratory Data	Dec 9, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
GeoLM: Empowering Language Models for Geospatially Grounded Language Understanding	Oct 23, 2023	ArticlesContrastive Learning	CodeCode Available	1
FATA-Trans: Field And Time-Aware Transformer for Sequential Tabular Data	Oct 20, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
FiLM: Fill-in Language Models for Any-Order Generation	Oct 15, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
PepMLM: Target Sequence-Conditioned Generation of Therapeutic Peptide Binders via Span Masked Language Modeling	Oct 5, 2023	BenchmarkingLanguage Modeling	CodeCode Available	1
A Multi-Task Semantic Decomposition Framework with Task-specific Pre-training for Few-Shot NER	Aug 28, 2023	Contrastive Learningfew-shot-ner	CodeCode Available	1
Diffusion Language Models Can Perform Many Tasks with Scaling and Instruction-Finetuning	Aug 23, 2023	In-Context LearningLanguage Modeling	CodeCode Available	1
Pairing interacting protein sequences using masked language modeling	Aug 14, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Stochastic positional embeddings improve masked image modeling	Jul 31, 2023	Language ModellingMasked Language Modeling	CodeCode Available	1
Pushing the Limits of Unsupervised Unit Discovery for SSL Speech Representation	Jun 15, 2023	Automatic Speech RecognitionClustering	CodeCode Available	1
Generate to Understand for Representation	Jun 14, 2023	Contrastive LearningGPU	CodeCode Available	1
Global and Local Semantic Completion Learning for Vision-Language Pre-training	Jun 12, 2023	cross-modal alignmentImage-text Retrieval	CodeCode Available	1
On the Difference of BERT-style and CLIP-style Text Encoders	Jun 6, 2023	Image GenerationLanguage Modeling	CodeCode Available	1
Preserving Pre-trained Features Helps Calibrate Fine-tuned Language Models	May 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Rethinking Masked Language Modeling for Chinese Spelling Correction	May 28, 2023	DiversityDomain Generalization	CodeCode Available	1
ESCOXLM-R: Multilingual Taxonomy-driven Pre-training for the Job Market Domain	May 20, 2023	De-identificationLanguage Modeling	CodeCode Available	1
Syllable Discovery and Cross-Lingual Generalization in a Visually Grounded, Self-Supervised Speech Model	May 19, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
DinoSR: Self-Distillation and Online Clustering for Self-supervised Speech Representation Learning	May 17, 2023	ClusteringLanguage Modeling	CodeCode Available	1
Fine-grained Audible Video Description	Mar 27, 2023	Language ModelingLanguage Modelling	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 10Next →

No leaderboard results yet.