Masked Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 475 papers

Title	Date	Tasks	Status	Hype
BMFM-RNA: An Open Framework for Building and Evaluating Transcriptomic Foundation Models	Jun 17, 2025	BenchmarkingLanguage Modeling	CodeCode Available	2
GeoRecon: Graph-Level Representation Learning for 3D Molecules via Reconstruction-Based Pretraining	Jun 16, 2025	DenoisingLanguage Modeling	—Unverified	0
Diffusion Sequence Models for Enhanced Protein Representation and Generation	Jun 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Masked Language Models are Good Heterogeneous Graph Generalizers	Jun 6, 2025	Graph LearningLanguage Modeling	CodeCode Available	0
Improving Low-Resource Morphological Inflection via Self-Supervised Objectives	Jun 5, 2025	DecoderLanguage Modeling	—Unverified	0
GigaAM: Efficient Self-Supervised Learner for Speech Recognition	Jun 1, 2025	Automatic Speech RecognitionLanguage Modeling	CodeCode Available	4
HAD: Hybrid Architecture Distillation Outperforms Teacher in Genomic Sequence Modeling	May 27, 2025	Language ModelingLanguage Modelling	—Unverified	0
Ankh3: Multi-Task Pretraining with Sequence Denoising and Completion Enhances Protein Representations	May 26, 2025	DenoisingLanguage Modeling	—Unverified	0
ADALog: Adaptive Unsupervised Anomaly detection in Logs with Self-attention Masked Language Model	May 15, 2025	Anomaly DetectionLanguage Modeling	—Unverified	0
CreoPep: A Universal Deep Learning Framework for Target-Specific Peptide Design and Optimization	May 5, 2025	DiversityLanguage Modeling	CodeCode Available	1
CodeSSM: Towards State Space Models for Code Understanding	May 2, 2025	Clone DetectionLanguage Modeling	—Unverified	0
In-Context Learning can distort the relationship between sequence likelihoods and biological fitness	Apr 23, 2025	In-Context LearningLanguage Modeling	—Unverified	0
Enhancing Domain-Specific Encoder Models with LLM-Generated Data: How to Leverage Ontologies, and How to Do Without Them	Mar 27, 2025	Continual PretrainingLanguage Modeling	—Unverified	0
Low-Resource Transliteration for Roman-Urdu and Urdu Using Transformer-Based Models	Mar 27, 2025	Information RetrievalLanguage Modeling	—Unverified	0
LakotaBERT: A Transformer-based Model for Low Resource Lakota Language	Mar 23, 2025	Language ModelingLanguage Modelling	—Unverified	0
Shushing! Let's Imagine an Authentic Speech from the Silent Video	Mar 19, 2025	cross-modal alignmentLanguage Modeling	—Unverified	0
ASMA-Tune: Unlocking LLMs' Assembly Code Comprehension via Structural-Semantic Instruction Tuning	Mar 14, 2025	Code GenerationDecoder	CodeCode Available	0
Task-Informed Anti-Curriculum by Masking Improves Downstream Performance on Text	Feb 18, 2025	Authorship AttributionLanguage Modeling	CodeCode Available	0
Mask-Enhanced Autoregressive Prediction: Pay Less Attention to Learn More	Feb 11, 2025	DecoderInformation Retrieval	CodeCode Available	0
Enabling Autoregressive Models to Fill In Masked Tokens	Feb 9, 2025	DecoderLanguage Modeling	—Unverified	0
Long-VITA: Scaling Large Multi-modal Models to 1 Million Tokens with Leading Short-Context Accuray	Feb 7, 2025	4kGeneral Knowledge	CodeCode Available	3
SoundSpring: Loss-Resilient Audio Transceiver with Dual-Functional Masked Language Modeling	Jan 22, 2025	Audio CompressionLanguage Modeling	—Unverified	0
Knowing Where to Focus: Attention-Guided Alignment for Text-based Person Search	Dec 19, 2024	Language ModelingLanguage Modelling	—Unverified	0
Bias Vector: Mitigating Biases in Language Models with Task Arithmetic Approach	Dec 16, 2024	Language ModelingLanguage Modelling	—Unverified	0
A Progressive Transformer for Unifying Binary Code Embedding and Knowledge Transfer	Dec 15, 2024	Feature EngineeringLanguage Modeling	—Unverified	0
Leveraging Prompt Learning and Pause Encoding for Alzheimer's Disease Detection	Dec 9, 2024	Alzheimer's Disease DetectionAutomatic Speech Recognition	—Unverified	0
Small Languages, Big Models: A Study of Continual Training on Languages of Norway	Dec 9, 2024	Language ModelingLanguage Modelling	—Unverified	0
AntLM: Bridging Causal and Masked Language Models	Dec 4, 2024	Causal Language ModelingDecoder	—Unverified	0
Mitigating Gender Bias in Contextual Word Embeddings	Nov 18, 2024	Language ModelingLanguage Modelling	—Unverified	0
CamemBERT 2.0: A Smarter French Language Model Aged to Perfection	Nov 13, 2024	Language ModelingLanguage Modelling	—Unverified	0
GPT or BERT: why not both?	Oct 31, 2024	Causal Language ModelingLanguage Modeling	CodeCode Available	2
Less is More: Pre-Training Cross-Lingual Small-Scale Language Models with Cognitively-Plausible Curriculum Learning Strategies	Oct 30, 2024	Language AcquisitionMasked Language Modeling	CodeCode Available	0
Long-context Protein Language Modeling Using Bidirectional Mamba with Shared Projection Layers	Oct 29, 2024	Drug DesignLanguage Modeling	CodeCode Available	1
Abrupt Learning in Transformers: A Case Study on Matrix Completion	Oct 29, 2024	Language ModelingLanguage Modelling	—Unverified	0
Distributionally robust self-supervised learning for tabular data	Oct 11, 2024	DecoderLanguage Modeling	CodeCode Available	0
LecPrompt: A Prompt-based Approach for Logical Error Correction with CodeBERT	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified	0
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models	Oct 10, 2024	Image GenerationLanguage Modeling	—Unverified	0
Enhancing SPARQL Generation by Triplet-order-sensitive Pre-training	Oct 8, 2024	Graph Question AnsweringLanguage Modeling	CodeCode Available	0
FARM: Functional Group-Aware Representations for Small Molecules	Oct 2, 2024	Contrastive LearningDrug Discovery	—Unverified	0
SciPrompt: Knowledge-augmented Prompting for Fine-grained Categorization of Scientific Topics	Oct 2, 2024	ClassificationLanguage Modeling	CodeCode Available	0
Generating Synthetic Free-text Medical Records with Low Re-identification Risk using Masked Language Modeling	Sep 15, 2024	Causal Language ModelingDe-identification	CodeCode Available	0
DomURLs_BERT: Pre-trained BERT-based Model for Malicious Domains and URLs Detection and Classification	Sep 13, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
VidLPRO: A Video-Language Pre-training Framework for Robotic and Laparoscopic Surgery	Sep 7, 2024	Computational EfficiencyContrastive Learning	—Unverified	0
N-gram Prediction and Word Difference Representations for Language Modeling	Sep 5, 2024	Causal Language ModelingLanguage Modeling	—Unverified	0
Dynamic Motion Synthesis: Masked Audio-Text Conditioned Spatio-Temporal Transformers	Sep 3, 2024	Language ModelingLanguage Modelling	—Unverified	0
How transformers learn structured data: insights from hierarchical filtering	Aug 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Mistral-SPLADE: LLMs for better Learned Sparse Retrieval	Aug 20, 2024	DecoderLanguage Modeling	CodeCode Available	0
Unlocking Efficiency: Adaptive Masking for Gene Transformer Models	Aug 13, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
MIDI-to-Tab: Guitar Tablature Inference via Masked Language Modeling	Aug 9, 2024	DecoderLanguage Modeling	—Unverified	0
AutoScale: Scale-Aware Data Mixing for Pre-Training LLMs	Jul 29, 2024	Bilevel OptimizationLanguage Modelling	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 10Next →

No leaderboard results yet.