Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1850 of 14182 papers

Title	Date	Tasks	Status	Hype	Score
Allocating Large Vocabulary Capacity for Cross-lingual Language Model Pre-training	Sep 15, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Enhancing the Protein Tertiary Structure Prediction by Multiple Sequence Alignment Generation	Jun 2, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
LLMVA-GEBC: Large Language Model with Video Adapter for Generic Event Boundary Captioning	Jun 17, 2023	Boundary CaptioningLanguage Modeling	CodeCode Available	1	5
Enhancing Vision-Language Model with Unmasked Token Alignment	May 29, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Enriching Music Descriptions with a Finetuned-LLM and Metadata for Text-to-Music Retrieval	Oct 4, 2024	DescriptiveLanguage Modeling	CodeCode Available	1	5
CreoPep: A Universal Deep Learning Framework for Target-Specific Peptide Design and Optimization	May 5, 2025	DiversityLanguage Modeling	CodeCode Available	1	5
Improving Conversational Recommendation Systems via Counterfactual Data Simulation	Jun 5, 2023	Conversational Recommendationcounterfactual	CodeCode Available	1	5
CREAM: Consistency Regularized Self-Rewarding Language Models	Oct 16, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Improving Aspect Sentiment Quad Prediction via Template-Order Data Augmentation	Oct 19, 2022	Aspect-Based Sentiment Analysis (ABSA)Data Augmentation	CodeCode Available	1	5
LMR-BENCH: Evaluating LLM Agent's Ability on Reproducing Language Modeling Research	Jun 19, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement	Feb 9, 2024	Code GenerationDecision Making	CodeCode Available	1	5
BiLD: Bi-directional Logits Difference Loss for Large Language Model Distillation	Jun 19, 2024	Knowledge DistillationLanguage Modeling	CodeCode Available	1	5
SpeechPrompt: An Exploration of Prompt Tuning on Generative Spoken Language Model for Speech Processing Tasks	Mar 31, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Bilinear MLPs enable weight-based mechanistic interpretability	Oct 10, 2024	image-classificationImage Classification	CodeCode Available	1	5
Improving Biomedical Pretrained Language Models with Knowledge	Apr 21, 2021	Entity LinkingLanguage Modeling	CodeCode Available	1	5
CRE-LLM: A Domain-Specific Chinese Relation Extraction Framework with Fine-tuned Large Language Model	Apr 28, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
ERNIE 3.0 Titan: Exploring Larger-scale Knowledge Enhanced Pre-training for Language Understanding and Generation	Dec 23, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Logical Fallacy Detection	Feb 28, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Critic-Guided Decoding for Controlled Text Generation	Dec 21, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
ESCOXLM-R: Multilingual Taxonomy-driven Pre-training for the Job Market Domain	May 20, 2023	De-identificationLanguage Modeling	CodeCode Available	1	5
Improving Contrastive Learning of Sentence Embeddings with Case-Augmented Positives and Retrieved Negatives	Jun 6, 2022	AttributeContrastive Learning	CodeCode Available	1	5
LOLA -- An Open-Source Massively Multilingual Large Language Model	Sep 17, 2024	DiversityLanguage Modeling	CodeCode Available	1	5
Improving End-to-End SLU performance with Prosodic Attention and Distillation	May 14, 2023	intent-classificationIntent Classification	CodeCode Available	1	5
CPT: Efficient Deep Neural Network Training via Cyclic Precision	Jan 25, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Binary Black-box Evasion Attacks Against Deep Learning-based Static Malware Detectors with Adversarial Byte-Level Language Model	Dec 14, 2020	Deep LearningFeature Engineering	CodeCode Available	1	5
Estimating Contamination via Perplexity: Quantifying Memorisation in Language Model Evaluation	Sep 19, 2023	Language Model EvaluationLanguage Modeling	CodeCode Available	1	5
Improved training of end-to-end attention models for speech recognition	May 8, 2018	Language ModelingLanguage Modelling	CodeCode Available	1	5
AuditWen:An Open-Source Large Language Model for Audit	Oct 9, 2024	Answer GenerationLanguage Modeling	CodeCode Available	1	5
CPT: A Pre-Trained Unbalanced Transformer for Both Chinese Language Understanding and Generation	Sep 13, 2021	DecoderDenoising	CodeCode Available	1	5
BioBART: Pretraining and Evaluation of A Biomedical Generative Language Model	Apr 8, 2022	Entity LinkingLanguage Modeling	CodeCode Available	1	5
Evaluating Human-Language Model Interaction	Dec 19, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
CPM: A Large-scale Generative Chinese Pre-trained Language Model	Dec 1, 2020	Cloze TestLanguage Modeling	CodeCode Available	1	5
CPLLM: Clinical Prediction with Large Language Models	Sep 20, 2023	Disease PredictionLanguage Modeling	CodeCode Available	1	5
Bioformer: an efficient transformer language model for biomedical text mining	Feb 3, 2023	ArticlesDocument Classification	CodeCode Available	1	5
Crafting Large Language Models for Enhanced Interpretability	Jul 5, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Protein Structure Tokenization: Benchmarking and New Recipe	Feb 28, 2025	BenchmarkingLanguage Modeling	CodeCode Available	1	5
Coupling Large Language Models with Logic Programming for Robust and General Reasoning from Text	Jul 15, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Improving antibody language models with native pairing	Aug 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Imputing Out-of-Vocabulary Embeddings with LOVE Makes LanguageModels Robust with Little Cost	May 1, 2022	Contrastive LearningLanguage Modeling	CodeCode Available	1	5
Counterfactual Data Augmentation for Neural Machine Translation	Jun 1, 2021	counterfactualData Augmentation	CodeCode Available	1	5
Evaluating Language Model Finetuning Techniques for Low-resource Languages	Jun 30, 2019	Language ModelingLanguage Modelling	CodeCode Available	1	5
Mathfish: Evaluating Language Model Math Reasoning via Grounding in Educational Curricula	Aug 8, 2024	GSM8KLanguage Modeling	CodeCode Available	1	5
LUKE: Deep Contextualized Entity Representations with Entity-aware Self-attention	Oct 2, 2020	Common Sense ReasoningEntity Typing	CodeCode Available	1	5
Implicit Language Models are RNNs: Balancing Parallelization and Expressivity	Feb 10, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
LXMERT: Learning Cross-Modality Encoder Representations from Transformers	Aug 20, 2019	Language ModelingLanguage Modelling	CodeCode Available	1	5
Biomedical Event Extraction with Hierarchical Knowledge Graphs	Sep 20, 2020	Event ExtractionLanguage Modeling	CodeCode Available	1	5
Implicit Unlikelihood Training: Improving Neural Text Generation with Reinforcement Learning	Jan 11, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Evaluating Morphological Alignment of Tokenizers in 70 Languages	Jul 8, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
Supervised Learning and Large Language Model Benchmarks on Mental Health Datasets: Cognitive Distortions and Suicidal Risks in Chinese Social Media	Sep 7, 2023	ClassificationLanguage Modeling	CodeCode Available	1	5
cosFormer: Rethinking Softmax in Attention	Feb 17, 2022	D4RLLanguage Modeling	CodeCode Available	1	5

Show:10 25 50

← PrevPage 37 of 284Next →

No leaderboard results yet.