Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1451–1500 of 14182 papers

Title	Date	Tasks	Status	Hype	Score
hmBERT: Historical Multilingual Language Models for Named Entity Recognition	May 31, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
History Matters: Temporal Knowledge Editing in Large Language Model	Dec 9, 2023	knowledge editingLanguage Modeling	CodeCode Available	1	5
How does GPT-2 compute greater-than?: Interpreting mathematical abilities in a pre-trained language model	Apr 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
CDLM: Cross-Document Language Modeling	Jan 2, 2021	Citation RecommendationCoreference Resolution	CodeCode Available	1	5
Hierarchical Transformers Are More Efficient Language Models	Oct 26, 2021	Image GenerationLanguage Modeling	CodeCode Available	1	5
High-Dimension Human Value Representation in Large Language Models	Apr 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
AMPERSAND: Argument Mining for PERSuAsive oNline Discussions	Apr 30, 2020	Argument MiningLanguage Modeling	CodeCode Available	1	5
UniTAB: Unifying Text and Box Outputs for Grounded Vision-Language Modeling	Nov 23, 2021	Image CaptioningImage Description	CodeCode Available	1	5
CriticEval: Evaluating Large Language Model as Critic	Feb 21, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
How does the pre-training objective affect what large language models learn about linguistic properties?	Mar 20, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Hexatagging: Projective Dependency Parsing as Tagging	Jun 8, 2023	Computational EfficiencyDependency Parsing	CodeCode Available	1	5
Crafting Large Language Models for Enhanced Interpretability	Jul 5, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
HetSeq: Distributed GPU Training on Heterogeneous Infrastructure	Sep 25, 2020	GPUimage-classification	CodeCode Available	1	5
Hessian of Perplexity for Large Language Models by PyTorch autograd (Open Source)	Apr 6, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
HerO at AVeriTeC: The Herd of Open Large Language Models for Verifying Real-World Claims	Oct 16, 2024	Fact CheckingLanguage Modeling	CodeCode Available	1	5
Heterogeneous Graph Reasoning for Fact Checking over Texts and Tables	Feb 20, 2024	Fact CheckingGraph Neural Network	CodeCode Available	1	5
HiAgent: Hierarchical Working Memory Management for Solving Long-Horizon Agent Tasks with Large Language Model	Aug 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
CPM: A Large-scale Generative Chinese Pre-trained Language Model	Dec 1, 2020	Cloze TestLanguage Modeling	CodeCode Available	1	5
CPLLM: Clinical Prediction with Large Language Models	Sep 20, 2023	Disease PredictionLanguage Modeling	CodeCode Available	1	5
A Model of Cross-Lingual Knowledge-Grounded Response Generation for Open-Domain Dialogue Systems	Nov 1, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
CPT: A Pre-Trained Unbalanced Transformer for Both Chinese Language Understanding and Generation	Sep 13, 2021	DecoderDenoising	CodeCode Available	1	5
Helping or Herding? Reward Model Ensembles Mitigate but do not Eliminate Reward Hacking	Dec 14, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Coupling Large Language Models with Logic Programming for Robust and General Reasoning from Text	Jul 15, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Cross-model Control: Improving Multiple Large Language Models in One-time Training	Oct 23, 2024	Instruction FollowingLanguage Modeling	CodeCode Available	1	5
Hello, It's GPT-2 -- How Can I Help You? Towards the Use of Pretrained Language Models for Task-Oriented Dialogue Systems	Jul 12, 2019	Decision MakingLanguage Modeling	CodeCode Available	1	5
CPT: Efficient Deep Neural Network Training via Cyclic Precision	Jan 25, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Automatic Controllable Product Copywriting for E-Commerce	Jun 21, 2022	Aspect ExtractionLanguage Modeling	CodeCode Available	1	5
AdaSplash: Adaptive Sparse Flash Attention	Feb 17, 2025	GPULanguage Modeling	CodeCode Available	1	5
CRE-LLM: A Domain-Specific Chinese Relation Extraction Framework with Fine-tuned Large Language Model	Apr 28, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Counterfactual Token Generation in Large Language Models	Sep 25, 2024	Bias Detectioncounterfactual	CodeCode Available	1	5
CreoPep: A Universal Deep Learning Framework for Target-Specific Peptide Design and Optimization	May 5, 2025	DiversityLanguage Modeling	CodeCode Available	1	5
HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training	May 1, 2020	Language ModelingLanguage Modelling	CodeCode Available	1	5
Helpful or Harmful Data? Fine-tuning-free Shapley Attribution for Explaining Language Model Predictions	Jun 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Help me write a poem: Instruction Tuning as a Vehicle for Collaborative Poetry Writing	Oct 25, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
CREAM: Consistency Regularized Self-Rewarding Language Models	Oct 16, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Automatic Evaluation of Attribution by Large Language Models	May 10, 2023	Fact CheckingLanguage Modeling	CodeCode Available	1	5
How far is Language Model from 100% Few-shot Named Entity Recognition in Medical Domain	Jul 1, 2023	few-shot-nerFew-shot NER	CodeCode Available	1	5
Human-in-the-Loop for Data Collection: a Multi-Target Counter Narrative Dataset to Fight Online Hate Speech	Jul 19, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Hallucinations in Large Multilingual Translation Models	Mar 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Critic-Guided Decoding for Controlled Text Generation	Dec 21, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Cross-Care: Assessing the Healthcare Implications of Pre-training Data on Language Model Bias	May 9, 2024	Data VisualizationLanguage Modeling	CodeCode Available	1	5
Cross-Align: Modeling Deep Cross-lingual Interactions for Word Alignment	Oct 9, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
AMR Parsing via Graph-Sequence Iterative Inference	Apr 12, 2020	AMR ParsingLanguage Modeling	CodeCode Available	1	5
Automatic Label Sequence Generation for Prompting Sequence-to-sequence Models	Sep 20, 2022	Few-Shot LearningLanguage Modeling	CodeCode Available	1	5
CoSafe: Evaluating Large Language Model Safety in Multi-Turn Dialogue Coreference	Jun 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Handwritten Mathematical Expression Recognition with Bidirectionally Trained Transformer	May 6, 2021	Data AugmentationDecoder	CodeCode Available	1	5
cosFormer: Rethinking Softmax in Attention	Feb 17, 2022	D4RLLanguage Modeling	CodeCode Available	1	5
Automatic Model Selection with Large Language Models for Reasoning	May 23, 2023	Arithmetic ReasoningGSM8K	CodeCode Available	1	5
HoneyBee: Progressive Instruction Finetuning of Large Language Models for Materials Science	Oct 12, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
Correcting Diverse Factual Errors in Abstractive Summarization via Post-Editing and Language Model Infilling	Oct 22, 2022	Abstractive Text SummarizationLanguage Modeling	CodeCode Available	1	5

Show:10 25 50

← PrevPage 30 of 284Next →

No leaderboard results yet.