Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 14182 papers

Title	Date	Tasks	Status	Hype
A Survey on the Optimization of Large Language Model-based Agents	Mar 16, 2025	Decision MakingLanguage Modeling	CodeCode Available	3
SVD-LLM V2: Optimizing Singular Value Truncation for Large Language Model Compression	Mar 16, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing	Mar 13, 2025	Image GenerationLanguage Modeling	CodeCode Available	3
SimLingo: Vision-Only Closed-Loop Autonomous Driving with Language-Action Alignment	Mar 12, 2025	Autonomous DrivingBench2Drive	CodeCode Available	3
Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems	Mar 5, 2025	Decision MakingLanguage Modeling	CodeCode Available	3
A Phylogenetic Approach to Genomic Language Modeling	Mar 4, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
Audio-Reasoner: Improving Reasoning Capability in Large Audio Language Models	Mar 4, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
AsymLoRA: Harmonizing Data Conflicts and Commonalities in MLLMs	Feb 27, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
Baichuan-Audio: A Unified Framework for End-to-End Speech Interaction	Feb 24, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
Prompt-to-Leaderboard	Feb 20, 2025	ChatbotLanguage Modeling	CodeCode Available	3
Slamming: Training a Speech Language Model on One GPU in a Day	Feb 19, 2025	GPULanguage Modeling	CodeCode Available	3
Long-VITA: Scaling Large Multi-modal Models to 1 Million Tokens with Leading Short-Context Accuray	Feb 7, 2025	4kGeneral Knowledge	CodeCode Available	3
Ola: Pushing the Frontiers of Omni-Modal Language Model	Feb 6, 2025	cross-modal alignmentLanguage Modeling	CodeCode Available	3
Multi-agent Architecture Search via Agentic Supernet	Feb 6, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
Partially Rewriting a Transformer in Natural Language	Jan 31, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
HERMES: A Unified Self-Driving World Model for Simultaneous 3D Scene Understanding and Generation	Jan 24, 2025	Autonomous DrivingLanguage Modeling	CodeCode Available	3
The Breeze 2 Herd of Models: Traditional Chinese LLMs Based on Llama with Vision-Aware and Function-Calling Capabilities	Jan 23, 2025	General KnowledgeInstruction Following	CodeCode Available	3
VARGPT: Unified Understanding and Generation in a Visual Autoregressive Multimodal Large Language Model	Jan 21, 2025	Image GenerationInstruction Following	CodeCode Available	3
In-situ graph reasoning and knowledge expansion using Graph-PReFLexOR	Jan 14, 2025	Knowledge GraphsLanguage Modeling	CodeCode Available	3
Lifelong Learning of Large Language Model based Agents: A Roadmap	Jan 13, 2025	Incremental LearningLanguage Modeling	CodeCode Available	3
Valley2: Exploring Multimodal Models with Scalable Vision-Language Design	Jan 10, 2025	Image CaptioningLanguage Modeling	CodeCode Available	3
LangFair: A Python Package for Assessing Bias and Fairness in Large Language Model Use Cases	Jan 6, 2025	FairnessLanguage Modeling	CodeCode Available	3
A Survey on Large Language Model Acceleration based on KV Cache Management	Dec 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
YuLan-Mini: An Open Data-efficient Language Model	Dec 23, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Next Token Prediction Towards Multimodal Intelligence: A Comprehensive Survey	Dec 16, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Embodied CoT Distillation From LLM To Off-the-shelf Agents	Dec 16, 2024	Decision MakingIn-Context Learning	CodeCode Available	3
BatchTopK Sparse Autoencoders	Dec 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
PaliGemma 2: A Family of Versatile VLMs for Transfer	Dec 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
From Individual to Society: A Survey on Social Simulation Driven by Large Language Model-based Agents	Dec 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Advancing Speech Language Models by Scaling Supervised Fine-Tuning with Over 60,000 Hours of Synthetic Speech Dialogue Data	Dec 2, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
HackSynth: LLM Agent and Evaluation Framework for Autonomous Penetration Testing	Dec 2, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Large Language Model-Brained GUI Agents: A Survey	Nov 27, 2024	Code GenerationLanguage Modeling	CodeCode Available	3
On the Efficiency of NLP-Inspired Methods for Tabular Deep Learning	Nov 26, 2024	Computational EfficiencyDeep Learning	CodeCode Available	3
Pushing the Limits of Large Language Model Quantization via the Linearity Theorem	Nov 26, 2024	GPULanguage Modeling	CodeCode Available	3
BayLing 2: A Multilingual Large Language Model with Efficient Language Alignment	Nov 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
SemiKong: Curating, Training, and Evaluating A Semiconductor Industry-Specific Large Language Model	Nov 21, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
The Surprising Effectiveness of Test-Time Training for Few-Shot Learning	Nov 11, 2024	ARCFew-Shot Learning	CodeCode Available	3
SuffixDecoding: Extreme Speculative Decoding for Emerging AI Applications	Nov 7, 2024	Code GenerationLanguage Modeling	CodeCode Available	3
Rule Based Rewards for Language Model Safety	Nov 2, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Lingma SWE-GPT: An Open Development-Process-Centric Language Model for Automated Software Improvement	Nov 1, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Llama Scope: Extracting Millions of Features from Llama-3.1-8B with Sparse Autoencoders	Oct 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Centaur: a foundation model of human cognition	Oct 26, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training	Oct 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Scaling up Masked Diffusion Models on Text	Oct 24, 2024	GSM8KLanguage Modeling	CodeCode Available	3
Scaling Diffusion Language Models via Adaptation from Autoregressive Models	Oct 23, 2024	In-Context LearningLanguage Modeling	CodeCode Available	3
DPLM-2: A Multimodal Diffusion Protein Language Model	Oct 17, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
PRefLexOR: Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning and Agentic Thinking	Oct 16, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Predicting from Strings: Language Model Embeddings for Bayesian Optimization	Oct 14, 2024	Bayesian OptimizationExperimental Design	CodeCode Available	3
Baichuan-Omni Technical Report	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference	Oct 6, 2024	Language ModelingLanguage Modelling	CodeCode Available	3

Show:10 25 50

← PrevPage 6 of 284Next →

No leaderboard results yet.