Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 14182 papers

Title	Date	Tasks	Status	Hype
aiXcoder-7B: A Lightweight and Effective Large Language Model for Code Processing	Oct 17, 2024	AttributeCode Completion	CodeCode Available	7
VITA: Towards Open-Source Interactive Omni Multimodal LLM	Aug 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models	Aug 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
Mixture-of-Agents Enhances Large Language Model Capabilities	Jun 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
Scalable MatMul-free Language Modeling	Jun 4, 2024	GPULanguage Modeling	CodeCode Available	7
Adaptive In-conversation Team Building for Language Model Agents	May 29, 2024	DiversityLanguage Modeling	CodeCode Available	7
Dynamic data sampler for cross-language transfer learning in large language models	May 17, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
Hunyuan-DiT: A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding	May 14, 2024	Image GenerationLanguage Modeling	CodeCode Available	7
xLSTM: Extended Long Short-Term Memory	May 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
Labeling supervised fine-tuning data with the scaling law	May 5, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	7
Chronos: Learning the Language of Time Series	Mar 12, 2024	Gaussian ProcessesLanguage Modeling	CodeCode Available	7
SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models	Feb 8, 2024	BenchmarkingDiversity	CodeCode Available	7
EAGLE: Speculative Sampling Requires Rethinking Feature Uncertainty	Jan 26, 2024	Code GenerationInstruction Following	CodeCode Available	7
VMamba: Visual State Space Model	Jan 18, 2024	Computational EfficiencyLanguage Modeling	CodeCode Available	7
MiniGPT-v2: large language model as a unified interface for vision-language multi-task learning	Oct 14, 2023	Image ClassificationImage Description	CodeCode Available	7
DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines	Oct 5, 2023	Language ModelingLanguage Modelling	CodeCode Available	7
Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers	Jan 5, 2023	In-Context LearningLanguage Modeling	CodeCode Available	7
Elixir: Train a Large Language Model on a Small GPU Cluster	Dec 10, 2022	CPUGPU	CodeCode Available	7
AudioLM: a Language Modeling Approach to Audio Generation	Sep 7, 2022	Audio Generation	CodeCode Available	7
SGLang: Efficient Execution of Structured Language Model Programs	Dec 12, 2023	Few-Shot LearningLanguage Modeling	CodeCode Available	6
Mamba: Linear-Time Sequence Modeling with Selective State Spaces	Dec 1, 2023	2D Pose EstimationCommon Sense Reasoning	CodeCode Available	6
Mistral 7B	Oct 10, 2023	answerability predictionArithmetic Reasoning	CodeCode Available	6
NEFTune: Noisy Embeddings Improve Instruction Finetuning	Oct 9, 2023	Language ModelingLanguage Modelling	CodeCode Available	6
Qwen Technical Report	Sep 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	6
Efficient Memory Management for Large Language Model Serving with PagedAttention	Sep 12, 2023	Language ModelingLanguage Modelling	CodeCode Available	6

Show:10 25 50

← PrevPage 3 of 568Next →

No leaderboard results yet.