Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–225 of 14182 papers

Title	Date	Tasks	Status	Hype	Score
R1-Onevision：An Open-Source Multimodal Large Language Model Capable of Deep Reasoning	Feb 24, 2025	Language ModelingLanguage Modelling	CodeCode Available	4	5
Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small	Nov 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	4	5
BLOOM: A 176B-Parameter Open-Access Multilingual Language Model	Nov 9, 2022	DecoderLanguage Modeling	CodeCode Available	4	5
Galactica: A Large Language Model for Science	Nov 16, 2022	AnachronismsBias Detection	CodeCode Available	4	5
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects	Dec 13, 2023	3D Object Detection3D Object Tracking	CodeCode Available	4	5
Gated Delta Networks: Improving Mamba2 with Delta Rule	Dec 9, 2024	Common Sense ReasoningLanguage Modeling	CodeCode Available	4	5
GigaAM: Efficient Self-Supervised Learner for Speech Recognition	Jun 1, 2025	Automatic Speech RecognitionLanguage Modeling	CodeCode Available	4	5
Flamingo: a Visual Language Model for Few-Shot Learning	Apr 29, 2022	Few-Shot LearningGenerative Visual Question Answering	CodeCode Available	4	5
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models	Jan 30, 2023	Generative Visual Question AnsweringImage Captioning	CodeCode Available	4	5
BioMedLM: A 2.7B Parameter Language Model Trained On Biomedical Text	Mar 27, 2024	ArticlesLanguage Modeling	CodeCode Available	4	5
Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning	Mar 20, 2025	Decision MakingLanguage Modeling	CodeCode Available	4	5
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models	Mar 12, 2025	DenoisingLanguage Modeling	CodeCode Available	4	5
Image Fusion via Vision-Language Model	Feb 3, 2024	DecoderLanguage Modeling	CodeCode Available	4	5
RaTEScore: A Metric for Radiology Report Generation	Jun 24, 2024	DiagnosticEntity Embeddings	CodeCode Available	4	5
Phoenix: Democratizing ChatGPT across Languages	Apr 20, 2023	Language ModelingLanguage Modelling	CodeCode Available	4	5
Partition Generative Modeling: Masked Modeling Without Masks	May 24, 2025	Computational EfficiencyLanguage Modeling	CodeCode Available	4	5
Photo-Realistic Image Restoration in the Wild with Controlled Vision-Language Models	Apr 15, 2024	Image GenerationImage Restoration	CodeCode Available	4	5
Cost-Effective Hyperparameter Optimization for Large Language Model Generation Inference	Mar 8, 2023	Hyperparameter OptimizationLanguage Modeling	CodeCode Available	4	5
Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data	Apr 3, 2023	ChatbotLanguage Modeling	CodeCode Available	4	5
OLMoE: Open Mixture-of-Experts Language Models	Sep 3, 2024	Language ModelingLanguage Modelling	CodeCode Available	4	5
Debug like a Human: A Large Language Model Debugger via Verifying Runtime Execution Step-by-step	Feb 25, 2024	Code GenerationHumanEval	CodeCode Available	4	5
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention	Apr 10, 2024	Book summarizationLanguage Modeling	CodeCode Available	4	5
Optimizing Prompts for Text-to-Image Generation	Dec 19, 2022	Language ModelingLanguage Modelling	CodeCode Available	4	5
N-Grammer: Augmenting Transformers with latent n-grams	Jul 13, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	4	5
AutoWebGLM: A Large Language Model-based Web Navigating Agent	Apr 4, 2024	Decision MakingLanguage Modeling	CodeCode Available	4	5

Show:10 25 50

← PrevPage 9 of 568Next →

No leaderboard results yet.