Small Language Model

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 109 papers

Title	Date	Tasks	Status	Hype	Score
TinyLlama: An Open-Source Small Language Model	Jan 4, 2024	Computational EfficiencyLanguage Modeling	CodeCode Available	11	5
TinyAgent: Function Calling at the Edge	Sep 1, 2024	Language ModellingQuantization	CodeCode Available	3	5
Embodied CoT Distillation From LLM To Off-the-shelf Agents	Dec 16, 2024	Decision MakingIn-Context Learning	CodeCode Available	3	5
LLaVA-Phi: Efficient Multi-Modal Assistant with Small Language Model	Jan 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	3	5
LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs	Aug 24, 2024	Language ModelingLanguage Modelling	CodeCode Available	3	5
CodeSAM: Source Code Representation Learning by Infusing Self-Attention with Multi-Code-View Graphs	Nov 21, 2024	Clone DetectionCode Search	CodeCode Available	2	5
Zero-Shot Vision Encoder Grafting via LLM Surrogates	May 28, 2025	DecoderLanguage Modeling	CodeCode Available	2	5
Mobile-VideoGPT: Fast and Accurate Video Understanding Language Model	Mar 27, 2025	EgoSchemaLanguage Modeling	CodeCode Available	2	5
PhoneLM:an Efficient and Capable Small Language Model Family through Principled Pre-training	Nov 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
Small-E: Small Language Model with Linear Attention for Efficient Speech Synthesis	Jun 6, 2024	DecoderInductive Bias	CodeCode Available	2	5
TeleOracle: Fine-Tuned Retrieval-Augmented Generation with Long-Context Support for Network	Nov 4, 2024	ChunkingLanguage Modelling	CodeCode Available	1	5
Bilinear MLPs enable weight-based mechanistic interpretability	Oct 10, 2024	image-classificationImage Classification	CodeCode Available	1	5
AdaptiveLog: An Adaptive Log Analysis Framework with the Collaboration of Large and Small Language Model	Jan 19, 2025	In-Context LearningLanguage Modeling	CodeCode Available	1	5
Distributed LLMs and Multimodal Large Language Models: A Survey on Advances, Challenges, and Future Directions	Mar 20, 2025	2D Object DetectionDistributed Computing	CodeCode Available	1	5
SLM Meets LLM: Balancing Latency, Interpretability and Consistency in Hallucination Detection	Aug 22, 2024	HallucinationLanguage Modeling	CodeCode Available	1	5
Towards Explainable Harmful Meme Detection through Multimodal Debate between Large Language Models	Jan 24, 2024	Hateful Meme ClassificationLanguage Modelling	CodeCode Available	1	5
Leveraging Fine-Tuned Retrieval-Augmented Generation with Long-Context Support: For 3GPP Standards	Aug 21, 2024	ChunkingComputational Efficiency	CodeCode Available	1	5
PiVe: Prompting with Iterative Verification Improving Graph-based Generative Capability of LLMs	May 21, 2023	Data AugmentationGraph Generation	CodeCode Available	1	5
Collab-RAG: Boosting Retrieval-Augmented Generation for Complex Question Answering via White-Box and Black-Box LLM Collaboration	Apr 7, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
Cognitive Visual-Language Mapper: Advancing Multimodal Comprehension with Enhanced Visual Knowledge Alignment	Feb 21, 2024	Language ModellingQuestion Answering	CodeCode Available	1	5
Small Language Model Makes an Effective Long Text Extractor	Feb 11, 2025	GPULanguage Modeling	CodeCode Available	1	5
CofiPara: A Coarse-to-fine Paradigm for Multimodal Sarcasm Target Identification with Large Multimodal Models	May 1, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Prompt Candidates, then Distill: A Teacher-Student Framework for LLM-driven Data Annotation	Jun 4, 2025	Small Language Modeltext-classification	CodeCode Available	1	5
Atla Selene Mini: A General Purpose Evaluation Model	Jan 27, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
Siamese BERT-based Model for Web Search Relevance Ranking Evaluated on a New Czech Dataset	Dec 3, 2021	Document RankingLanguage Modeling	CodeCode Available	1	5
AnyMatch -- Efficient Zero-Shot Entity Matching with a Small Language Model	Sep 6, 2024	AttributeAutoML	CodeCode Available	1	5
TinyStyler: Efficient Few-Shot Text Style Transfer with Authorship Embeddings	Jun 21, 2024	AttributeLanguage Modeling	CodeCode Available	1	5
Is Training Data Quality or Quantity More Impactful to Small Language Model Performance?	Nov 24, 2024	Language ModelingLanguage Modelling	CodeCode Available	0	5
Small Language Models can Outperform Humans in Short Creative Writing: A Study Comparing SLMs with Humans and LLMs	Sep 17, 2024	Language ModellingSmall Language Model	CodeCode Available	0	5
XAMPLER: Learning to Retrieve Cross-Lingual In-Context Examples	May 8, 2024	In-Context LearningLanguage Modeling	CodeCode Available	0	5
CRAVE: A Conflicting Reasoning Approach for Explainable Claim Verification Using LLMs	Apr 21, 2025	Claim VerificationLogical Reasoning	CodeCode Available	0	5
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model	May 21, 2025	Language ModelingLanguage Modelling	CodeCode Available	0	5
VersusDebias: Universal Zero-Shot Debiasing for Text-to-Image Models via SLM-Based Prompt Engineering and Generative Adversary	Jul 28, 2024	AttributeFairness	CodeCode Available	0	5
The Birth of Bias: A case study on the evolution of gender bias in an English language model	Jul 21, 2022	Language ModelingLanguage Modelling	CodeCode Available	0	5
Improving In-Context Learning with Small Language Model Ensembles	Oct 29, 2024	Domain LabellingIn-Context Learning	CodeCode Available	0	5
SOUL: Towards Sentiment and Opinion Understanding of Language	Oct 27, 2023	Language ModellingSentiment Analysis	CodeCode Available	0	5
Grasping the Essentials: Tailoring Large Language Models for Zero-Shot Relation Extraction	Feb 17, 2024	Few-Shot LearningLanguage Modelling	CodeCode Available	0	5
Preempting Text Sanitization Utility in Resource-Constrained Privacy-Preserving LLM Interactions	Nov 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	0	5
Assessing Generative Language Models in Classification Tasks: Performance and Self-Evaluation Capabilities in the Environmental and Climate Change Domain	Aug 30, 2024	Language ModelingLanguage Modelling	CodeCode Available	0	5
Lightweight Relevance Grader in RAG	Jun 17, 2025	Language ModelingLanguage Modelling	CodeCode Available	0	5
Efficient Medical Question Answering with Knowledge-Augmented Question Generation	May 23, 2024	Language ModelingLanguage Modelling	CodeCode Available	0	5
Domain-Adaptive Small Language Models for Structured Tax Code Prediction	Jul 15, 2025	DecoderSmall Language Model	—Unverified	0	0
Biomedical Question Answering via Multi-Level Summarization on a Local Knowledge Graph	Apr 2, 2025	Language ModelingLanguage Modelling	—Unverified	0	0
Distil-xLSTM: Learning Attention Mechanisms through Recurrent Structures	Mar 24, 2025	Language ModelingLanguage Modelling	—Unverified	0	0
Distilling On-device Language Models for Robot Planning with Minimal Human Intervention	Jun 20, 2025	Small Language Model	—Unverified	0	0
Biomed-Enriched: A Biomedical Dataset Enriched with LLMs for Pretraining and Extracting Rare and Hidden Content	Jun 25, 2025	ArticlesContinual Pretraining	—Unverified	0	0
A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs	Oct 24, 2024	Language ModelingLanguage Modelling	—Unverified	0	0
DecorateLM: Data Engineering through Corpus Rating, Tagging, and Editing with Language Models	Oct 8, 2024	Language ModelingLanguage Modelling	—Unverified	0	0
Cross-lingual Transfer for Automatic Question Generation by Learning Interrogative Structures in Target Languages	Oct 4, 2024	ChatbotCross-Lingual Transfer	—Unverified	0	0
PerfRL: A Small Language Model Framework for Efficient Code Optimization	Dec 9, 2023	Language ModelingLanguage Modelling	—Unverified	0	0

Show:10 25 50

← PrevPage 1 of 3Next →

No leaderboard results yet.