Mixture-of-Experts

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 226–250 of 1312 papers

Title	Date	Tasks	Status	Hype
Prompt-prompted Adaptive Structured Pruning for Efficient LLM Generation	Apr 1, 2024	Mixture-of-Experts	CodeCode Available	1
LITE: Modeling Environmental Ecosystems with Multimodal Large Language Models	Apr 1, 2024	Decision MakingLanguage Modeling	CodeCode Available	1
Unleashing the Power of Meta-tuning for Few-shot Generalization Through Sparse Interpolated Experts	Mar 13, 2024	Domain GeneralizationFew-Shot Image Classification	CodeCode Available	1
Unity by Diversity: Improved Representation Learning in Multimodal VAEs	Mar 8, 2024	DecoderDiversity	CodeCode Available	1
DMoERM: Recipes of Mixture-of-Experts for Effective Reward Modeling	Mar 2, 2024	Language ModellingLarge Language Model	CodeCode Available	1
Sequence-level Semantic Representation Fusion for Recommender Systems	Feb 28, 2024	Mixture-of-ExpertsRecommendation Systems	CodeCode Available	1
XMoE: Sparse Models with Fine-grained and Adaptive Expert Selection	Feb 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
LLMBind: A Unified Modality-Task Integration Framework	Feb 22, 2024	AI AgentAudio Generation	CodeCode Available	1
HyperMoE: Towards Better Mixture of Experts via Transferring Among Experts	Feb 20, 2024	Mixture-of-ExpertsMulti-Task Learning	CodeCode Available	1
Scaling physics-informed hard constraints with mixture-of-experts	Feb 20, 2024	Inductive BiasMixture-of-Experts	CodeCode Available	1
BiMediX: Bilingual Medical Mixture of Experts LLM	Feb 20, 2024	Mixture-of-ExpertsMultiple-choice	CodeCode Available	1
Multilinear Mixture of Experts: Scalable Expert Specialization through Factorization	Feb 19, 2024	Attributecounterfactual	CodeCode Available	1
Multimodal Clinical Trial Outcome Prediction with Large Language Models	Feb 9, 2024	Mixture-of-ExpertsPrediction	CodeCode Available	1
Merging Multi-Task Models via Weight-Ensembling Mixture of Experts	Feb 1, 2024	Mixture-of-ExpertsTask Arithmetic	CodeCode Available	1
Efficient Fine-tuning of Audio Spectrogram Transformers via Soft Mixture of Adapters	Feb 1, 2024	Mixture-of-Expertsparameter-efficient fine-tuning	CodeCode Available	1
Contrastive Learning and Mixture of Experts Enables Precise Vector Embeddings	Jan 28, 2024	Contrastive LearningDescriptive	CodeCode Available	1
Exploiting Inter-Layer Expert Affinity for Accelerating Mixture-of-Experts Model Inference	Jan 16, 2024	GPUMixture-of-Experts	CodeCode Available	1
Frequency-Adaptive Pan-Sharpening with Mixture of Experts	Jan 4, 2024	Mixture-of-Experts	CodeCode Available	1
FineMoGen: Fine-Grained Spatio-Temporal Motion Generation and Editing	Dec 22, 2023	Mixture-of-ExpertsMotion Generation	CodeCode Available	1
When Parameter-efficient Tuning Meets General-purpose Vision-language Models	Dec 16, 2023	Mixture-of-Experts	CodeCode Available	1
SwitchHead: Accelerating Transformers with Mixture-of-Experts Attention	Dec 13, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Parameter Efficient Adaptation for Image Restoration with Heterogeneous Mixture-of-Experts	Dec 12, 2023	DenoisingDiversity	CodeCode Available	1
HyperRouter: Towards Efficient Training and Inference of Sparse Mixture of Experts	Dec 12, 2023	Mixture-of-Experts	CodeCode Available	1
Mixture-of-Linear-Experts for Long-term Time Series Forecasting	Dec 11, 2023	Mixture-of-ExpertsTime Series	CodeCode Available	1
GraphMETRO: Mitigating Complex Graph Distribution Shifts via Mixture of Aligned Experts	Dec 7, 2023	DiversityGraph Neural Network	CodeCode Available	1

Show:10 25 50

← PrevPage 10 of 53Next →

No leaderboard results yet.