Mixture-of-Experts

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–475 of 1312 papers

Title	Date	Tasks	Status	Score
Effective Approaches to Batch Parallelization for Dynamic Neural Network Architectures	Jul 8, 2017	Mixture-of-ExpertsQuestion Answering	CodeCode Available	5
m2mKD: Module-to-Module Knowledge Distillation for Modular Transformers	Feb 26, 2024	Knowledge DistillationMixture-of-Experts	CodeCode Available	5
EAQuant: Enhancing Post-Training Quantization for MoE Models via Expert-Aware Optimization	Jun 16, 2025	Mixture-of-ExpertsModel Compression	CodeCode Available	5
A multi-scale lithium-ion battery capacity prediction using mixture of experts and patch-based MLP	Mar 26, 2025	Mixture-of-Experts	CodeCode Available	5
DynMoLE: Boosting Mixture of LoRA Experts Fine-Tuning with a Hybrid Routing Mechanism	Apr 1, 2025	Common Sense ReasoningComputational Efficiency	CodeCode Available	5
Binary-Integer-Programming Based Algorithm for Expert Load Balancing in Mixture-of-Experts Models	Feb 21, 2025	Mixture-of-Experts	CodeCode Available	5
A Multi-Modal Deep Learning Framework for Pan-Cancer Prognosis	Jan 13, 2025	Deep LearningMixture-of-Experts	CodeCode Available	5
LLM-e Guess: Can LLMs Capabilities Advance Without Hardware Progress?	May 7, 2025	Large Language ModelMixture-of-Experts	CodeCode Available	5
GShard: Scaling Giant Models with Conditional Computation and Automatic Sharding	Jun 30, 2020	Machine TranslationMixture-of-Experts	CodeCode Available	5
Guiding the Experts: Semantic Priors for Efficient and Focused MoE Routing	May 24, 2025	Mixture-of-Experts	CodeCode Available	5
GuiLoMo: Allocating Expert Number and Rank for LoRA-MoE via Bilevel Optimization with GuidedSelection Vectors	Jun 17, 2025	Bilevel OptimizationMixture-of-Experts	CodeCode Available	5
GW-MoE: Resolving Uncertainty in MoE Router with Global Workspace Theory	Jun 18, 2024	Code GenerationMathematical Problem-Solving	CodeCode Available	5
DutyTTE: Deciphering Uncertainty in Origin-Destination Travel Time Estimation	Aug 23, 2024	Deep Reinforcement LearningMixture-of-Experts	CodeCode Available	5
BIG-MoE: Bypass Isolated Gating MoE for Generalized Multimodal Face Anti-Spoofing	Dec 24, 2024	Decision MakingFace Anti-Spoofing	CodeCode Available	5
Bidirectional Attention as a Mixture of Continuous Word Experts	Jul 8, 2023	Language ModellingMixture-of-Experts	CodeCode Available	5
DSelect-k: Differentiable Selection in the Mixture of Experts with Applications to Multi-Task Learning	Jun 7, 2021	Mixture-of-ExpertsMulti-Task Learning	CodeCode Available	5
Lifelong Mixture of Variational Autoencoders	Jul 9, 2021	Lifelong learningMixture-of-Experts	CodeCode Available	5
Learning Mixture-of-Experts for General-Purpose Black-Box Discrete Optimization	May 29, 2024	Mixture-of-Experts	CodeCode Available	5
Learning Deep Mixtures of Gaussian Process Experts Using Sum-Product Networks	Sep 12, 2018	Gaussian ProcessesMixture-of-Experts	CodeCode Available	5
Beyond Sharing: Conflict-Aware Multivariate Time Series Anomaly Detection	Aug 17, 2023	Anomaly DetectionMixture-of-Experts	CodeCode Available	5
Learning Gating ConvNet for Two-Stream based Methods in Action Recognition	Sep 12, 2017	Action ClassificationAction Recognition	CodeCode Available	5
Learning multi-modal generative models with permutation-invariant encoders and tighter variational objectives	Sep 1, 2023	Mixture-of-Experts	CodeCode Available	5
Domain-Agnostic Neural Architecture for Class Incremental Continual Learning in Document Processing Platform	Jul 11, 2023	Continual LearningMixture-of-Experts	CodeCode Available	5
Hierarchical Deep Recurrent Architecture for Video Understanding	Jul 11, 2017	ClassificationGeneral Classification	CodeCode Available	5
Learning a Mixture of Granularity-Specific Experts for Fine-Grained Categorization	Oct 1, 2019	DiversityFine-Grained Image Classification	CodeCode Available	5

Show:10 25 50

← PrevPage 19 of 53Next →

No leaderboard results yet.