Mixture-of-Experts

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 1312 papers

Title	Date	Tasks	Status
Generalizing Multimodal Variational Methods to Sets	Dec 19, 2022	Mixture-of-Experts	—Unverified
Generator Assisted Mixture of Experts For Feature Acquisition in Batch	Dec 19, 2023	Mixture-of-Experts	—Unverified
GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot	Mar 20, 2024	Mixture-of-ExpertsMulti-Task Learning	—Unverified
GETS: Ensemble Temperature Scaling for Calibration in Graph Neural Networks	Oct 12, 2024	Mixture-of-Experts	—Unverified
GigaChat Family: Efficient Russian Language Modeling Through Mixture of Experts Architecture	Jun 11, 2025	Language ModelingLanguage Modelling	—Unverified
GLA in MediaEval 2018 Emotional Impact of Movies Task	Nov 27, 2019	Mixture-of-Experts	—Unverified
GLaM: Efficient Scaling of Language Models with Mixture-of-Experts	Dec 13, 2021	Common Sense ReasoningIn-Context Learning	—Unverified
GM-MoE: Low-Light Enhancement with Gated-Mechanism Mixture-of-Experts	Mar 10, 2025	3D ReconstructionAutonomous Driving	—Unverified
GradPower: Powering Gradients for Faster Language Model Pre-Training	May 30, 2025	Language ModelingLanguage Modelling	—Unverified
Graph Mixture of Experts and Memory-augmented Routers for Multivariate Time Series Anomaly Detection	Dec 26, 2024	Anomaly DetectionMixture-of-Experts	—Unverified
GRAPHMOE: Amplifying Cognitive Depth of Mixture-of-Experts Network via Introducing Self-Rethinking Mechanism	Jan 14, 2025	Mixture-of-Experts	—Unverified
GRIN: GRadient-INformed MoE	Sep 18, 2024	HellaSwagHumanEval	—Unverified
HAECcity: Open-Vocabulary Scene Understanding of City-Scale Point Clouds with Superpoint Graph Clustering	Apr 18, 2025	ClusteringGraph Clustering	—Unverified
Half-Space Feature Learning in Neural Networks	Apr 5, 2024	Mixture-of-Experts	—Unverified
Hard Mixtures of Experts for Large Scale Weakly Supervised Vision	Apr 20, 2017	GPUMixture-of-Experts	—Unverified
HDformer: A Higher Dimensional Transformer for Diabetes Detection Utilizing Long Range Vascular Signals	Mar 17, 2023	Computational EfficiencyMixture-of-Experts	—Unverified
HeterMoE: Efficient Training of Mixture-of-Experts Models on Heterogeneous GPUs	Apr 4, 2025	GPUMixture-of-Experts	—Unverified
Heuristic-Informed Mixture of Experts for Link Prediction in Multilayer Networks	Jan 29, 2025	Link PredictionMixture-of-Experts	—Unverified
Hierarchical mixture of discriminative Generalized Dirichlet classifiers	May 2, 2024	Mixture-of-ExpertsSpam detection	—Unverified
Hierarchical Mixture-of-Experts Model for Large-Scale Gaussian Process Regression	Dec 9, 2014	Mixture-of-Expertsregression	—Unverified
Hierarchical Routing Mixture of Experts	Mar 18, 2019	Mixture-of-Expertsregression	—Unverified
HiMoE: Heterogeneity-Informed Mixture-of-Experts for Fair Spatial-Temporal Forecasting	Nov 30, 2024	FairnessMixture-of-Experts	—Unverified
HMoE: Heterogeneous Mixture of Experts for Language Modeling	Aug 20, 2024	Computational EfficiencyLanguage Modeling	—Unverified
HMOE: Hypernetwork-based Mixture of Experts for Domain Generalization	Nov 15, 2022	Domain GeneralizationMixture-of-Experts	—Unverified
HOBBIT: A Mixed Precision Expert Offloading System for Fast MoE Inference	Nov 3, 2024	Mixture-of-Experts	—Unverified
Holistic Capability Preservation: Towards Compact Yet Comprehensive Reasoning Models	Apr 9, 2025	Instruction FollowingMathematical Problem-Solving	—Unverified
HoME: Hierarchy of Multi-Gate Experts for Multi-Task Learning at Kuaishou	Aug 10, 2024	Mixture-of-ExpertsMulti-Task Learning	—Unverified
HOMOE: A Memory-Based and Composition-Aware Framework for Zero-Shot Learning with Hopfield Network and Soft Mixture of Experts	Nov 23, 2023	Compositional Zero-Shot LearningMixture-of-Experts	—Unverified
How Can Cross-lingual Knowledge Contribute Better to Fine-Grained Entity Typing?	May 1, 2022	Entity TypingMixture-of-Experts	—Unverified
How Do Consumers Really Choose: Exposing Hidden Preferences with the Mixture of Experts Model	Mar 3, 2025	Decision MakingDemand Forecasting	—Unverified
How does Architecture Influence the Base Capabilities of Pre-trained Language Models? A Case Study Based on FFN-Wider and MoE Transformers	Mar 4, 2024	Few-Shot LearningLanguage Modeling	—Unverified
How Lightweight Can A Vision Transformer Be	Jul 25, 2024	Mixture-of-ExpertsTransfer Learning	—Unverified
How to Upscale Neural Networks with Scaling Law? A Survey and Practical Guidelines	Feb 17, 2025	Mixture-of-Experts	—Unverified
Hunyuan-TurboS: Advancing Large Language Models through Mamba-Transformer Synergy and Adaptive Chain-of-Thought	May 21, 2025	ChatbotInstruction Following	—Unverified
HydraSum - Disentangling Stylistic Features in Text Summarization using Multi-Decoder Models	Sep 29, 2021	Abstractive Text SummarizationDecoder	—Unverified
Hypertext Entity Extraction in Webpage	Mar 4, 2024	Mixture-of-Experts	—Unverified
IDEA: An Inverse Domain Expert Adaptation Based Active DNN IP Protection Method	Sep 29, 2024	Domain AdaptationMixture-of-Experts	—Unverified
Identifying Shopping Intent in Product QA for Proactive Recommendations	Apr 9, 2024	FrictionMixture-of-Experts	—Unverified
iMedImage Technical Report	Mar 27, 2025	Anomaly DetectionDiagnostic	—Unverified
Imitation Learning from MPC for Quadrupedal Multi-Gait Control	Mar 26, 2021	Imitation LearningMixture-of-Experts	—Unverified
Imitation Learning from Observations: An Autoregressive Mixture of Experts Approach	Nov 12, 2024	Autonomous DrivingImitation Learning	—Unverified
Improved Training of Mixture-of-Experts Language GANs	Feb 23, 2023	Adversarial TextImage Generation	—Unverified
Improving Coverage in Combined Prediction Sets with Weighted p-values	May 17, 2025	Conformal PredictionMixture-of-Experts	—Unverified
Regularized Maximum Likelihood Estimation and Feature Selection in Mixtures-of-Experts Models	Oct 29, 2018	Clusteringfeature selection	—Unverified
Reinforcement Learning-based Mixture of Vision Transformers for Video Violence Recognition	Oct 4, 2023	Mixture-of-Expertsreinforcement-learning	—Unverified
REM: A Scalable Reinforced Multi-Expert Framework for Multiplex Influence Maximization	Jan 1, 2025	Mixture-of-Experts	—Unverified
Residual Mixture of Experts	Apr 20, 2022	Mixture-of-Expertsobject-detection	—Unverified
Resilient Sensor Fusion under Adverse Sensor Failures via Multi-Modal Expert Fusion	Mar 25, 2025	Autonomous DrivingMixture-of-Experts	—Unverified
Revisiting Single-gated Mixtures of Experts	Apr 11, 2023	Mixture-of-Experts	—Unverified
Revisiting Uncertainty Estimation and Calibration of Large Language Models	May 29, 2025	Mixture-of-ExpertsMMLU	—Unverified

Show:10 25 50

← PrevPage 17 of 27Next →

No leaderboard results yet.