Mixture-of-Experts

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1312 papers

Title	Date	Tasks	Status
Upcycling Instruction Tuning from Dense to Mixture-of-Experts via Parameter Merging	Oct 2, 2024	DiversityMixture-of-Experts	—Unverified
EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing	Oct 2, 2024	Image GenerationMixture-of-Experts	—Unverified
UniAdapt: A Universal Adapter for Knowledge Calibration	Oct 1, 2024	Mixture-of-ExpertsModel Editing	—Unverified
MoS: Unleashing Parameter Efficiency of Low-Rank Adaptation with Mixture of Shards	Oct 1, 2024	GPUMixture-of-Experts	—Unverified
Robust Traffic Forecasting against Spatial Shift over Years	Oct 1, 2024	AttributeMixture-of-Experts	CodeCode Available
MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning	Sep 30, 2024	Mixture-of-ExpertsOptical Character Recognition (OCR)	—Unverified
IDEA: An Inverse Domain Expert Adaptation Based Active DNN IP Protection Method	Sep 29, 2024	Domain AdaptationMixture-of-Experts	—Unverified
SciDFM: A Large Language Model with Mixture-of-Experts for Science	Sep 27, 2024	Language ModelingLanguage Modelling	—Unverified
Toward Mixture-of-Experts Enabled Trustworthy Semantic Communication for 6G Networks	Sep 24, 2024	Mixture-of-ExpertsSemantic Communication	—Unverified
Boosting Code-Switching ASR with Mixture of Experts Enhanced Speech-Conditioned LLM	Sep 24, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Leveraging Mixture of Experts for Improved Speech Deepfake Detection	Sep 24, 2024	DeepFake DetectionFace Swapping	—Unverified
Multi-Modal Generative AI: Multi-modal LLM, Diffusion and Beyond	Sep 23, 2024	Language ModellingLarge Language Model	—Unverified
A Gated Residual Kolmogorov-Arnold Networks for Mixtures of Experts	Sep 23, 2024	Kolmogorov-Arnold NetworksMixture-of-Experts	CodeCode Available
Routing in Sparsely-gated Language Models responds to Context	Sep 21, 2024	DecoderMixture-of-Experts	—Unverified
Multi-omics data integration for early diagnosis of hepatocellular carcinoma (HCC) using machine learning	Sep 20, 2024	Data IntegrationMixture-of-Experts	—Unverified
On-Device Collaborative Language Modeling via a Mixture of Generalists and Specialists	Sep 20, 2024	Federated LearningLanguage Modeling	CodeCode Available
Robust Audiovisual Speech Recognition Models with Mixture-of-Experts	Sep 19, 2024	Mixture-of-ExpertsRobust Speech Recognition	—Unverified
Mixture of Diverse Size Experts	Sep 18, 2024	Mixture-of-Experts	—Unverified
GRIN: GRadient-INformed MoE	Sep 18, 2024	HellaSwagHumanEval	—Unverified
LPT++: Efficient Training on Mixture of Long-tailed Experts	Sep 17, 2024	Mixture-of-Expertsparameter-efficient fine-tuning	—Unverified
Adaptive Segmentation-Based Initialization for Steered Mixture of Experts Image Regression	Sep 16, 2024	DenoisingMixture-of-Experts	—Unverified
Integrating AI's Carbon Footprint into Risk Management Frameworks: Strategies and Tools for Sustainable Compliance in Banking Sector	Sep 15, 2024	Cloud ComputingManagement	—Unverified
STUN: Structured-Then-Unstructured Pruning for Scalable MoE Pruning	Sep 10, 2024	GSM8KMixture-of-Experts	—Unverified
VE: Modeling Multivariate Time Series Correlation with Variate Embedding	Sep 10, 2024	Mixture-of-ExpertsMultivariate Time Series Forecasting	CodeCode Available
DA-MoE: Towards Dynamic Expert Allocation for Mixture-of-Experts Models	Sep 10, 2024	Mixture-of-Experts	—Unverified
Adapted-MoE: Mixture of Experts with Test-Time Adaption for Anomaly Detection	Sep 9, 2024	Anomaly DetectionMixture-of-Experts	—Unverified
Interpretable mixture of experts for time series prediction under recurrent and non-recurrent conditions	Sep 5, 2024	Mixture-of-ExpertsTime Series	—Unverified
Pluralistic Salient Object Detection	Sep 4, 2024	Mixture-of-ExpertsObject	—Unverified
Configurable Foundation Models: Building LLMs from a Modular Perspective	Sep 4, 2024	Computational EfficiencyMixture-of-Experts	—Unverified
Enhancing Code-Switching Speech Recognition with LID-Based Collaborative Mixture of Experts Model	Sep 3, 2024	Language IdentificationMixture-of-Experts	—Unverified
Duplex: A Device for Large Language Models with Mixture of Experts, Grouped Query Attention, and Continuous Batching	Sep 2, 2024	Mixture-of-Experts	—Unverified
Beyond Parameter Count: Implicit Bias in Soft Mixture of Experts	Sep 2, 2024	Mixture-of-Experts	—Unverified
Nexus: Specialization meets Adaptability for Efficiently Training Mixture of Experts	Aug 28, 2024	Mixture-of-Experts	—Unverified
Auxiliary-Loss-Free Load Balancing Strategy for Mixture-of-Experts	Aug 28, 2024	Mixture-of-Experts	—Unverified
Parameter-Efficient Quantized Mixture-of-Experts Meets Vision-Language Instruction Tuning for Semiconductor Electron Micrograph Analysis	Aug 27, 2024	Instruction FollowingLanguage Modeling	—Unverified
Advancing Enterprise Spatio-Temporal Forecasting Applications: Data Mining Meets Instruction Tuning of Language Models For Multi-modal Time Series Analysis in Low-Resource Settings	Aug 24, 2024	Decision MakingMixture-of-Experts	—Unverified
La-SoftMoE CLIP for Unified Physical-Digital Face Attack Detection	Aug 23, 2024	Mixture-of-Experts	—Unverified
DutyTTE: Deciphering Uncertainty in Origin-Destination Travel Time Estimation	Aug 23, 2024	Deep Reinforcement LearningMixture-of-Experts	CodeCode Available
The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities	Aug 23, 2024	Computational EfficiencyInference Optimization	—Unverified
Multi-Treatment Multi-Task Uplift Modeling for Enhancing User Growth	Aug 23, 2024	Causal InferenceMixture-of-Experts	—Unverified
SQL-GEN: Bridging the Dialect Gap for Text-to-SQL Via Synthetic Data And Model Merging	Aug 22, 2024	DiversityMixture-of-Experts	—Unverified
Improving Factuality in Large Language Models via Decoding-Time Hallucinatory and Truthful Comparators	Aug 22, 2024	HallucinationMixture-of-Experts	CodeCode Available
MoE-LPR: Multilingual Extension of Large Language Models through Mixture-of-Experts with Language Priors Routing	Aug 21, 2024	Mixture-of-Experts	CodeCode Available
FedMoE: Personalized Federated Learning via Heterogeneous Mixture of Experts	Aug 21, 2024	Federated LearningHeuristic Search	—Unverified
HMoE: Heterogeneous Mixture of Experts for Language Modeling	Aug 20, 2024	Computational EfficiencyLanguage Modeling	—Unverified
A Unified Framework for Iris Anti-Spoofing: Introducing IrisGeneral Dataset and Masked-MoE Method	Aug 19, 2024	Iris RecognitionMixture-of-Experts	—Unverified
FEDKIM: Adaptive Federated Knowledge Injection into Medical Foundation Models	Aug 17, 2024	Federated LearningMixture-of-Experts	CodeCode Available
Integrating Multi-view Analysis: Multi-view Mixture-of-Expert for Textual Personality Detection	Aug 16, 2024	Mixture-of-Experts	CodeCode Available
FactorLLM: Factorizing Knowledge via Mixture of Experts for Large Language Models	Aug 15, 2024	Mixture-of-Experts	CodeCode Available
BAM! Just Like That: Simple and Efficient Parameter Upcycling for Mixture of Experts	Aug 15, 2024	Mixture-of-Experts	—Unverified

Show:10 25 50

← PrevPage 16 of 27Next →

No leaderboard results yet.