Mixture-of-Experts

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–575 of 1312 papers

Title	Date	Tasks	Status	Hype
LPT++: Efficient Training on Mixture of Long-tailed Experts	Sep 17, 2024	Mixture-of-Expertsparameter-efficient fine-tuning	—Unverified	0
LOLA -- An Open-Source Massively Multilingual Large Language Model	Sep 17, 2024	DiversityLanguage Modeling	CodeCode Available	1
Adaptive Segmentation-Based Initialization for Steered Mixture of Experts Image Regression	Sep 16, 2024	DenoisingMixture-of-Experts	—Unverified	0
Integrating AI's Carbon Footprint into Risk Management Frameworks: Strategies and Tools for Sustainable Compliance in Banking Sector	Sep 15, 2024	Cloud ComputingManagement	—Unverified	0
MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving	Sep 11, 2024	Autonomous DrivingFeature Engineering	CodeCode Available	2
STUN: Structured-Then-Unstructured Pruning for Scalable MoE Pruning	Sep 10, 2024	GSM8KMixture-of-Experts	—Unverified	0
DA-MoE: Towards Dynamic Expert Allocation for Mixture-of-Experts Models	Sep 10, 2024	Mixture-of-Experts	—Unverified	0
VE: Modeling Multivariate Time Series Correlation with Variate Embedding	Sep 10, 2024	Mixture-of-ExpertsMultivariate Time Series Forecasting	CodeCode Available	0
M3-Jepa: Multimodal Alignment via Multi-directional MoE based on the JEPA framework	Sep 9, 2024	Computational EfficiencyCross-Modal Retrieval	CodeCode Available	1
Adapted-MoE: Mixture of Experts with Test-Time Adaption for Anomaly Detection	Sep 9, 2024	Anomaly DetectionMixture-of-Experts	—Unverified	0
Interpretable mixture of experts for time series prediction under recurrent and non-recurrent conditions	Sep 5, 2024	Mixture-of-ExpertsTime Series	—Unverified	0
Pluralistic Salient Object Detection	Sep 4, 2024	Mixture-of-ExpertsObject	—Unverified	0
Configurable Foundation Models: Building LLMs from a Modular Perspective	Sep 4, 2024	Computational EfficiencyMixture-of-Experts	—Unverified	0
Enhancing Code-Switching Speech Recognition with LID-Based Collaborative Mixture of Experts Model	Sep 3, 2024	Language IdentificationMixture-of-Experts	—Unverified	0
OLMoE: Open Mixture-of-Experts Language Models	Sep 3, 2024	Language ModelingLanguage Modelling	CodeCode Available	4
Duplex: A Device for Large Language Models with Mixture of Experts, Grouped Query Attention, and Continuous Batching	Sep 2, 2024	Mixture-of-Experts	—Unverified	0
Beyond Parameter Count: Implicit Bias in Soft Mixture of Experts	Sep 2, 2024	Mixture-of-Experts	—Unverified	0
Gradient-free variational learning with conditional mixture networks	Aug 29, 2024	Computational EfficiencyMixture-of-Experts	CodeCode Available	1
Auxiliary-Loss-Free Load Balancing Strategy for Mixture-of-Experts	Aug 28, 2024	Mixture-of-Experts	—Unverified	0
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation	Aug 28, 2024	Computational EfficiencyHallucination	CodeCode Available	3
Nexus: Specialization meets Adaptability for Efficiently Training Mixture of Experts	Aug 28, 2024	Mixture-of-Experts	—Unverified	0
Parameter-Efficient Quantized Mixture-of-Experts Meets Vision-Language Instruction Tuning for Semiconductor Electron Micrograph Analysis	Aug 27, 2024	Instruction FollowingLanguage Modeling	—Unverified	0
Advancing Enterprise Spatio-Temporal Forecasting Applications: Data Mining Meets Instruction Tuning of Language Models For Multi-modal Time Series Analysis in Low-Resource Settings	Aug 24, 2024	Decision MakingMixture-of-Experts	—Unverified	0
The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities	Aug 23, 2024	Computational EfficiencyInference Optimization	—Unverified	0
La-SoftMoE CLIP for Unified Physical-Digital Face Attack Detection	Aug 23, 2024	Mixture-of-Experts	—Unverified	0

Show:10 25 50

← PrevPage 23 of 53Next →

No leaderboard results yet.