Mixture-of-Experts

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 976–1000 of 1312 papers

Title	Date	Tasks	Status	Hype
MixPHM: Redundancy-Aware Parameter-Efficient Tuning for Low-Resource Visual Question Answering	Mar 2, 2023	Mixture-of-ExpertsQuestion Answering	CodeCode Available	1
Improving Expert Specialization in Mixture of Experts	Feb 28, 2023	Continual LearningMixture-of-Experts	—Unverified	0
Improved Training of Mixture-of-Experts Language GANs	Feb 23, 2023	Adversarial TextImage Generation	—Unverified	0
TMoE-P: Towards the Pareto Optimum for Multivariate Soft Sensors	Feb 21, 2023	Mixture-of-Experts	—Unverified	0
Massively Multilingual Shallow Fusion with Large Language Models	Feb 17, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Fast, Differentiable and Sparse Top-k: a Convex Analysis Perspective	Feb 2, 2023	GPUMixture-of-Experts	—Unverified	0
Alternating Updates for Efficient Transformers	Jan 30, 2023	Mixture-of-Experts	—Unverified	0
PRUDEX-Compass: Towards Systematic Evaluation of Reinforcement Learning in Financial Markets	Jan 14, 2023	ManagementMixture-of-Experts	—Unverified	0
AdaEnsemble: Learning Adaptively Sparse Structured Ensemble Network for Click-Through Rate Prediction	Jan 6, 2023	Click-Through Rate PredictionMixture-of-Experts	—Unverified	0
Covariate-guided Bayesian mixture model for multivariate time series	Jan 3, 2023	Mixture-of-ExpertsTime Series	CodeCode Available	0
Semantic-Aware Dynamic Parameter for Video Inpainting Transformer	Jan 1, 2023	Mixture-of-ExpertsVideo Inpainting	—Unverified	0
AdaMV-MoE: Adaptive Multi-Task Vision Mixture-of-Experts	Jan 1, 2023	Instance SegmentationMixture-of-Experts	—Unverified	0
Mod-Squad: Designing Mixtures of Experts As Modular Multi-Task Learners	Jan 1, 2023	Mixture-of-ExpertsMulti-Task Learning	—Unverified	0
MultiCoder: Multi-Programming-Lingual Pre-Training for Low-Resource Code Completion	Dec 19, 2022	Code CompletionMixture-of-Experts	—Unverified	0
Generalizing Multimodal Variational Methods to Sets	Dec 19, 2022	Mixture-of-Experts	—Unverified	0
Memory-efficient NLLB-200: Language-specific Expert Pruning of a Massively Multilingual Machine Translation Model	Dec 19, 2022	GPUMachine Translation	—Unverified	0
Fixing MoE Over-Fitting on Low-Resource Languages in Multilingual Machine Translation	Dec 15, 2022	Machine TranslationMixture-of-Experts	—Unverified	0
Mod-Squad: Designing Mixture of Experts As Modular Multi-Task Learners	Dec 15, 2022	Mixture-of-ExpertsMulti-Task Learning	—Unverified	0
SMILE: Scaling Mixture-of-Experts with Efficient Bi-level Routing	Dec 10, 2022	Mixture-of-Experts	—Unverified	0
Sparse Upcycling: Training Mixture-of-Experts from Dense Checkpoints	Dec 9, 2022	Mixture-of-Experts	CodeCode Available	2
Incorporating Polar Field Data for Improved Solar Flare Prediction	Dec 4, 2022	Mixture-of-ExpertsPrediction	—Unverified	0
Named Entity and Relation Extraction with Multi-Modal Retrieval	Dec 3, 2022	Mixture-of-ExpertsMulti-modal Named Entity Recognition	—Unverified	0
MegaBlocks: Efficient Sparse Training with Mixture-of-Experts	Nov 29, 2022	GPUMixture-of-Experts	CodeCode Available	3
Automatically Extracting Information in Medical Dialogue: Expert System And Attention for Labelling	Nov 28, 2022	Mixture-of-Experts	—Unverified	0
Mixture of Decision Trees for Interpretable Machine Learning	Nov 26, 2022	Interpretable Machine LearningMixture-of-Experts	CodeCode Available	1

Show:10 25 50

← PrevPage 40 of 53Next →

No leaderboard results yet.