Metaphor
Search
搜索
暗色模式
亮色模式
探索
标签: mixture-of-experts
此标签下有11条笔记。
2026年5月13日
路由Mamba:MoE与状态空间模型的融合
ssm
mamba
mixture-of-experts
routing
deep-learning
2026年5月08日
CoSMoE:紧凑稀疏专家混合模型
mixture-of-experts
sparse-moe
on-device-ai
model-efficiency
2026年5月08日
Sigma-MoE-Tiny:极端稀疏专家混合模型
mixture-of-experts
sparse-moe
extreme-sparsity
model-efficiency
2026年5月08日
EMMA高效统一多模态架构
multimodal
unified-model
efficient-architecture
emma
mixture-of-experts
2026年5月07日
MoE专家专门化增强
mixture-of-experts
moe
expert-specialization
training-strategy
2026年5月07日
Symi:高效MoE训练系统
mixture-of-experts
moe
distributed-training
system-optimization
2026年5月03日
LLaDA2.0:100B参数扩散语言模型
diffusion
language-model
llada2
mixture-of-experts
2026年5月03日
稀疏MoE密集反向传播:Default MoE
machine-learning
mixture-of-experts
moe
training-dynamics
2026年5月01日
MoE训练策略(Mixture of Experts Training)
moe
mixture-of-experts
training
load-balancing
llm
2026年4月30日
混合专家模型(Mixture of Experts)
moe
mixture-of-experts
llm
transformer
sparse-activation
2026年4月30日
NAS与MoE的结合
nas
moe
mixture-of-experts
sparse-model