Update modeling_hyena_moe.py
Browse files- modeling_hyena_moe.py +2 -2
modeling_hyena_moe.py
CHANGED
@@ -312,9 +312,9 @@ class HyenaMlpMoE(nn.Module):
|
|
312 |
hidden_size=config.d_model, # gating 维度
|
313 |
expert=expert_instance, # 传一个已经初始化好的专家
|
314 |
num_experts=2, # 比如 2 个专家
|
315 |
-
ep_size=
|
316 |
k=1, # gating 每次只选 1 个专家
|
317 |
-
capacity_factor=
|
318 |
use_residual=False, # 是否用 MoE residual
|
319 |
# 其他 gating 参数 ...
|
320 |
)
|
|
|
312 |
hidden_size=config.d_model, # gating 维度
|
313 |
expert=expert_instance, # 传一个已经初始化好的专家
|
314 |
num_experts=2, # 比如 2 个专家
|
315 |
+
ep_size=1,
|
316 |
k=1, # gating 每次只选 1 个专家
|
317 |
+
capacity_factor=0.25, # 可微调
|
318 |
use_residual=False, # 是否用 MoE residual
|
319 |
# 其他 gating 参数 ...
|
320 |
)
|