jiaxie commited on
Commit
3787c90
·
verified ·
1 Parent(s): b71b620

Update modeling_hyena_moe.py

Browse files
Files changed (1) hide show
  1. modeling_hyena_moe.py +2 -2
modeling_hyena_moe.py CHANGED
@@ -312,9 +312,9 @@ class HyenaMlpMoE(nn.Module):
312
  hidden_size=config.d_model, # gating 维度
313
  expert=expert_instance, # 传一个已经初始化好的专家
314
  num_experts=2, # 比如 2 个专家
315
- ep_size=2,
316
  k=1, # gating 每次只选 1 个专家
317
- capacity_factor=1.5, # 可微调
318
  use_residual=False, # 是否用 MoE residual
319
  # 其他 gating 参数 ...
320
  )
 
312
  hidden_size=config.d_model, # gating 维度
313
  expert=expert_instance, # 传一个已经初始化好的专家
314
  num_experts=2, # 比如 2 个专家
315
+ ep_size=1,
316
  k=1, # gating 每次只选 1 个专家
317
+ capacity_factor=0.25, # 可微调
318
  use_residual=False, # 是否用 MoE residual
319
  # 其他 gating 参数 ...
320
  )