jxm
/

gpt-oss-20b-base

@@ -47,6 +47,15 @@
   "num_local_experts": 32,
   "output_router_logits": false,
   "pad_token_id": 199999,
   "rms_norm_eps": 1e-05,
   "rope_scaling": {
     "beta_fast": 32.0,

   "num_local_experts": 32,
   "output_router_logits": false,
   "pad_token_id": 199999,
+  "quantization_config": {
+    "modules_to_not_convert": [
+      "model.layers.*.self_attn",
+      "model.layers.*.mlp.router",
+      "model.embed_tokens",
+      "lm_head"
+    ],
+    "quant_method": "mxfp4"
+  },
   "rms_norm_eps": 1e-05,
   "rope_scaling": {
     "beta_fast": 32.0,