Intel
/

Qwen3-Coder-480B-A35B-Instruct-gguf-q2ks-mixed-AutoRound

Model card Files Files and versions

wenhuach commited on 25 days ago

Commit

0fc06d4

·

verified ·

1 Parent(s): 0c21629

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -233,7 +233,7 @@ import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
 from auto_round import AutoRound
-model_name = "/data2/Qwen3-Coder-480B-A35B-Instruct"
 model = AutoModelForCausalLM.from_pretrained(model_name,
                                              device_map="cpu", torch_dtype="auto")
@@ -246,7 +246,7 @@ for n, m in model.named_modules():
         layer_config[n] = {"bits": 4}
 autoround = AutoRound(model, tokenizer, iters=0, layer_config=layer_config, nsamples=512, dataset="github-code-clean")
-autoround.quantize_and_save("/dataset/Qwen3-Coder-480B-A35B-Instruct-q2ks", format="gguf:q2_k_s")
 ```

 from transformers import AutoModelForCausalLM, AutoTokenizer
 from auto_round import AutoRound
+model_name = "Qwen/Qwen3-Coder-480B-A35B-Instruct"
 model = AutoModelForCausalLM.from_pretrained(model_name,
                                              device_map="cpu", torch_dtype="auto")
         layer_config[n] = {"bits": 4}
 autoround = AutoRound(model, tokenizer, iters=0, layer_config=layer_config, nsamples=512, dataset="github-code-clean")
+autoround.quantize_and_save("./Qwen3-Coder-480B-A35B-Instruct-q2ks", format="gguf:q2_k_s")
 ```