RedHatAI
/

Phi-3-mini-128k-instruct-quantized.w8a16

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

alexmarques commited on Aug 15, 2024

Commit

3c053d6

·

verified ·

1 Parent(s): f03a2b9

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -123,7 +123,7 @@ model_id = "microsoft/Phi-3-mini-128k-instruct"
 num_samples = 256
 max_seq_len = 8192
-tokenizer = AutoTokenizer.from_pretrained(model_id)
 max_token_id = len(tokenizer.get_vocab()) - 1
 input_ids = [[random.randint(0, max_token_id) for _ in range(max_seq_len)] for _ in range(num_samples)]
@@ -149,6 +149,7 @@ oneshot(
   recipe=recipe,
   max_seq_length=max_seq_len,
   num_calibration_samples=num_samples,
 )
 model.save_pretrained("Phi-3-mini-128k-instruct-quantized.w8a16")

 num_samples = 256
 max_seq_len = 8192
+tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
 max_token_id = len(tokenizer.get_vocab()) - 1
 input_ids = [[random.randint(0, max_token_id) for _ in range(max_seq_len)] for _ in range(num_samples)]
   recipe=recipe,
   max_seq_length=max_seq_len,
   num_calibration_samples=num_samples,
+  tokenizer=tokenizer,
 )
 model.save_pretrained("Phi-3-mini-128k-instruct-quantized.w8a16")