RedHatAI
/

Phi-3-mini-128k-instruct-quantized.w8a16

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

alexmarques commited on Jul 15, 2024

Commit

83fb9f8

·

verified ·

1 Parent(s): 0f846ce

Update README.md

Files changed (1) hide show

README.md +23 -23

README.md CHANGED Viewed

@@ -51,7 +51,7 @@ messages = [
     {"role": "user", "content": "Who are you?"},
 ]
-prompts = tokenizer.apply_chat_template(messages, tokenize=False)
 llm = LLM(model=model_id, trust_remote_code=True, max_model_len=8196)
@@ -170,9 +170,9 @@ lm_eval \
   <tr>
    <td><strong>Benchmark</strong>
    </td>
-   <td><strong>Meta-Llama-3-8B-Instruct </strong>
    </td>
-   <td><strong>Meta-Llama-3-8B-Instruct-quantized.w8a16(this model)</strong>
    </td>
    <td><strong>Recovery</strong>
    </td>
@@ -180,39 +180,39 @@ lm_eval \
   <tr>
    <td>MMLU (5-shot)
    </td>
-   <td>66.54
    </td>
-   <td>66.55
    </td>
-   <td>100.0%
    </td>
   </tr>
   <tr>
    <td>ARC Challenge (25-shot)
    </td>
-   <td>62.63
    </td>
-   <td>61.52
    </td>
-   <td>98.2%
    </td>
   </tr>
   <tr>
    <td>GSM-8K (5-shot, strict-match)
    </td>
-   <td>75.21
    </td>
-   <td>75.89
    </td>
-   <td>100.9%
    </td>
   </tr>
   <tr>
    <td>Hellaswag (10-shot)
    </td>
-   <td>78.81
    </td>
-   <td>78.69
    </td>
    <td>99.8%
    </td>
@@ -220,31 +220,31 @@ lm_eval \
   <tr>
    <td>Winogrande (5-shot)
    </td>
-   <td>76.48
    </td>
-   <td>76.01
    </td>
-   <td>98.2%
    </td>
   </tr>
   <tr>
    <td>TruthfulQA (0-shot)
    </td>
-   <td>52.49
    </td>
-   <td>52.60
    </td>
-   <td>100.2%
    </td>
   </tr>
   <tr>
    <td><strong>Average</strong>
    </td>
-   <td><strong>68.69</strong>
    </td>
-   <td><strong>68.54</strong>
    </td>
-   <td><strong>99.8%</strong>
    </td>
   </tr>
 </table>

     {"role": "user", "content": "Who are you?"},
 ]
+prompts = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
 llm = LLM(model=model_id, trust_remote_code=True, max_model_len=8196)
   <tr>
    <td><strong>Benchmark</strong>
    </td>
+   <td><strong>Phi-3-mini-128k-instruct </strong>
    </td>
+   <td><strong>Phi-3-mini-128k-instruct-quantized.w8a16(this model)</strong>
    </td>
    <td><strong>Recovery</strong>
    </td>
   <tr>
    <td>MMLU (5-shot)
    </td>
+   <td>69.44
    </td>
+   <td>69.39
    </td>
+   <td>99.9%
    </td>
   </tr>
   <tr>
    <td>ARC Challenge (25-shot)
    </td>
+   <td>63.23
    </td>
+   <td>63.14
    </td>
+   <td>99.9%
    </td>
   </tr>
   <tr>
    <td>GSM-8K (5-shot, strict-match)
    </td>
+   <td>77.03
    </td>
+   <td>75.44
    </td>
+   <td>97.9%
    </td>
   </tr>
   <tr>
    <td>Hellaswag (10-shot)
    </td>
+   <td>79.65
    </td>
+   <td>79.51
    </td>
    <td>99.8%
    </td>
   <tr>
    <td>Winogrande (5-shot)
    </td>
+   <td>74.66
    </td>
+   <td>74.82
    </td>
+   <td>100.2%
    </td>
   </tr>
   <tr>
    <td>TruthfulQA (0-shot)
    </td>
+   <td>54.31
    </td>
+   <td>54.36
    </td>
+   <td>100.1%
    </td>
   </tr>
   <tr>
    <td><strong>Average</strong>
    </td>
+   <td><strong>69.72</strong>
    </td>
+   <td><strong>69.44</strong>
    </td>
+   <td><strong>99.6%</strong>
    </td>
   </tr>
 </table>