bunyaminergen
/

Qwen2.5-Coder-1.5B-Instruct-Reasoning

@@ -137,44 +137,42 @@ print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 | bnb_4bit_quant_type       | `nf4`                              |
 | bnb_4bit_use_double_quant | `true`                             |
-Aşağıda her başlık için ayrı birer tablo oluşturdum:
 #### Dataset
-| Parameter            | Value                          |
-|----------------------|--------------------------------|
-| Dataset Name         | `nvidia/OpenCodeReasoning`     |
-| Split                | `split_0`                      |
-| Number of Rows       | `8000`                         |
-| Max Token Length     | `8192`                         |
-| Shuffle              | `True`                         |
-| Number of Processes  | `4`                            |
 #### Tokenizer
-| Parameter                      | Value                         |
-|--------------------------------|-------------------------------|
-| Truncation                     | Enabled (`max_length=8192`)   |
-| Masked Language Modeling (MLM) | `False`                       |
 #### Speeds, Sizes, Times
-| Parameter               | Value                                                       |
-|-------------------------|-------------------------------------------------------------|
-| Total Training Time     | ~3.5 hours                                                  |
-| Checkpoint Frequency    | every `10000` steps                                         |
-| Checkpoint Steps        | `checkpoint-10000`, `checkpoint-20000`, `checkpoint-24000`  |
 #### Compute Infrastructure
-| Parameter    | Value                                |
-|--------------|--------------------------------------|
-| GPU          | 1 × NVIDIA H100 SXM (80 GB VRAM)     |
-| RAM          | 125 GB                               |
-| CPU          | 16 vCPU                              |
-| OS           | Ubuntu 22.04                         |
-| Frameworks   | PyTorch 2.4.0                        |
-| CUDA Version | 12.4.1                               |
 ---

 | bnb_4bit_quant_type       | `nf4`                              |
 | bnb_4bit_use_double_quant | `true`                             |
 #### Dataset
+| Parameter           | Value                      |
+|---------------------|----------------------------|
+| Dataset Name        | `nvidia/OpenCodeReasoning` |
+| Split               | `split_0`                  |
+| Number of Rows      | `8000`                     |
+| Max Token Length    | `8192`                     |
+| Shuffle             | `True`                     |
+| Number of Processes | `4`                        |
 #### Tokenizer
+| Parameter                      | Value                       |
+|--------------------------------|-----------------------------|
+| Truncation                     | Enabled (`max_length=8192`) |
+| Masked Language Modeling (MLM) | `False`                     |
 #### Speeds, Sizes, Times
+| Parameter            | Value                                                      |
+|----------------------|------------------------------------------------------------|
+| Total Training Time  | ~3.5 hours                                                 |
+| Checkpoint Frequency | every `10000` steps                                        |
+| Checkpoint Steps     | `checkpoint-10000`, `checkpoint-20000`, `checkpoint-24000` |
 #### Compute Infrastructure
+| Parameter    | Value                            |
+|--------------|----------------------------------|
+| GPU          | 1 × NVIDIA H100 SXM (80 GB VRAM) |
+| RAM          | 125 GB                           |
+| CPU          | 16 vCPU                          |
+| OS           | Ubuntu 22.04                     |
+| Frameworks   | PyTorch 2.4.0                    |
+| CUDA Version | 12.4.1                           |
 ---