Training in progress, epoch 1

Browse files

Files changed (13) hide show

model.safetensors +1 -1
run-0/checkpoint-156/tokenizer.json +2 -16
run-0/checkpoint-156/trainer_state.json +14 -14
run-0/checkpoint-234/tokenizer.json +2 -16
run-0/checkpoint-234/trainer_state.json +19 -19
run-0/checkpoint-78/model.safetensors +1 -1
run-0/checkpoint-78/optimizer.pt +1 -1
run-0/checkpoint-78/scheduler.pt +1 -1
run-0/checkpoint-78/tokenizer.json +2 -16
run-0/checkpoint-78/trainer_state.json +9 -9
run-0/checkpoint-78/training_args.bin +1 -1
tokenizer.json +2 -16
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:479c5555da32c1d8e969fd45c127d3790659216ad9de883e89217d976ec6c841
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:638ab00ccaa37bc4e7a65c38d74ec0becba8f345692e1517641e1b426eb57268
 size 437958648

run-0/checkpoint-156/tokenizer.json CHANGED Viewed

@@ -1,21 +1,7 @@
 {
   "version": "1.0",
-  "truncation": {
-    "direction": "Right",
-    "max_length": 128,
-    "strategy": "LongestFirst",
-    "stride": 0
-  },
-  "padding": {
-    "strategy": {
-      "Fixed": 128
-    },
-    "direction": "Right",
-    "pad_to_multiple_of": null,
-    "pad_id": 0,
-    "pad_type_id": 0,
-    "pad_token": "[PAD]"
-  },
   "added_tokens": [
     {
       "id": 0,

 {
   "version": "1.0",
+  "truncation": null,
+  "padding": null,
   "added_tokens": [
     {
       "id": 0,

run-0/checkpoint-156/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.5992779783393501,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_2/run-0/checkpoint-156",
   "epoch": 2.0,
   "eval_steps": 500,
@@ -10,20 +10,20 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.49458483754512633,
-      "eval_loss": 0.6972618699073792,
-      "eval_runtime": 0.7224,
-      "eval_samples_per_second": 383.457,
-      "eval_steps_per_second": 12.459,
       "step": 78
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.5992779783393501,
-      "eval_loss": 0.6617566347122192,
-      "eval_runtime": 0.6804,
-      "eval_samples_per_second": 407.11,
-      "eval_steps_per_second": 13.227,
       "step": 156
     }
   ],
@@ -48,9 +48,9 @@
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
-    "dropout_rate": 0.3895930982108605,
-    "learning_rate": 2.226029137609832e-05,
-    "max_seq_length": 64,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 32
   }

 {
+  "best_metric": 0.628158844765343,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_2/run-0/checkpoint-156",
   "epoch": 2.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5992779783393501,
+      "eval_loss": 0.6782958507537842,
+      "eval_runtime": 0.723,
+      "eval_samples_per_second": 383.105,
+      "eval_steps_per_second": 12.447,
       "step": 78
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.628158844765343,
+      "eval_loss": 0.6643242835998535,
+      "eval_runtime": 0.6796,
+      "eval_samples_per_second": 407.567,
+      "eval_steps_per_second": 13.242,
       "step": 156
     }
   ],
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
+    "dropout_rate": 0.1377699058361983,
+    "learning_rate": 3.697705960809544e-05,
+    "max_seq_length": 128,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 32
   }

run-0/checkpoint-234/tokenizer.json CHANGED Viewed

@@ -1,21 +1,7 @@
 {
   "version": "1.0",
-  "truncation": {
-    "direction": "Right",
-    "max_length": 128,
-    "strategy": "LongestFirst",
-    "stride": 0
-  },
-  "padding": {
-    "strategy": {
-      "Fixed": 128
-    },
-    "direction": "Right",
-    "pad_to_multiple_of": null,
-    "pad_id": 0,
-    "pad_type_id": 0,
-    "pad_token": "[PAD]"
-  },
   "added_tokens": [
     {
       "id": 0,

 {
   "version": "1.0",
+  "truncation": null,
+  "padding": null,
   "added_tokens": [
     {
       "id": 0,

run-0/checkpoint-234/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.6353790613718412,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_2/run-0/checkpoint-234",
   "epoch": 3.0,
   "eval_steps": 500,
@@ -10,29 +10,29 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.49458483754512633,
-      "eval_loss": 0.6972618699073792,
-      "eval_runtime": 0.7224,
-      "eval_samples_per_second": 383.457,
-      "eval_steps_per_second": 12.459,
       "step": 78
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.5992779783393501,
-      "eval_loss": 0.6617566347122192,
-      "eval_runtime": 0.6804,
-      "eval_samples_per_second": 407.11,
-      "eval_steps_per_second": 13.227,
       "step": 156
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.6353790613718412,
-      "eval_loss": 0.6592725515365601,
-      "eval_runtime": 0.7035,
-      "eval_samples_per_second": 393.721,
-      "eval_steps_per_second": 12.792,
       "step": 234
     }
   ],
@@ -57,9 +57,9 @@
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
-    "dropout_rate": 0.3895930982108605,
-    "learning_rate": 2.226029137609832e-05,
-    "max_seq_length": 64,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 32
   }

 {
+  "best_metric": 0.6570397111913358,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_2/run-0/checkpoint-234",
   "epoch": 3.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5992779783393501,
+      "eval_loss": 0.6782958507537842,
+      "eval_runtime": 0.723,
+      "eval_samples_per_second": 383.105,
+      "eval_steps_per_second": 12.447,
       "step": 78
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.628158844765343,
+      "eval_loss": 0.6643242835998535,
+      "eval_runtime": 0.6796,
+      "eval_samples_per_second": 407.567,
+      "eval_steps_per_second": 13.242,
       "step": 156
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.6570397111913358,
+      "eval_loss": 0.7470307946205139,
+      "eval_runtime": 0.7182,
+      "eval_samples_per_second": 385.702,
+      "eval_steps_per_second": 12.532,
       "step": 234
     }
   ],
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
+    "dropout_rate": 0.1377699058361983,
+    "learning_rate": 3.697705960809544e-05,
+    "max_seq_length": 128,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 32
   }

run-0/checkpoint-78/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:72bc7663d37839bd107e27b1701361affde0edcd5d2b6729671ae6e8fa2a3ec6
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:638ab00ccaa37bc4e7a65c38d74ec0becba8f345692e1517641e1b426eb57268
 size 437958648

run-0/checkpoint-78/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:57fcce385414d9f98b6ee413c8a31fd9ef455fff339cfcb454838aa6c3a03abc
 size 876038394

 version https://git-lfs.github.com/spec/v1
+oid sha256:6f600160c6b46e820ff56ca4c73a3606d9d600c471a5beb1fe1f625eef85ff7f
 size 876038394

run-0/checkpoint-78/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:35f8e660f5e1194d83ae9bce6765699b7108722b0d112ac548d91d85a0bd4d74
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:7d7b0f45906b70b36610ba990d8cc62c6375947fdb497170b4aca0a7218da74f
 size 1064

run-0/checkpoint-78/tokenizer.json CHANGED Viewed

@@ -1,21 +1,7 @@
 {
   "version": "1.0",
-  "truncation": {
-    "direction": "Right",
-    "max_length": 128,
-    "strategy": "LongestFirst",
-    "stride": 0
-  },
-  "padding": {
-    "strategy": {
-      "Fixed": 128
-    },
-    "direction": "Right",
-    "pad_to_multiple_of": null,
-    "pad_id": 0,
-    "pad_type_id": 0,
-    "pad_token": "[PAD]"
-  },
   "added_tokens": [
     {
       "id": 0,

 {
   "version": "1.0",
+  "truncation": null,
+  "padding": null,
   "added_tokens": [
     {
       "id": 0,

run-0/checkpoint-78/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.49458483754512633,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_2/run-0/checkpoint-78",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -10,11 +10,11 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.49458483754512633,
-      "eval_loss": 0.6972618699073792,
-      "eval_runtime": 0.7224,
-      "eval_samples_per_second": 383.457,
-      "eval_steps_per_second": 12.459,
       "step": 78
     }
   ],
@@ -39,9 +39,9 @@
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
-    "dropout_rate": 0.3895930982108605,
-    "learning_rate": 2.226029137609832e-05,
-    "max_seq_length": 64,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 32
   }

 {
+  "best_metric": 0.5992779783393501,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_2/run-0/checkpoint-78",
   "epoch": 1.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5992779783393501,
+      "eval_loss": 0.6782958507537842,
+      "eval_runtime": 0.723,
+      "eval_samples_per_second": 383.105,
+      "eval_steps_per_second": 12.447,
       "step": 78
     }
   ],
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
+    "dropout_rate": 0.1377699058361983,
+    "learning_rate": 3.697705960809544e-05,
+    "max_seq_length": 128,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 32
   }

run-0/checkpoint-78/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ece6cededb9f915c327a15ba1188753c24b9c888cd711a5f4244a16efa7ba29
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:95028e7deee272cbc151f7568f076355b10d7dd155b317c34385edbac9e0a889
 size 5240

tokenizer.json CHANGED Viewed

@@ -1,21 +1,7 @@
 {
   "version": "1.0",
-  "truncation": {
-    "direction": "Right",
-    "max_length": 64,
-    "strategy": "LongestFirst",
-    "stride": 0
-  },
-  "padding": {
-    "strategy": {
-      "Fixed": 64
-    },
-    "direction": "Right",
-    "pad_to_multiple_of": null,
-    "pad_id": 0,
-    "pad_type_id": 0,
-    "pad_token": "[PAD]"
-  },
   "added_tokens": [
     {
       "id": 0,

 {
   "version": "1.0",
+  "truncation": null,
+  "padding": null,
   "added_tokens": [
     {
       "id": 0,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ece6cededb9f915c327a15ba1188753c24b9c888cd711a5f4244a16efa7ba29
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:95028e7deee272cbc151f7568f076355b10d7dd155b317c34385edbac9e0a889
 size 5240