sravanthib
/

model

Generated from Trainer

Model card Files Files and versions Community

sravanthib commited on Jul 3

Commit

4817dd8

·

verified ·

1 Parent(s): 2301a44

Training completed

Files changed (3) hide show

all_results.json +4 -4
train_results.json +4 -4
trainer_state.json +10 -10

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.0547945205479452,
     "total_flos": 1.6697353660111258e+17,
-    "train_loss": 2.0425025622049966,
-    "train_runtime": 461.7117,
-    "train_samples_per_second": 10.396,
-    "train_steps_per_second": 0.065
 }

 {
     "epoch": 0.0547945205479452,
     "total_flos": 1.6697353660111258e+17,
+    "train_loss": 2.0328386863072714,
+    "train_runtime": 442.7248,
+    "train_samples_per_second": 10.842,
+    "train_steps_per_second": 0.068
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.0547945205479452,
     "total_flos": 1.6697353660111258e+17,
-    "train_loss": 2.0425025622049966,
-    "train_runtime": 461.7117,
-    "train_samples_per_second": 10.396,
-    "train_steps_per_second": 0.065
 }

 {
     "epoch": 0.0547945205479452,
     "total_flos": 1.6697353660111258e+17,
+    "train_loss": 2.0328386863072714,
+    "train_runtime": 442.7248,
+    "train_samples_per_second": 10.842,
+    "train_steps_per_second": 0.068
 }

trainer_state.json CHANGED Viewed

@@ -10,33 +10,33 @@
   "log_history": [
     {
       "epoch": 0.0182648401826484,
-      "grad_norm": 1.4506075382232666,
       "learning_rate": 0.0001,
-      "loss": 4.6632,
       "step": 10
     },
     {
       "epoch": 0.0365296803652968,
-      "grad_norm": 4.050724983215332,
       "learning_rate": 0.0001,
-      "loss": 1.0722,
       "step": 20
     },
     {
       "epoch": 0.0547945205479452,
-      "grad_norm": 0.32392966747283936,
       "learning_rate": 0.0001,
-      "loss": 0.3922,
       "step": 30
     },
     {
       "epoch": 0.0547945205479452,
       "step": 30,
       "total_flos": 1.6697353660111258e+17,
-      "train_loss": 2.0425025622049966,
-      "train_runtime": 461.7117,
-      "train_samples_per_second": 10.396,
-      "train_steps_per_second": 0.065
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.0182648401826484,
+      "grad_norm": 1.46377694606781,
       "learning_rate": 0.0001,
+      "loss": 4.6773,
       "step": 10
     },
     {
       "epoch": 0.0365296803652968,
+      "grad_norm": 4.111562728881836,
       "learning_rate": 0.0001,
+      "loss": 1.0524,
       "step": 20
     },
     {
       "epoch": 0.0547945205479452,
+      "grad_norm": 0.28213319182395935,
       "learning_rate": 0.0001,
+      "loss": 0.3689,
       "step": 30
     },
     {
       "epoch": 0.0547945205479452,
       "step": 30,
       "total_flos": 1.6697353660111258e+17,
+      "train_loss": 2.0328386863072714,
+      "train_runtime": 442.7248,
+      "train_samples_per_second": 10.842,
+      "train_steps_per_second": 0.068
     }
   ],
   "logging_steps": 10,