Laurie
/

flan-t5-xl-deepspeed-zero3-summary

text2text-generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Laurie commited on Apr 16, 2023

Commit

93869fb

·

1 Parent(s): 224efea

Update README.md

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -5,10 +5,10 @@ datasets:
 language:
 - en
-flan_t5_z3_config.json:
 {
-  "fp16": {
     "enabled": "auto",
     "loss_scale": 0,
     "loss_scale_window": 1000,
@@ -17,7 +17,7 @@ flan_t5_z3_config.json:
     "min_loss_scale": 1
   },
-  "optimizer": {
     "type": "AdamW",
     "params": {
       "lr": "auto",
@@ -27,7 +27,7 @@ flan_t5_z3_config.json:
     }
   },
-  "scheduler": {
     "type": "WarmupLR",
     "params": {
       "warmup_min_lr": "auto",
@@ -37,7 +37,7 @@ flan_t5_z3_config.json:
   },
-  "zero_optimization": {
     "stage": 3,
     "overlap_comm": true,
     "contiguous_gradients": true,
@@ -50,7 +50,7 @@ flan_t5_z3_config.json:
     "stage3_gather_16bit_weights_on_model_save": true
   },
-  "gradient_accumulation_steps": "auto",
   "gradient_clipping": "auto",
   "steps_per_print": 2000,
   "train_batch_size": "auto",

 language:
 - en
+**flan_t5_z3_config.json:**
 {
+  **"fp16"**: {
     "enabled": "auto",
     "loss_scale": 0,
     "loss_scale_window": 1000,
     "min_loss_scale": 1
   },
+  **"optimizer":** {
     "type": "AdamW",
     "params": {
       "lr": "auto",
     }
   },
+  **"scheduler":** {
     "type": "WarmupLR",
     "params": {
       "warmup_min_lr": "auto",
   },
+  **"zero_optimization":** {
     "stage": 3,
     "overlap_comm": true,
     "contiguous_gradients": true,
     "stage3_gather_16bit_weights_on_model_save": true
   },
+  **"gradient_accumulation_steps":** "auto",
   "gradient_clipping": "auto",
   "steps_per_print": 2000,
   "train_batch_size": "auto",