shuheng
/

squad_llama_finetuned

Question Answering

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

shuheng commited on Dec 14, 2024

Commit

8e459bf

·

verified ·

1 Parent(s): 7e4e6e4

Model save

Files changed (1) hide show

README.md +4 -6

README.md CHANGED Viewed

@@ -4,8 +4,6 @@ license: llama3.2
 base_model: meta-llama/Llama-3.2-1B
 tags:
 - generated_from_trainer
-datasets:
-- squad
 model-index:
 - name: squad_llama_finetuned
   results: []
@@ -16,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
 # squad_llama_finetuned
-This model is a fine-tuned version of [meta-llama/Llama-3.2-1B](https://huggingface.co/meta-llama/Llama-3.2-1B) on the squad dataset.
 ## Model description
@@ -35,13 +33,13 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.01
-- train_batch_size: 32
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 2.0
 ### Training results

 base_model: meta-llama/Llama-3.2-1B
 tags:
 - generated_from_trainer
 model-index:
 - name: squad_llama_finetuned
   results: []
 # squad_llama_finetuned
+This model is a fine-tuned version of [meta-llama/Llama-3.2-1B](https://huggingface.co/meta-llama/Llama-3.2-1B) on an unknown dataset.
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 5.0
 ### Training results