End of training

Browse files

Files changed (5) hide show

README.md +16 -16
adapter_model.safetensors +1 -1
logs/events.out.tfevents.1737226660.ip-172-16-50-136.eu-central-1.compute.internal.27480.0 +3 -0
logs/events.out.tfevents.1737226716.ip-172-16-50-136.eu-central-1.compute.internal.27480.1 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -20,11 +20,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google-t5/t5-small](https://huggingface.co/google-t5/t5-small) on the mlsum dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.1631
-- Rouge1: 16.7594
-- Rouge2: 10.8102
-- Rougel: 16.0871
-- Rougelsum: 16.2127
 - Gen Len: 20.0
 ## Model description
@@ -44,7 +44,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
@@ -56,16 +56,16 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
-| 2.4827        | 1.0   | 624  | 2.3375          | 16.1744 | 10.1154 | 15.3814 | 15.5714   | 19.9957 |
-| 2.314         | 2.0   | 1248 | 2.2650          | 16.4683 | 10.5351 | 15.7213 | 15.9071   | 19.9974 |
-| 2.2729        | 3.0   | 1872 | 2.2134          | 16.6319 | 10.7054 | 15.9154 | 16.0568   | 19.9974 |
-| 2.2537        | 4.0   | 2496 | 2.2004          | 16.6967 | 10.7592 | 15.9769 | 16.1279   | 20.0    |
-| 2.2284        | 5.0   | 3120 | 2.1898          | 16.7629 | 10.7938 | 16.0607 | 16.1928   | 20.0    |
-| 2.2205        | 6.0   | 3744 | 2.1756          | 16.7855 | 10.8011 | 16.0694 | 16.203    | 20.0    |
-| 2.2112        | 7.0   | 4368 | 2.1714          | 16.7781 | 10.792  | 16.082  | 16.2114   | 20.0    |
-| 2.2088        | 8.0   | 4992 | 2.1591          | 16.7985 | 10.8063 | 16.1082 | 16.2317   | 20.0    |
-| 2.2036        | 9.0   | 5616 | 2.1635          | 16.7636 | 10.822  | 16.0915 | 16.2187   | 20.0    |
-| 2.2023        | 10.0  | 6240 | 2.1631          | 16.7594 | 10.8102 | 16.0871 | 16.2127   | 20.0    |
 ### Framework versions

 This model is a fine-tuned version of [google-t5/t5-small](https://huggingface.co/google-t5/t5-small) on the mlsum dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.0317
+- Rouge1: 19.4302
+- Rouge2: 13.1054
+- Rougel: 18.7905
+- Rougelsum: 18.8397
 - Gen Len: 20.0
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3e-05
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
+| 2.557         | 1.0   | 624  | 2.1852          | 18.4642 | 11.9852 | 17.839  | 18.0458   | 20.0    |
+| 2.364         | 2.0   | 1248 | 2.1269          | 19.6197 | 13.135  | 18.9274 | 19.0553   | 19.9913 |
+| 2.3235        | 3.0   | 1872 | 2.0928          | 19.5088 | 13.2191 | 18.8665 | 18.9558   | 20.0    |
+| 2.3002        | 4.0   | 2496 | 2.0669          | 19.2649 | 12.9427 | 18.6374 | 18.6937   | 20.0    |
+| 2.2803        | 5.0   | 3120 | 2.0542          | 19.427  | 13.1022 | 18.7882 | 18.8376   | 20.0    |
+| 2.2731        | 6.0   | 3744 | 2.0412          | 19.4496 | 13.1266 | 18.8102 | 18.8668   | 20.0    |
+| 2.2655        | 7.0   | 4368 | 2.0338          | 19.4302 | 13.1054 | 18.7905 | 18.8397   | 20.0    |
+| 2.2611        | 8.0   | 4992 | 2.0323          | 19.4302 | 13.1054 | 18.7905 | 18.8397   | 20.0    |
+| 2.2584        | 9.0   | 5616 | 2.0321          | 19.4302 | 13.1054 | 18.7905 | 18.8397   | 20.0    |
+| 2.2533        | 10.0  | 6240 | 2.0317          | 19.4302 | 13.1054 | 18.7905 | 18.8397   | 20.0    |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0b6f9a1ab6b50be4db4b71e16be9af59c20095f5fce7d087f06607f2a3f3aae5
 size 1189536

 version https://git-lfs.github.com/spec/v1
+oid sha256:e291f99ab6e6061b22aa14e482eb79b2b44cabd9caf2c0feeaef3e561d9f9a6d
 size 1189536

logs/events.out.tfevents.1737226660.ip-172-16-50-136.eu-central-1.compute.internal.27480.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f85f203fa2b43b4115b17089c4b562c70f876188e09cf25e16d970066777925d
+size 6095

logs/events.out.tfevents.1737226716.ip-172-16-50-136.eu-central-1.compute.internal.27480.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9d7042361704033b95f083e5c87c579e3baadc823b85f6f97e88797a3a66298d
+size 13809

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d3fba2dfa20c2d09bcf5990e7565003c8e19f0dcd21591219a254553d1440e9
 size 5560

 version https://git-lfs.github.com/spec/v1
+oid sha256:318aa01a10d8f2ae1a107e85b3c02ddf3b07e109a81975f8df1b5361ab5669ae
 size 5560