trollek
/

Holger-7B-v0.1

@@ -13,11 +13,9 @@ library_name: transformers
 base_model:
 - LumiOpen/Viking-7B
 ---
-# Du har fundet Holger!
-> Fordi Husskade var et kedeligt navn.
-For at kunne lave datasæt på dansk er Magpie self-align en nem måde at lave en masse prompts på, og de kan jo gives til hvad end model man nu føler for.
 Det er *forrykt* at danske open source sprogmodeller halter lidt; **æøå** be damned! Og nok også andre ting, men \[A-ZÆØÅa-zæøå\] giver kronisk mentaleksem. **Anyway!**
@@ -27,9 +25,53 @@ HOLGER! En fintunet åben Viking på åbne data under et åbent licens. Respekt
 > Hva' lav' do nu? - Det vil jeg helst ikke snakke om. - Kom nu! - Jeg træner og snakker med sprogmodeller.. - Fra udlandet? - Jaaaa...
-Viking modellen kan åbenbart finde ud af at overføre træning fra engelsk til dansk, og sandsynligvis de andre skandisprog. Jeg er ikke polyglot selvom norsk eller svensk ville være en cheesing måde at opnå det specifikke skill set.
-Faktisk var jeg næsten fornærmet over at et Magnum finetune var klar på at skrive på dansk 85% af tiden - "Hvad i alverden egentlig?" tænkte jeg. Så jeg lavede Danoia-v01 fordi jeg er så pisse sjov. Harhdidarh *slow clap*. Meta var jo brugt allerede før Zhucky af Grækere, så Pan-\<indsæt whatever\> var det næste punkt på listen. Hvad rimer på Pan? Dan! EZ mode, mester!
-4k kontekst kan måske gøres bedre, men LongRoPE osv er lovende, så det er stadig bare min 4. klasse tysklærer der holder mig vågen om natten. Noget der får mig til at sove trygt er at jeg har trænet Holger på input. Husskaden Holger ohøj.

 base_model:
 - LumiOpen/Viking-7B
 ---
+<img src="https://huggingface.co/trollek/Holger-7B-v0.1/resolve/main/holger-viking.png" alt="Android Vikingen Holger">
+# Du har fundet Holger!
 Det er *forrykt* at danske open source sprogmodeller halter lidt; **æøå** be damned! Og nok også andre ting, men \[A-ZÆØÅa-zæøå\] giver kronisk mentaleksem. **Anyway!**
 > Hva' lav' do nu? - Det vil jeg helst ikke snakke om. - Kom nu! - Jeg træner og snakker med sprogmodeller.. - Fra udlandet? - Jaaaa...
+Viking modellen kan åbenbart finde ud af at overføre træning fra engelsk til dansk, og sandsynligvis de andre skandisprog. Maybe.
+## Merge Detaljer
+### Merge Metode
+Denne model er merged med della_linear metoden og med [LumiOpen/Viking-7B](https://huggingface.co/LumiOpen/Viking-7B) som base.
+### Modeller Merged
+Følgende modeller er brugt i dette merge:
+* viking/merges/holger5
+* viking/merges/holger3
+* [mpasila/Viking-Magnum-v0.1-7B](https://huggingface.co/mpasila/Viking-Magnum-v0.1-7B)
+* [mpasila/Viking-SlimSonnet-v1-7B](https://huggingface.co/mpasila/Viking-SlimSonnet-v1-7B)
+### Konfiguration
+Følgende YAML konfigurationsfil blev brugt til at skabe dette merge:
+```yaml
+models:
+  - model: viking/merges/holger3
+    parameters:
+      weight: 0.53
+      density: 0.55
+      epsilon: 0.11
+  - model: viking/merges/holger5
+    parameters:
+      weight: 0.78
+      density: 0.81
+      epsilon: 0.17
+  - model: mpasila/Viking-Magnum-v0.1-7B
+    parameters:
+      weight: 0.88
+      density: 0.91
+      epsilon: 0.07
+  - model: mpasila/Viking-SlimSonnet-v1-7B
+    parameters:
+      weight: 0.83
+      density: 0.75
+      epsilon: 0.11
+merge_method: della_linear
+base_model: LumiOpen/Viking-7B
+parameters:
+  normalize: true
+  int8_mask: true
+  lambda: 1.08
+dtype: bfloat16
+```