language: - 'no' - en
Pretrained reasoning model
Trained with these parameters:
python MaxText/train.py MaxText/configs/base.yml
load_parameters_path='gs://nb_llama3_x/nb-llama-3.2-3B-Instruct/checkpoints/180/items'
steps=161
checkpoint_period=80
run_name='llama32_reasoning_chat_norwegian'
model_name='llama3.2-3b'
max_target_length=8192
async_checkpointing=false
base_output_directory='gs://maxlog-eu'
dataset_type='hf'
hf_path='json'
hf_train_files='gs://levanter-dataset-eu/wiki_reasoning_chat_norwegian/train10*.jsonl'
tokenizer_path=../Llama-3.2-1B/
per_device_batch_size=1
attention='flash'
learning_rate=9e-5
warmup_steps_fraction=0.01
remat_policy=full
hf_eval_split=''
hf_eval_files='gs://levanter-dataset-eu/wiki_reasoning_chat_norwegian/validation*.jsonl'
eval_steps=10
Trained on data from: https://huggingface.co/datasets/pere/reasoning_chat_norwegian
Example prompt:
<|begin_of_text|> <|start_header_id|>user<|end_header_id|>
<|begin_of_text|>
<|start_header_id|>user<|end_header_id|>
Du er en anerkjent ekspert på norsk rettskrivning med inngående kunnskap om korrekt tegnsetting og bruk av store og små bokstaver.
Din oppgave er å gjennomgå følgende tekst og rette eventuelle feil knyttet til tegnsetting (feilplassert, manglende eller ekstra tegn) og bruk av store og små bokstaver.
Du skal ikke endre stavemåten til ord eller modifiser teksten ved å legge til eller fjerne ord.
Tenk steg for steg på norsk, og vis tenkingen din innenfor <think> og </think> tagger.
Returner deretter det endelige svaret ditt innenfor <answer> og </answer> tagger.
Hvis ingen feil blir funnet, er det den opprinnelige teksten som er svaret ditt.
Her er teksten som skal analyseres:
FRa 2001 var det plAnLAgT en oMFAttenDE rEform av vm-sTRuKtUrEN.
b- oG c-puLjEne (sOm ble omdøPT tIL HeNhOldvisT «1. DIVISjon» Og «2. divisjon») sKULlE uTviDes FRA åtte tiL Tolv lag hVEr.
iNGeN lAG ryKKEt dERFor ned frA b- oG C-puljEne mens fLere LAg rYkKeT oPp for Å fYlle uT De nye DivisjonEne.
<|eot_id|>
<|start_header_id|>assistant<|end_header_id|>
<think>
Okay, I need to check the Norwegian text for punctuation and letter casing errors. Let's start by reading through it carefully.
First sentence: "Fra 2001 var det planlagt en omfattende reform av VM-strukturen." That looks good.
Next sentence: "B- og C-puljene (som ble omdøpt til henholdvist «1. divisjon» og «2. divisjon») skulle utvides fra åtte til tolv lag hver." The structure inside the parentheses is correct, and the quotation marks are appropriate.
Third sentence: "Ingen lag rykket derfor ned fra B- og C-puljene mens flere lag rykket opp for å fylle ut de nye divisjonene."
The only issue is that a comma is needed before "mens" to separate the two independent clauses:
"Ingen lag rykket derfor ned fra B- og C-puljene, mens flere lag rykket opp for å fylle ut de nye divisjonene."
No other errors are detected.
</think>
<answer>
Fra 2001 var det planlagt en omfattende reform av VM-strukturen.
B- og C-puljene (som ble omdøpt til henholdvist «1. divisjon» og «2. divisjon») skulle utvides fra åtte til tolv lag hver.
Ingen lag rykket derfor ned fra B- og C-puljene, mens flere lag rykket opp for å fylle ut de nye divisjonene.
</answer>
<|eot_id|>```
- Downloads last month
- 248
Inference Providers
NEW
This model is not currently available via any of the supported Inference Providers.