language: - 'no' - en

Pretrained reasoning model

Trained with these parameters:

python MaxText/train.py MaxText/configs/base.yml 
  load_parameters_path='gs://nb_llama3_x/nb-llama-3.2-3B-Instruct/checkpoints/180/items' 
  steps=161 
  checkpoint_period=80 
  run_name='llama32_reasoning_chat_norwegian' 
  model_name='llama3.2-3b' 
  max_target_length=8192 
  async_checkpointing=false 
  base_output_directory='gs://maxlog-eu' 
  dataset_type='hf' 
  hf_path='json' 
  hf_train_files='gs://levanter-dataset-eu/wiki_reasoning_chat_norwegian/train10*.jsonl' 
  tokenizer_path=../Llama-3.2-1B/ 
  per_device_batch_size=1 
  attention='flash' 
  learning_rate=9e-5 
  warmup_steps_fraction=0.01 
  remat_policy=full 
  hf_eval_split='' 
  hf_eval_files='gs://levanter-dataset-eu/wiki_reasoning_chat_norwegian/validation*.jsonl' 
  eval_steps=10

Trained on data from: https://huggingface.co/datasets/pere/reasoning_chat_norwegian

Example prompt:

<|begin_of_text|> <|start_header_id|>user<|end_header_id|>
<|begin_of_text|>
<|start_header_id|>user<|end_header_id|>
Du er en anerkjent ekspert på norsk rettskrivning med inngående kunnskap om korrekt tegnsetting og bruk av store og små bokstaver.  
Din oppgave er å gjennomgå følgende tekst og rette eventuelle feil knyttet til tegnsetting (feilplassert, manglende eller ekstra tegn) og bruk av store og små bokstaver.  
Du skal ikke endre stavemåten til ord eller modifiser teksten ved å legge til eller fjerne ord.  
Tenk steg for steg på norsk, og vis tenkingen din innenfor <think> og </think> tagger.  
Returner deretter det endelige svaret ditt innenfor <answer> og </answer> tagger.  
Hvis ingen feil blir funnet, er det den opprinnelige teksten som er svaret ditt.  
Her er teksten som skal analyseres:

FRa 2001 var det plAnLAgT en oMFAttenDE rEform av vm-sTRuKtUrEN.  
b- oG c-puLjEne (sOm ble omdøPT tIL HeNhOldvisT «1. DIVISjon» Og «2. divisjon») sKULlE uTviDes FRA åtte tiL Tolv lag hVEr.  
iNGeN lAG ryKKEt dERFor ned frA b- oG C-puljEne mens fLere LAg rYkKeT oPp for Å fYlle uT De nye DivisjonEne.
<|eot_id|>

<|start_header_id|>assistant<|end_header_id|>
<think>
Okay, I need to check the Norwegian text for punctuation and letter casing errors. Let's start by reading through it carefully.  
First sentence: "Fra 2001 var det planlagt en omfattende reform av VM-strukturen." That looks good.  
Next sentence: "B- og C-puljene (som ble omdøpt til henholdvist «1. divisjon» og «2. divisjon») skulle utvides fra åtte til tolv lag hver." The structure inside the parentheses is correct, and the quotation marks are appropriate.  
Third sentence: "Ingen lag rykket derfor ned fra B- og C-puljene mens flere lag rykket opp for å fylle ut de nye divisjonene."  
The only issue is that a comma is needed before "mens" to separate the two independent clauses:  
"Ingen lag rykket derfor ned fra B- og C-puljene, mens flere lag rykket opp for å fylle ut de nye divisjonene."  
No other errors are detected.
</think>
<answer>
Fra 2001 var det planlagt en omfattende reform av VM-strukturen.  
B- og C-puljene (som ble omdøpt til henholdvist «1. divisjon» og «2. divisjon») skulle utvides fra åtte til tolv lag hver.  
Ingen lag rykket derfor ned fra B- og C-puljene, mens flere lag rykket opp for å fylle ut de nye divisjonene.
</answer>
<|eot_id|>```
Downloads last month
248
Safetensors
Model size
3.61B params
Tensor type
F32
·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.