agentlans
/

SmolLM2-135M-Instruct-o1

Model card Files Files and versions Community

agentlans commited on Jan 6

Commit

2a80921

·

verified ·

1 Parent(s): bef8e01

Update README.md

Files changed (1) hide show

README.md +5 -0

README.md CHANGED Viewed

@@ -39,6 +39,9 @@ Data quality is another critical factor. Large language models require high-qual
 - **Dataset**: OpenO1-SFT (complete dataset)
 - **Training Duration**: 1 epoch
 ## Model Specifications
 - **Architecture**: Transformer decoder (135M parameters)
@@ -57,6 +60,8 @@ Data quality is another critical factor. Large language models require high-qual
 - No RoPE scaling applied
 - No quantization used
 ## Usage

 - **Dataset**: OpenO1-SFT (complete dataset)
 - **Training Duration**: 1 epoch
+<details>
+<summary>More details</summary>
 ## Model Specifications
 - **Architecture**: Transformer decoder (135M parameters)
 - No RoPE scaling applied
 - No quantization used
+</details>
 ## Usage