hsila
/

SmolLM2-135M-SFT-DPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

SmolLM2-135M-SFT-DPO

Commit History

Delete training_args.bin

ffb16c9
verified

hsila commited on Dec 29, 2024

End of training

78a856a
verified

hsila commited on Dec 29, 2024

initial commit

1774af5
verified

hsila commited on Dec 29, 2024