deepakkarkala
/

smollm2-135m-dpo-qlora-test

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

smollm2-135m-dpo-qlora-test / tokenizer_config.json

Commit History

Training in progress, step 100

323728d
verified

deepakkarkala commited on 7 days ago