deepakkarkala
/

smollm2-135m-dpo-qlora-test

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

smollm2-135m-dpo-qlora-test / vocab.json

deepakkarkala's picture

Training in progress, step 100

323728d verified 7 days ago

801 kB

File too large to display, you can check the raw version instead.