jainvi-stanford
/

content

Generated from Trainer

Model card Files Files and versions

content / dpo_trained_model

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

jainvi-stanford's picture

jainvi-stanford

jainvi-stanford/Llama-3.2-1B-Instruct-DPO-HW1

658623d verified 10 months ago