CharlesLi
/

mistral_rlhf_safe_llama_3_8B_default_1000_full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

mistral_rlhf_safe_llama_3_8B_default_1000_full

Commit History

End of training

542311f
verified

CharlesLi commited on Jan 14

Model save

5f88ff0
verified

CharlesLi commited on Jan 14

initial commit

e248b25
verified

CharlesLi commited on Jan 14