XiaoY1
/

Qwen2-7B-Instruct-DPO-math-beta0.5

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-7B-Instruct-DPO-math-beta0.5 / trainer_state.json

XiaoY1's picture

Upload trainer_state.json with huggingface_hub

3167d3d verified 6 months ago

387 kB

File too large to display, you can check the raw version instead.