qgallouedec
/

Qwen2.5-0.5B-GRPO-2776-next

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2.5-0.5B-GRPO-2776-next / merges.txt

Commit History

End of training

4c48794
verified

qgallouedec HF staff commited on 12 days ago