araziziml
/

Qwen2-0.5B-GRPO-exp3

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO-exp3

Commit History

araziziml

087ffb8
verified

araziziml commited on 6 days ago

araziziml

05b5f88
verified

araziziml commited on 6 days ago

araziziml

48bc582
verified

araziziml commited on 6 days ago

initial commit

a0d21de
verified

araziziml commited on 6 days ago