jerry128
/

Qwen2.5-7B-Instruct-HOTPOTQA-GRPO-CL

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-7B-Instruct-HOTPOTQA-GRPO-CL / runs

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

jerry128's picture

Upload folder using huggingface_hub

85cf41b verified 6 months ago