jerry128
/

Qwen2.5-7B-Instruct-HOTPOTQA-GRPO-CL

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-7B-Instruct-HOTPOTQA-GRPO-CL

Commit History

Upload folder using huggingface_hub

85cf41b
verified

jerry128 commited on Mar 3

initial commit

4eda4a5
verified

jerry128 commited on Mar 3