konstantin-ketterer
/

Qwen2-3B-GRPO-baseline-reference-m-sync-0.9-32-no-wd-0.02-warmup

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Qwen2-3B-GRPO-baseline-reference-m-sync-0.9-32-no-wd-0.02-warmup / merges.txt

konstantin-ketterer's picture

konstantin-ketterer

Training in progress, step 10

8310318 verified 2 days ago

1.67 MB

File too large to display, you can check the raw version instead.