konstantin-ketterer
/

Qwen2-3B-GRPO-baseline-reference-m-sync-0.9-32-no-wd-0.02-warmup

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Qwen2-3B-GRPO-baseline-reference-m-sync-0.9-32-no-wd-0.02-warmup / special_tokens_map.json

Commit History

Training in progress, step 10

8310318
verified

konstantin-ketterer commited on 2 days ago