ReasoningEval
/

DeepSeek-R1-Distill-Qwen-7B-RL

File size: 133 Bytes

d1c161f

Base Model: Qwen/DeepSeek-R1-Distill-Qwen-7B

Training Epochs: 3

Training Objective: RL only

Training Data: ReasoningEval/Huatuo-RL