ReasoningEval
/

DeepSeek-R1-Distill-Qwen-7B-RL

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-RL / README.md

shengliu66's picture

Create README.md

d1c161f verified 6 months ago

|

history blame contribute delete

133 Bytes

Base Model: Qwen/DeepSeek-R1-Distill-Qwen-7B

Training Epochs: 3

Training Objective: RL only

Training Data: ReasoningEval/Huatuo-RL