ReasoningEval
/

DeepSeek-R1-Distill-Qwen-7B-RL

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-RL / README.md

shengliu66's picture

Create README.md

d1c161f verified 6 months ago

|

history blame contribute delete

133 Bytes

	Base Model: Qwen/DeepSeek-R1-Distill-Qwen-7B

	Training Epochs: 3

	Training Objective: RL only

	Training Data: ReasoningEval/Huatuo-RL