ReasoningEval
/

DeepSeek-R1-Distill-Qwen-7B-RL

Model card Files Files and versions

shengliu66 commited on Apr 1

Commit

d1c161f

·

verified ·

1 Parent(s): 8f831bc

Create README.md

Files changed (1) hide show

README.md +7 -3

README.md CHANGED Viewed

@@ -1,3 +1,7 @@
----
-license: apache-2.0
----

+Base Model: Qwen/DeepSeek-R1-Distill-Qwen-7B
+Training Epochs: 3
+Training Objective: RL only
+Training Data: ReasoningEval/Huatuo-RL