imhmdf
/

DeepSeek-R1-Distill-Qwen-32B-bnb-4bit-DPO-tuned

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-32B-bnb-4bit-DPO-tuned

Commit History

Trained with Unsloth

7ad734a
verified

imhmdf commited on 13 days ago

Upload tokenizer

6a2fb8c
verified

imhmdf commited on 13 days ago

Upload README.md with huggingface_hub

1a2ef11
verified

imhmdf commited on 13 days ago

initial commit

06307d4
verified

imhmdf commited on 13 days ago