NoManDeRY
/

DPO-Shift-Qwen-2-7B-Ultrafeedback-fixed-1.0

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DPO-Shift-Qwen-2-7B-Ultrafeedback-fixed-1.0 / added_tokens.json

Commit History

Upload folder using huggingface_hub

3f33393
verified

NoManDeRY commited on 7 days ago