CriteriaPO
/

qwen2.5-3b-dpo-finegrained-40-vanilla

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

qwen2.5-3b-dpo-finegrained-40-vanilla

Ctrl+K

Ctrl+K

1 contributor

History: 9 commits

obiwit's picture

Training in progress, step 19402, checkpoint

ae93672 verified 12 days ago

checkpoint-10000
Training in progress, step 10000, checkpoint 15 days ago
checkpoint-15000
Training in progress, step 15000, checkpoint 13 days ago
checkpoint-19402
Training in progress, step 19402, checkpoint 12 days ago
checkpoint-5000
Training in progress, step 5000, checkpoint 17 days ago
.gitattributes

1.84 kB

Training in progress, step 19402, checkpoint 12 days ago
added_tokens.json

605 Bytes

Training in progress, step 5000 17 days ago
config.json

784 Bytes

Training in progress, step 5000 17 days ago
merges.txt

1.67 MB

Training in progress, step 5000 17 days ago
model-00001-of-00002.safetensors

4.96 GB
xet

Training in progress, step 19402 12 days ago
model-00002-of-00002.safetensors

1.21 GB
xet

Training in progress, step 19402 12 days ago
model.safetensors.index.json

35.6 kB

Training in progress, step 5000 17 days ago
special_tokens_map.json

509 Bytes

Training in progress, step 5000 17 days ago
tokenizer.json

11.4 MB
xet

Training in progress, step 5000 17 days ago
tokenizer_config.json

6.99 kB

Training in progress, step 5000 17 days ago
training_args.bin
Detected Pickle imports (14)
- "transformers.trainer_utils.HubStrategy",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "torch.device",
- "accelerate.state.PartialState",
- "trl.trainer.dpo_config.FDivergenceType",
- "torch.bfloat16",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "alignment.configs.DPOConfig",
- "transformers.trainer_utils.IntervalStrategy"
How to fix it?
7.99 kB
xet

Training in progress, step 15000 13 days ago
vocab.json

2.78 MB

Training in progress, step 5000 17 days ago