sr5434
/

rlhf_policy

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

1.11 GB

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

sr5434's picture

End of training

9ef9566 verified 19 days ago

runs
End of training 19 days ago
.gitattributes

1.57 kB
End of training 20 days ago
README.md

1.92 kB
End of training 20 days ago
added_tokens.json

85 Bytes
End of training 20 days ago
chat_template.jinja

576 Bytes
End of training 20 days ago
config.json

1.35 kB
End of training 20 days ago
generation_config.json

218 Bytes
End of training 20 days ago
model.safetensors

1.07 GB
xet

End of training 19 days ago
special_tokens_map.json

519 Bytes
End of training 20 days ago
tokenizer.json

33.4 MB
xet

End of training 20 days ago
tokenizer.model

4.69 MB
xet

End of training 20 days ago
tokenizer_config.json

1.16 MB
End of training 20 days ago
training_args.bin
Detected Pickle imports (10)
- "torch.device",
- "transformers.trainer_utils.HubStrategy",
- "trl.trainer.grpo_config.GRPOConfig",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.SaveStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.state.PartialState"
How to fix it?
7.63 kB
xet

End of training 19 days ago