[huggingface/transformers]训练器的使用问题

2024-01-23 422 views
1

Trainer在实例化的时候不是已经初始化加载的模型了吗,为什么trainer.train(resume_from_checkpoint=checkpoint)还可以从保存的检查点加载模型???

回答

6

嗨@fxb392

它主要用于加载优化器的调度程序和其他状态。但是,如果您在实例化训练器时加载规范模型(例如从 Hub)但想要使用其他检查点,这也很方便。

你不

8

好的,谢谢您的指导。这是否仅仅意味着训练师可以方便地装载火车的任何检查站?

9

是的,但是您必须小心加载由加载相同模型类型和相同模型配置的训练器保存的检查点。

8

好的,我明白了,再次谢谢您。