用广告生成数据集ptuning以后,加载多次询问同一个问题,模型回复不相同
请问是什么原因呢?看起来像是模型某个参数在每次加载时是随机初始化的?有大佬帮忙看一下吗?
Expected BehaviorNo response
使用广告数据集ptuning后,pre_seq_len=64 加载多次询问“你是谁”
Environment- OS:Linux
- Python:3.9
- Transformers:4.28.0.dev0
- PyTorch:2.0.0+cu117
- CUDA Support (`python -c "import torch; print(torch.cuda.is_available())"`) :
加载模型参数代码如下: