根据文档中的方法进行微调后,询问例如“你是谁” “你叫什么” 都会回复所训练模型内容中相关的字眼,实际上询问的问题与训练的模型问题是不相关的
是否有其他相关微调参数设置 或者如何改进 可以保留原有的对话能力?
1、下载ADGEN 数据集并放入对应目录 2、运行bash train.sh进行训练 3、运行bash evaluate.sh进行推理 4、运行bash web_demo.sh进行测试
Environment- OS:Windows 11
- Python: 3.10
- Transformers:4.27.1
- PyTorch:2.0
- GPU: 4080 32G
- CUDA Support (`python -c "import torch; print(torch.cuda.is_available())"`) : True