您好,我这边M1 Pro 16G内存,运行python cli_demo.py的时候,内存能占到14G,swap也没有一直往上飙,GPU最高到30%,问一个你好,回答可能要七八分钟。参考了https://github.com/THUDM/ChatGLM-6B/issues/462 重新装了一遍环境,效果还是一样
询问一个你好,时间超过7/8分钟,辛苦大佬帮忙看看
Environment- OS:mac os 13
- Python: 3.9
- Transformers:4.26.0
- PyTorch:1.12.1
- CUDA Support (`python -c "import torch; print(torch.cuda.is_available())"`) :false