- Type: Document
- FILES: README.md; README_en.md
- Keywords: OPENMP; MPS
以chatglm-6b-int4量化模型为例,做如下配置:
- 安装libomp的步骤;
- 对量化后模型等配置gcc编译项,并启用OMP加速推理;
- 量化后模型启用MPS(然后失败)的解释。
Mac 启用OMP涉及https://huggingface.co/THUDM/chatglm-6b-int4
中quantization.py
的修改由于需要手动安装一些依赖,不单独commit,而直接描述在了说明中。
Mac M1 Ultra 128GB Mac OS: 13.3.1 GCC: Apple clang version 14.0.3 (clang-1403.0.22.14.1) conda 23.3.1 torch (two versions, with MPS)
- '2.0.0';
- '2.1.0.dev20230502'