[ggerganov/llama.cpp]量化与部署的问题

2023-12-14 441 views
0

在windows系统中使用llama.cpp编译生成的执行文件运行时没有任何反应,比如,利用quantize.exe测量FP16模型时,没有任何反应,也不报错 13ea5cb8ad9eb2eaafccbcca7b2488d

回答

8

我猜可能是一个和CUDA相关的问题。你能试一下没有CUDA的本版吗?

另外,我也听说当在cmd.exe中软件崩溃时,它并没有报告问题。如果有WSL(Windows Subsystem for Linux),那儿启动软件可能有效。

抱歉,我的中文很差。希望您还是能读得懂我的意思。


他们说,当他们尝试像在 Windows 中一样启动可执行文件时,quantize.exe没有结果。我建议尝试非 CUDA 版本或在 WSL 中运行它以获得更好的错误消息。

4

您确定这会有帮助吗?它必须在文件中生成在控制台中不可见的输出。我不是 Windows 用户,但我不认为情况会是这样。

我认为这可能是段错误,但由于它在cmd.exe程序中运行,因此不会报告崩溃。我依稀记得在 WSL 中跑步可以在这种情况下有所帮助。

7

@KerfuffleV2它肯定会告诉我是否没有生成输出或根本没有显示输出,这应该会大大缩小问题范围。

老实说,进行文件重定向并简单地查看文件大小(零,非零)就可以了,我只是保持评论简单,因为谷歌翻译。

编辑:WSL 应该对任何一种方式都有帮助,因为它应该以 Unix 方式处理语言环境,所以这实际上可能是一个更好的主意。

5

遇到相同的问题,CUDA_PATH环境变量设置好了。

0

现在,现在问题都解决了吗?

9

请问您能详细说一下吗?是将cuda_path.py的路径添加到环境变量里吗?

5

尝试一下没有CUDA的版本,还是一样的问题

9

抱歉,我以为你说的问题已经解决了。恐怕我对 Windows 系统的环境变量还不太清楚。

我最初的建议是为了减少问题可能产生的原因而提出的。也就是说,如果你尝试一个略去CUDA的版本,后来就发现毛病不见了,这意味着问题肯定是与CUDA相关的。因为你已经尝试过没有CUDA的版本,我们现在就不能怪CUDA了。

您有 WSL 没有?如果可以,请在 WSL 中执行本软件。我最后的希望是这样做能够告诉您问题到底是什么。


他们说他们尝试了非 CUDA 版本,但仍然遇到同样的问题。我只是建议尝试再次在 WSL 中运行它,这是我目前唯一能想到的尝试。

我很确定这只是启动时出现段错误,并且错误没有显示在cmd.exe.

9

可以在 中监视段错误eventvwr