[PaddlePaddle/Paddle]paddle2.3 profiler性能分析组件添加后报错

2024-03-22 903 views
0
bug描述 Describe the Bug required: gpu

import paddle.profiler as profiler import paddle paddle.version.show() prof = profiler.Profiler( targets=[profiler.ProfilerTarget.CPU, profiler.ProfilerTarget.GPU], scheduler=(1, 9), on_trace_ready=profiler.export_chrome_tracing('./log')) prof.start() for iter in range(10):

train()
prof.step()

prof.stop()

##################################################################################################

aistudio报错提示 image 本地conda环境报错提示,而且本地指定过cudnn环境变量位置 daee136a8a52ea6e0000bb791f17a25

其他补充信息 Additional Supplementary Information

No response

回答

1

您好,麻烦排查以下问题: 1.在当前环境下,使用paddle旧版本是否可以正常profile 2.确认安装的paddle版本是否与本地的cuda版本对应。例如如果您本地cuda版本为10.1,则应安装paddlepaddle-gpu==2.3.0.post101 3.运行paddle.utils.run_check(),确定安装的paddle是正常的

0

你好,profile是paddle2.3新推出的特性,paddle2.2没有呀。其次 image 只有在运行这个profiler的时候才会报错,如果用paddle2.3进行其他训练不加profiler,是可以正常训练的

2

这个报错你们可以在aistudio上也可以复现的

2

这个报错你们可以在aistudio上也可以复现的

9

您好,您在本地的时候 export LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64/:$LD_LIBRARY_PATH 加上这个链接库路径,profiler功能依赖于Nvidia的cupti library

1

这个问题还是没有解决

4

已经一个月了

5

之前有联系过aistudio的同学,但是aistudio这个平台牵涉面比较广,这个环境问题没有这么容易做出改变,如果您本地有卡,您可以先在本地尝试跑下,或者只开启CPU的性能分析看看work不work

2

您有安装cupti吗,可以按照上面说的链接cupti

5

我本地环境也是conda管理的,用conda装的cudatoolkit不能用,必须要装cuda.run