现在的公式没有很好地说明为什么每个o_k按常进行的移动都不会改变softmax的返回值:
建议修改为:
sunhengzhe
作业 PR-1300-b303fae 已完成。检查结果:http://preview.d2l.ai/d2l-zh/PR-1300/b303fae
github-actions[bot]