reduce profile命令请问是么 #7

Vincent-syr · 2024-03-31T03:29:09Z

我也有在server上做profile，然后将数据download到windows本地，用Nsight System打开，可无法找到测量的结果。
命令：nsys profile --gpu-metrics-device=0 --stats=true ./a.out

因此我才用手算带宽利用率：bw = n_bytes / latency。计算的结果与nsys出来的结果有挺大出入，请问可以解释下吗？

cemamxiaoxixi · 2024-03-31T03:29:58Z

您的邮件我已经收到，会尽快回复的。

BBuf · 2024-06-30T02:51:28Z

我也有在server上做profile，然后将数据download到windows本地，用Nsight System打开，可无法找到测量的结果。命令：nsys profile --gpu-metrics-device=0 --stats=true ./a.out

因此我才用手算带宽利用率：bw = n_bytes / latency。计算的结果与nsys出来的结果有挺大出入，请问可以解释下吗？

请参考：https://github.com/BBuf/how-to-optim-algorithm-in-cuda/blob/master/cuda-mode/CUDA-MODE%20%E7%AC%AC%E4%B8%80%E8%AF%BE%E8%AF%BE%E5%90%8E%E5%AE%9E%E6%88%98%EF%BC%88%E4%B8%8A%EF%BC%89.md

cemamxiaoxixi · 2024-06-30T02:52:00Z

您的邮件我已经收到，会尽快回复的。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

reduce profile命令请问是么 #7

reduce profile命令请问是么 #7

Vincent-syr commented Mar 31, 2024

cemamxiaoxixi commented Mar 31, 2024 via email

BBuf commented Jun 30, 2024

cemamxiaoxixi commented Jun 30, 2024 via email

reduce profile命令请问是么 #7

reduce profile命令请问是么 #7

Comments

Vincent-syr commented Mar 31, 2024

cemamxiaoxixi commented Mar 31, 2024 via email

BBuf commented Jun 30, 2024

cemamxiaoxixi commented Jun 30, 2024 via email