网站地图官方微信:
网站首页 三兴镇 汊河镇 象山镇 羊亭镇 百丈乡 西峰区

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 如何阅读Golang的源码? |

    有些库并不值得看,比如archive、compress以及c...

    查看详情>>
  • | 前端如何设计网页? |

  • | LCD党真的只是少部分人吗? |

  • | 面试官灵魂拷问:为什么 SQL 语句不要过多的 join? |

  • | 为什么好多人不承认大众审美就是喜欢白皮? |

  • | 1.5m的床就已经足够两人睡觉了,为什么现在流行1.8m这么大的床? |

  • | 为什么Rust的包管理器Cargo这么好用? |

  • | 为什么现在的年轻人宁愿自己工资低点,也要过得舒服、不那么累? |

  • | 能分享一下你写过的rust项目吗? |

  • | 为什么大家不再提星链了(包括外网)? |

  • | 有没有宝塔平替的服务器管理面板,现在宝塔越来越贵了,也太臃肿了? |

  • 不说别的,就golang那个json就写的人想吐血。 想实...

    2025-06-25
  • 之前网上见过这个姑娘的照片,当时惊为天人。 后来看到章...

    2025-06-25
  • 10人网络运维小团队,用django自带视图和form+my...

    2025-06-25
  • 遇到问题反向想一下。 现在一堆大厂程序员跑出来又是卖课,又...

    2025-06-25

关注我们

添加微信好友,关注最新动态