网站地图官方微信:
网站首页 马和乡 邱集镇 界埠镇 曹河乡 珙县 板岩镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 如何干翻 Cloudflare? |

    建立一家新的网络服务公司,cloudflare免费的你也免费...

    查看详情>>
  • | 请问照片里这个人是谁呀? |

  • | 为什么 macOS 上国产软件不流氓? |

  • | PHP现在真的已经过时了吗? |

  • | 为什么白银案的嫌疑人在之后的十几年间突然停手? |

  • | 前端因为像素还原设计稿而离职,这是个别现象吗? |

  • | Rust 使用 Result 的错误处理方式与 Golang 使用 error 的方式有什么本质区别? |

  • | 各大媒体预测顺位皆在首轮之后,杨瀚森实际顺位大涨是因为什么? |

  • | J***a 除了 Spring 还有什么? |

  • | 不喜欢老婆找健身房男教练私教,是我太狭隘了吗? |

  • | NAS噪音太大,大家都吧NAS放置到哪了? |

  • 身材还用说吗?真的是好啊! 就看过她演的变形金刚和忍者神龟。...

    2025-06-26
  • 从模式上看,《你行!你上!》跟《酱园弄》模式还真的有点像。 ...

    2025-06-26
  • 恰巧也是个码农,我也是真的住过车里。 前后大概20天左右。 ...

    2025-06-26
  • 一个成语来总结,见微知著。 这是我用Kimi Resear...

    2025-06-26

关注我们

添加微信好友,关注最新动态