有人说,我做一款AI芯片,只要原生支持PyTorch就好了呀,用户直接用PyTorch跑模型,根本接触不到CUDA呀。
没错,一般的用户只要在PyTorch层面做应用,但是总是有新的模型架构出来,这些架构都需要做特定的性能优化才能在一个芯片上得到较高的性能,这时候就涉及到算子开发了。
比如说一开始LLM在GPU上的性能不好,后来社区针对Nvidia GPU做了flash attention等的优化才把LLM的性能提升到了比较可观的程度。
CUDA已经被各种开源AI框…。
为什么各大 *** 出奇一致地设置了『摇一摇开屏广告』?如何关闭常用 *** 的这些广告?
为什么各大 *** 出奇一致地设置了『摇一摇开屏广告』?如何关闭常用 *** 的这些广告?...(144 )人阅读时间:2025-06-19 12:05:12
字节大量使用新语言,包括go,rust等,为什么阿里一直都抱着j***a不松手?
字节大量使用新语言,包括go,rust等,为什么阿里一直都抱着j***a不松手?...(144 )人阅读时间:2025-06-19 10:35:14
手机的运行内存真的有必要上16GB吗?
手机的运行内存真的有必要上16GB吗?...(144 )人阅读时间:2025-06-19 10:50:14
张元英瘦得很畸形,为什么她粉丝还觉得是完美身材?
张元英瘦得很畸形,为什么她粉丝还觉得是完美身材?...(144 )人阅读时间:2025-06-19 11:15:13