随着深度学习的不断发展,AI 模型结构在快速演化,底层计算硬件技术更是层出不穷,对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将算力发挥出来,还要应对计算框架的持续迭代。AI编译器就成了应对以上问题广受关注的技术方向,让用户仅需专注于上层模型开发,降低手工优化性能的人力开发成本,进一步压榨硬件性能空间。
AI编译器主要是分为前端优化、后端优化,部分还会有中间优化层,而这里面主要介绍AI编译器的前端优化涉及到的算法和优化Pass。
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!
内容大纲
PPT
和字幕
需要到 Github 下载,网页课程版链接会失效哦~建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~
小节 | 链接 |
---|---|
01 内容介绍 | PPT, 视频, 文章, 字幕 |
02 计算图层IR | PPT, 视频, 文章, 字幕 |
03 算子融合策略 | PPT, 视频, 文章, 字幕 |
04 布局转换原理 | PPT, 视频, 文章, 字幕 |
05 布局转换算法 | PPT, 视频, 文章, 字幕 |
06 内存分配算法 | PPT, 视频, 文章, 字幕 |
07 常量折叠原理 | PPT, 视频, 文章, 字幕 |
08 公共表达式消除 | PPT, 视频, 文章, 字幕 |
09 死代码消除 | PPT, 视频, 文章, 字幕 |
10 代数简化 | PPT, 视频, 文章, 字幕 |
11 优化Pass排序 | PPT, 视频, 文章, 字幕 |
文字课程内容正在一节节补充更新,每晚会抽空继续更新正在 AISys ,希望您多多鼓励和参与进来!!!
文字课程开源在 AISys,系列视频托管B站和油管,PPT开源在github,欢迎取用!!!
非常希望您也参与到这个开源项目中,B站给ZOMI留言哦!
欢迎大家使用的过程中发现bug或者勘误直接提交代码PR到开源社区哦!
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!