国产 GPU 应用与实践培训课程
课程名称:国产 GPU 异构计算应用开发与实践
培训对象
AI 应用开发人员、图形渲染工程师、信创生态适配人员及高校师生。
培训目标
-
理解国产 GPU(如沐曦、天数、摩尔线程、景嘉微)的架构特点。
-
掌握国产 GPU 编程模型(如 MXMACA)与 CUDA 的异同。
-
能够进行国产 GPU 平台的 AI 模型迁移与性能优化。
培训内容介绍
-
国产 GPU 发展现状:国产 GPU 的市场格局与产品定位;图形 GPU 与通用计算 GPU(GPGPU)的区别;主流国产 GPU 厂商(沐曦、天数、摩尔线程、景嘉微)的产品特点。
-
国产 GPU 架构分析:沐曦 MXMACA 架构的核心理念;天数智芯的通用计算架构;国产 GPU 的内存层次与计算核心设计。
-
国产 GPU 编程模型:MXMACA C/C++ 编程接口简介;国产 GPU 的线程层次与内存模型;与 CUDA 编程模型的对比。
-
开发环境搭建:国产 GPU 驱动与运行时环境的安装;编译工具链的配置;模拟器与硬件调试环境。
-
内核函数编写:国产 GPU 上的向量加法实现;矩阵乘法的移植;原子操作与同步机制。
-
内存管理与优化:主机与设备间的数据传输;共享内存的使用;合并访问优化。
-
性能分析工具:国产 GPU 的性能分析套件;热点识别与瓶颈分析;内存带宽与计算吞吐量的监测。
-
AI 框架适配:PyTorch 在国产 GPU 上的后端适配;TensorFlow 的国产 GPU 支持;算子库(如 cuDNN 对应产品)的使用。
-
大模型推理优化:国产 GPU 上的大模型部署;算子融合与量化支持;模型并行与多卡通信。
-
图形渲染开发:国产 GPU 的 OpenGL/Vulkan 驱动支持;图形应用的移植与优化;国产 GPU 在信创终端中的应用。
-
生态建设与社区:国产 GPU 开发者社区资源;常见问题的解决方案;国产 GPU 与 CUDA 应用的二进制迁移工具。
-
综合实战项目:在国产 GPU 平台上完成一个图像分类或目标检测模型的推理部署,并进行性能分析与优化。
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击
服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。
专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值