课程培训
GPU 高性能计算培训课程

GPU 高性能计算培训课程

 

课程名称:GPU 高性能计算算法设计与优化

 

培训对象

高性能计算工程师、科学计算应用开发人员、数值算法研究人员。

 

培训目标

  • 掌握典型科学计算算法(稀疏线性代数、FFT、粒子模拟)的 GPU 实现方法。

  • 理解 GPU 上的数值精度与收敛性要求。

  • 能够针对大规模科学计算问题进行算法设计与性能优化。

 

培训内容介绍

  1. GPU 高性能计算概述:高性能计算的应用领域(分子动力学、计算流体力学、天气预报);GPU 在 TOP500 中的地位;混合精度计算与数值稳定性

  2. 稀疏线性代数:稀疏矩阵存储格式(CSR、CSC、COO);稀疏矩阵向量乘(SpMV)的 GPU 实现;迭代求解器(共轭梯度法、GMRES)的 GPU 加速。

  3. 密集线性代数:矩阵分块算法;cuBLAS 与 cuSOLVER 库的高级应用;LU 分解、QR 分解的 GPU 实现。

  4. 快速傅里叶变换:FFT 算法的并行化;cuFFT 库的使用与性能调优;批处理 FFT 在信号处理中的应用。

  5. 粒子模拟:N 体问题的 GPU 实现;粒子对相互作用的计算优化;邻域列表算法;分子动力学模拟(如 Amber、GROMACS)的 GPU 加速原理。

  6. 格点计算:计算流体力学中的网格计算;有限差分法的 GPU 实现;GPU 上的 Stencil 计算优化(共享内存、寄存器重载)。

  7. 蒙特卡洛模拟:随机数生成在 GPU 上的实现(cuRAND);并行蒙特卡洛方法的应用;方差减少技术的 GPU 实现。

  8. 数值精度与混合精度:单精度 vs 双精度的性能差异;混合精度算法设计;误差分析与补偿技术

  9. 多 GPU 编程:多 GPU 任务的划分;节点内多 GPU 通信(NVLink);跨节点 GPU 通信(MPI+CUDA)

  10. CUDA 感知的 MPI:GPU 直接通信的原理;MPI 与 CUDA 的集成;GPUDirect RDMA 技术。

  11. 应用案例:分子动力学模拟的 GPU 优化实践;计算流体力学求解器的 GPU 移植经验。

  12. 综合实战项目:将经典的科学计算应用(如有限差分求解热方程)移植到 GPU,并进行多 GPU 扩展与性能分析。





如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击

服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。

专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>