GPU 高性能计算培训课程
课程名称:GPU 高性能计算算法设计与优化
培训对象
高性能计算工程师、科学计算应用开发人员、数值算法研究人员。
培训目标
培训内容介绍
-
GPU 高性能计算概述:高性能计算的应用领域(分子动力学、计算流体力学、天气预报);GPU 在 TOP500 中的地位;混合精度计算与数值稳定性。
-
稀疏线性代数:稀疏矩阵存储格式(CSR、CSC、COO);稀疏矩阵向量乘(SpMV)的 GPU 实现;迭代求解器(共轭梯度法、GMRES)的 GPU 加速。
-
密集线性代数:矩阵分块算法;cuBLAS 与 cuSOLVER 库的高级应用;LU 分解、QR 分解的 GPU 实现。
-
快速傅里叶变换:FFT 算法的并行化;cuFFT 库的使用与性能调优;批处理 FFT 在信号处理中的应用。
-
粒子模拟:N 体问题的 GPU 实现;粒子对相互作用的计算优化;邻域列表算法;分子动力学模拟(如 Amber、GROMACS)的 GPU 加速原理。
-
格点计算:计算流体力学中的网格计算;有限差分法的 GPU 实现;GPU 上的 Stencil 计算优化(共享内存、寄存器重载)。
-
蒙特卡洛模拟:随机数生成在 GPU 上的实现(cuRAND);并行蒙特卡洛方法的应用;方差减少技术的 GPU 实现。
-
数值精度与混合精度:单精度 vs 双精度的性能差异;混合精度算法设计;误差分析与补偿技术。
-
多 GPU 编程:多 GPU 任务的划分;节点内多 GPU 通信(NVLink);跨节点 GPU 通信(MPI+CUDA)。
-
CUDA 感知的 MPI:GPU 直接通信的原理;MPI 与 CUDA 的集成;GPUDirect RDMA 技术。
-
应用案例:分子动力学模拟的 GPU 优化实践;计算流体力学求解器的 GPU 移植经验。
-
综合实战项目:将经典的科学计算应用(如有限差分求解热方程)移植到 GPU,并进行多 GPU 扩展与性能分析。
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击
服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。
专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值