GPU 高性能计算培训课程-中科信软培训

GPU 高性能计算培训课程

课程名称：GPU 高性能计算算法设计与优化

培训对象

高性能计算工程师、科学计算应用开发人员、数值算法研究人员。

培训目标

掌握典型科学计算算法（稀疏线性代数、FFT、粒子模拟）的 GPU 实现方法。
理解 GPU 上的数值精度与收敛性要求。
能够针对大规模科学计算问题进行算法设计与性能优化。

培训内容介绍

GPU 高性能计算概述：高性能计算的应用领域（分子动力学、计算流体力学、天气预报）；GPU 在 TOP500 中的地位；混合精度计算与数值稳定性。
稀疏线性代数：稀疏矩阵存储格式（CSR、CSC、COO）；稀疏矩阵向量乘（SpMV）的 GPU 实现；迭代求解器（共轭梯度法、GMRES）的 GPU 加速。
密集线性代数：矩阵分块算法；cuBLAS 与 cuSOLVER 库的高级应用；LU 分解、QR 分解的 GPU 实现。
快速傅里叶变换：FFT 算法的并行化；cuFFT 库的使用与性能调优；批处理 FFT 在信号处理中的应用。
粒子模拟：N 体问题的 GPU 实现；粒子对相互作用的计算优化；邻域列表算法；分子动力学模拟（如 Amber、GROMACS）的 GPU 加速原理。
格点计算：计算流体力学中的网格计算；有限差分法的 GPU 实现；GPU 上的 Stencil 计算优化（共享内存、寄存器重载）。
蒙特卡洛模拟：随机数生成在 GPU 上的实现（cuRAND）；并行蒙特卡洛方法的应用；方差减少技术的 GPU 实现。
数值精度与混合精度：单精度 vs 双精度的性能差异；混合精度算法设计；误差分析与补偿技术。
多 GPU 编程：多 GPU 任务的划分；节点内多 GPU 通信（NVLink）；跨节点 GPU 通信（MPI+CUDA）。
CUDA 感知的 MPI：GPU 直接通信的原理；MPI 与 CUDA 的集成；GPUDirect RDMA 技术。
应用案例：分子动力学模拟的 GPU 优化实践；计算流体力学求解器的 GPU 移植经验。
综合实战项目：将经典的科学计算应用（如有限差分求解热方程）移植到 GPU，并进行多 GPU 扩展与性能分析。

如果您想学习本课程，请预约报名
如果没找到合适的课程或有特殊培训需求，请订制培训
除培训外，同时提供相关技术咨询与技术支持服务，有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击

服务优势：
丰富专家资源，精准匹配相关行业，相关项目技术精英，面向用户实际需求，针对性培训或咨询，互动式交流，案例教学，精品小班，实际工程项目经验分享，快捷高效，节省时间与金钱，少走弯路与错路。

专家力量：
中国科学院相关研究所高级研究人员
西门子，TI,vmware，MSC,Ansys，MDI，Mentor, candence,Altium,Atmel 、Freescale,达索，华为等
大型公司高级工程师，项目经理，技术支持专家
中科信软培训中心，资深专家或讲师
大多名牌大学，硕士以上学历，相关学历背景专业，理论素养高
多年实际项目实践，大型复杂项目实战案例分享，热情，乐于技术分享
针对客户实际需要，真实案例演示，互动式沟通，学有所值