课程培训

嵌入式软硬件

能源动力类

电气工程

机械工程

核技术

技术服务

行业软件培训

测控技术与仪器培训

材料成型培训

热分析与电磁分析

其它

FPGA AI加速培训课程

FPGA AI加速专项培训课程大纲6

一、课程总览

1.1 课程定位

聚焦2026年企业高频FPGA AI加速技术需求，面向有扎实FPGA基础（掌握Verilog编程、FPGA开发工具基础操作）

且了解基础AI概念的从业者/进阶学习者，

打造“AI加速原理精讲+FPGA实操落地+行业案例实战”的专项课程，规避冗余理论，重点突破深度学习模型FPGA加速、量

化优化、异构计算、

AI加速IP核应用等核心难点，适配FPGA AI加速工程师、边缘计算工程师、高级FPGA设计工程师（AI方向）等岗位的核心能力要求，

覆盖边缘端、车载端、工业端、数据中心等主流AI加速应用场景。

1.2 培训目标

知识目标：吃透FPGA AI加速的核心原理，掌握CNN、Transformer等主流深度学习模型的FPGA加速逻辑，
熟悉FPGA AI加速资源（DSP48E、BRAM、AI引擎）的应用，了解模型量化（INT8/INT4）、异构计算等关键技术，
掌握2026年主流FPGA AI加速IP核与工具链的使用方法，了解边缘/车载场景下FPGA AI加速的设计规范。
能力目标：能够独立完成深度学习模型的FPGA加速方案选型、模型量化与部署，熟练使用Xilinx Vitis AI、
Intel OpenVINO等工具链及AI加速IP核，解决FPGA AI加速中的资源占用过高、时序违例、吞吐量不足等高频问题，
具备场景化FPGA AI加速模块的全流程设计与落地能力。
岗位目标：精准对接2026年企业FPGA AI加速相关岗位需求，补齐“AI模型+FPGA加速”的融合能力短板，
提升核心竞争力，胜任FPGA AI加速工程师、边缘计算工程师、车载AI加速工程师、数据中心AI加速开发工程师等岗位。

1.3 培训收益

技术收益：精通FPGA AI加速核心原理与实现技巧，掌握CNN/Transformer模型的FPGA加速、模型量化（INT8/INT4）、异构计算等关键技术，
熟练使用Vitis AI、OpenVINO等主流工具链及Xilinx DPU、Intel VPU等加速IP核，了解低功耗AI加速、实时性优化等进阶技术。
实战收益：通过8个专项案例+1个综合实战，积累边缘端图像识别、车载目标检测、工业缺陷检测等场景的FPGA AI加速开发经验，掌握模型优化、
资源与时序平衡、部署调试等实操技巧，提升AI加速项目交付效率与质量。
职业收益：贴合2026年企业FPGA AI加速岗位高频需求（模型加速、量化优化、IP核应用），弥补“AI+FPGA”融合能力短板，减少项目因加速
方案不当导致的返工，助力职业晋升或岗位转型（如FPGA设计转AI加速方向、AI工程师转硬件加速方向）。
资料收益：获取课程配套课件、案例源码、AI加速IP核配置模板、模型量化工具、仿真脚本、企业FPGA AI加速项目真题解析、FPGA AI加速
设计规范等全套学习资料。

1.4 适用人群

有1-3年FPGA开发经验，已掌握Verilog进阶编程、Quartus/Vivado基础操作，了解基础数字电路知识；了解CNN、Transformer等基础深度学习模型概念，

需系统提升FPGA AI加速能力，解决项目中AI加速相关技术难题；从事FPGA AI加速开发、边缘计算、车载电子（自动驾驶）、

工业控制、数据中心、人工智能硬件等相关领域的技术从业者、在校进阶学习者。

二、核心培训专题（分模块授课，每个专题含“知识点+案例分析/演示”）

专题一：FPGA AI加速基础原理（筑牢根基）

专题目标

掌握AI加速的核心概念与基础理论，理解FPGA与AI加速的融合优势，熟悉FPGA AI加速核心资源特性，建立“AI模型→FPGA加速实现”的工程化思维，为后续核心技术学习奠定基础。

核心知识点

AI加速基础：人工智能与深度学习核心概念，CNN、Transformer等主流模型的推理流程，AI加速的核心需求（实时性、低功耗、高吞吐量），
主流AI加速方案（FPGA、GPU、ASIC）的对比与选型。
FPGA与AI加速的融合优势：FPGA的并行运算特性、可重构特性、低功耗优势，适配的AI加速场景（边缘端、车载端、实时性要求高的场景），
与GPU/ASIC的差异及互补性。
FPGA AI加速核心资源：Xilinx Versal（AI引擎、DSP48E2、BRAM）、Intel Agilex（AI Tile、DSP Block）系列FPGA AI加速资源解析，
运算单元、存储单元的协同工作机制与应用场景。
AI模型推理的FPGA适配：深度学习模型推理的计算特点（矩阵乘法、卷积运算），FPGA并行架构与模型计算的适配原理，模型推理流程的FPGA拆解方法。
FPGA AI加速开发流程：需求分析→模型选型与优化→量化处理→FPGA加速方案设计→IP核配置/RTL实现→仿真验证→板级部署→性能测试的全流程梳理。

案例分析/演示

案例：简单AI模型（如线性回归、简单CNN）FPGA加速可行性分析—— 拆解模型计算流程，分析FPGA并行架构的适配点，
对比FPGA与GPU的加速效果差异，明确FPGA加速的优势场景。
演示：Xilinx Versal/Intel Agilex FPGA AI加速资源查看与配置基础，AI模型推理流程的FPGA拆解演示，
主流FPGA AI加速工具链（Vitis AI、OpenVINO）的安装与基础操作。

专题二：深度学习模型基础与FPGA加速适配（核心入门）

专题目标

掌握CNN、Transformer等主流深度学习模型的核心原理与推理计算特点，理解模型与FPGA架构的适配逻辑，能够完成简单模型的FPGA加速方案设计与基础实现。

核心知识点

CNN模型核心原理：卷积层、池化层、全连接层的功能与计算逻辑，卷积运算的数学表达，CNN模型推理的计算瓶颈（卷积运算量过大）。
Transformer模型核心原理：自注意力机制的基础逻辑，编码器/解码器的结构与计算流程，Transformer推理的计算特点（矩阵乘法为主），
轻量化Transformer模型（如MobileViT）的适配要点。
模型与FPGA的适配逻辑：CNN卷积运算的FPGA并行实现思路（空间并行、时间并行），Transformer矩阵乘法的FPGA优化思路，
模型层与FPGA运算单元的映射方法。
轻量化模型选型与适配：2026年主流轻量化模型（MobileNet、ShuffleNet、MobileViT）的特点，针对FPGA加速的模型选型原则，
模型剪枝的基础方法（降低运算量）。
简单模型的FPGA加速基础：基于RTL手工编写简单卷积/矩阵乘法运算单元，实现简单CNN模型的推理加速，理解并行运算对加速效果的提升作用。

案例分析/演示

案例1：基于FPGA的简单CNN模型（如LeNet-5）加速基础实战—— 拆解LeNet-5模型计算流程，设计卷积运算的FPGA并行实现方案，编写核心RTL代码，验证加速效果。
案例2：Transformer轻量化模型（MobileViT）FPGA适配分析—— 分析模型计算瓶颈，设计模型层与FPGA运算单元的映射方案，对比适配前后的加速性能。
演示：CNN卷积运算的FPGA并行实现（RTL编写），模型计算流程拆解与FPGA映射演示，简单模型的FPGA仿真验证基础操作。

专题三：模型量化技术与FPGA实战（工程化核心）

专题目标

掌握模型量化（INT8/INT4）的核心原理与实现方法，能够独立完成深度学习模型的量化处理，解决量化过程中的精度损失问题，实现量化模型的FPGA高效加速。

核心知识点

模型量化基础：量化技术的核心价值（降低运算量、减少存储占用、提升FPGA加速效率），量化原理（浮点转定点：INT8/INT4/FP16），对称量化与非对称量化的差异与选型。
主流量化工具使用：Xilinx Vitis AI Quantizer、Intel OpenVINO Quantization Tool、TensorRT量化工具的操作方法，量化参数配置（量化粒度、校准数据集选择）。
量化精度优化：量化过程中的精度损失原因分析，精度校准方法，量化误差抑制技巧，满足不同场景（工业/车载）的精度要求。
量化模型的FPGA适配：INT8/INT4量化模型的FPGA运算单元适配，量化后模型的RTL实现技巧，量化模型与FPGA存储资源（BRAM）的协同优化。
2026年量化技术趋势：INT4/INT2低比特量化技术，混合精度量化（FP16+INT8）的应用，量化与剪枝、蒸馏技术的协同优化。

案例分析/演示

案例：基于INT8量化的MobileNetV2模型FPGA加速实战—— 使用Vitis AI Quantizer对MobileNetV2模型进行INT8量化，
校准精度，设计量化模型的FPGA加速方案，实现模型推理加速并验证精度与性能。
演示：量化工具的完整操作流程（模型导入→校准→量化→导出），量化精度校准与优化演示，量化模型的FPGA仿真验证，精度损失排查方法演示。

专题四：FPGA AI加速IP核与工具链实战（企业高频）

专题目标

掌握2026年主流FPGA AI加速IP核（Xilinx DPU、Intel VPU）的深度配置与应用方法，熟练使用Vitis AI、OpenVINO等工具链，

实现深度学习模型的快速FPGA部署与加速。

核心知识点

Xilinx AI加速生态：Vitis AI工具链详解（模型优化、量化、编译、部署），DPU（深度学习处理单元）IP核的功能与特性，
DPU IP核的深度配置（运算精度、并行度、存储配置）。
Intel AI加速生态：OpenVINO工具链详解，VPU（视觉处理单元）IP核的应用，OpenVINO与Quartus的协同使用方法，模型编译与FPGA部署流程。
AI加速IP核应用技巧：DPU/VPU IP核与自定义RTL模块的协同工作，IP核的资源占用优化，IP核的时序性能优化，多IP核并行加速方案设计。
工具链高级应用：模型编译优化（算子融合、指令优化），部署调试技巧，加速性能监控与分析方法，工具链常见问题排查。
第三方AI加速IP核介绍：2026年主流第三方FPGA AI加速IP核（如深鉴科技DNNDK）的特点与应用场景，IP核选型原则。

案例分析/演示

案例1：基于Xilinx DPU的MobileNetV3模型FPGA部署实战—— 使用Vitis AI工具链完成模型量化、编译，配置DPU IP核，
搭建FPGA加速系统，实现模型推理部署，测试吞吐量与延迟。
案例2：基于Intel OpenVINO的ResNet50模型FPGA加速实战—— 使用OpenVINO完成模型优化与编译，配置VPU IP核，
实现模型在Intel FPGA上的部署与加速，优化时序性能。
演示：Vitis AI/OpenVINO工具链完整操作流程，DPU/VPU IP核配置与调试，模型编译与部署演示，加速性能监控与分析演示。

专题五：FPGA AI加速架构设计与优化（进阶重点）

专题目标

掌握FPGA AI加速架构的核心设计方法，能够独立完成复杂AI加速系统的架构设计，实现资源、时序、吞吐量的平衡优化，解决高频加速优化问题。

核心知识点

AI加速架构设计基础：流水线架构、并行架构、异构架构的设计原理，针对CNN/Transformer模型的加速架构选型，
架构设计的核心原则（高并行、低延迟、高资源利用率）。
资源优化技巧：DSP、BRAM、LUT资源的合理分配，运算单元复用技巧，存储资源优化（数据缓存策略、带宽优化），
冗余逻辑剔除，降低资源占用率。
时序优化技巧：关键路径（卷积/矩阵乘法单元）优化，时钟约束与路径约束的编写（针对AI加速模块），流水线拆分与优化，时序违例的解决方案。
吞吐量与延迟优化：数据并行、指令并行、任务并行的协同优化，批量处理优化，数据预取与缓存优化，
满足不同场景的实时性要求（如车载端低延迟、数据中心高吞吐量）。
异构加速架构设计：FPGA+CPU、FPGA+GPU异构加速架构的设计，数据交互接口（PCIe、AXI）设计，异构系统的协同工作机制，数据传输优化。

案例分析/演示

案例：CNN模型FPGA加速架构优化实战—— 针对MobileNetV4模型，设计流水线并行加速架构，优化资源分配与时序性能，
提升吞吐量，对比优化前后的资源占用、延迟与吞吐量。
案例：FPGA+CPU异构加速架构实战—— 设计FPGA+CPU异构AI加速系统，实现模型推理的异构分工
（CPU负责预处理，FPGA负责核心计算），优化PCIe数据传输，提升整体加速效果。
演示：加速架构设计流程演示，资源与时序分析工具（Vivado/Quartus）操作，关键路径优化演示，
异构架构数据交互接口设计演示。

专题六：场景化FPGA AI加速实战（车载/边缘/工业）

专题目标

掌握边缘端、车载端、工业端等主流场景的FPGA AI加速设计要求，能够结合场景需求，完成场景化AI加速模块的设计、

部署与优化，适配行业实际需求。

核心知识点

边缘端AI加速场景：边缘端AI加速的核心需求（低功耗、小体积、实时性），FPGA边缘AI加速的设计要点，
边缘端模型选型（轻量化、低比特量化），典型应用（边缘图像识别、智能终端）。
车载端AI加速场景：车规级FPGA AI加速的要求（高可靠性、低延迟、抗干扰），车载AI加速的核心应用（目标检测、
车道线识别、毫米波雷达融合），车规级时序与功耗优化。
工业端AI加速场景：工业AI加速的需求（高稳定性、实时性、抗干扰），典型应用（工业缺陷检测、设备故障诊断），
工业场景下的FPGA AI加速部署与调试技巧。
场景化模型优化：针对不同场景的模型剪枝、量化、蒸馏优化，适配场景的资源与性能需求，场景化数据预处理（如工业图像增强）的FPGA实现。
场景化部署技巧：边缘/车载/工业端FPGA的板级部署方法，接口适配（如车载LVDS接口、工业Ethernet接口），现场调试与性能测试。

案例分析/演示

案例1：车载端目标检测（YOLOv8轻量化版）FPGA加速实战—— 针对车载场景，对YOLOv8进行剪枝与INT8量化，
设计车规级FPGA加速方案，实现低延迟目标检测，满足车规时序要求。
案例2：边缘端图像识别（ResNet18轻量化版）FPGA加速实战—— 针对边缘场景，优化模型并量化至INT4，
设计低功耗FPGA加速架构，实现边缘端图像识别的快速部署与低功耗运行。
演示：场景化模型优化演示，车规/边缘端FPGA部署调试，接口适配演示，场景化性能测试（延迟、功耗、准确率）演示。

专题七：FPGA AI加速仿真与验证（避坑高效）

专题目标

掌握FPGA AI加速模块的仿真与验证核心方法，能够独立搭建AI加速系统的仿真环境，完成功能验证、性能验证，

快速排查仿真中的算法错误、时序错误，提升开发效率。

核心知识点

AI加速仿真基础：Modelsim/Questa仿真工具的高级应用，AI加速模块仿真环境搭建（激励生成、数据交互、结果对比），
仿真脚本编写技巧，AI模型推理结果的验证方法。
功能验证：加速模块的功能正确性验证，模型推理精度验证，量化误差验证，多模块协同（IP核+自定义模块）的功能验证，
仿真用例设计（正常用例、边界用例）。
性能验证：加速模块的吞吐量、延迟、资源占用、功耗的仿真验证方法，时序性能验证，量化精度与加速性能的平衡验证。
板级调试技巧：FPGA AI加速模块的板级调试方法，示波器、逻辑分析仪的使用，实时推理结果观测与错误排查，模型精度与加速性能的现场校准。
常见问题排查：模型量化精度损失过高、时序违例、吞吐量不达标、数据交互错误等高频问题的排查流程与解决方案。

案例分析/演示

案例：FPGA AI加速系统仿真与调试实战—— 针对“量化模型+DPU IP核+自定义接口模块”的完整加速系统，搭建仿真环境，
编写仿真用例，完成功能与性能验证，排查时序违例、精度损失等问题，完成板级调试。
演示：AI加速仿真环境搭建与仿真脚本编写，精度验证与性能测试演示，示波器/逻辑分析仪使用，常见AI加速问题排查全过程演示。

专题八：企业级FPGA AI加速设计规范与实战技巧（岗位刚需）

专题目标

掌握企业级FPGA AI加速设计规范，熟悉行业最佳实践，规避企业项目中常见的AI加速设计坑点，提升工程化设计能力，适配企业岗位要求。

核心知识点

企业级设计规范：FPGA AI加速模块的RTL编码规范，IP核配置规范，模型量化与优化规范，仿真验证规范，
文档编写规范（设计文档、验证报告、部署手册）。
行业最佳实践：边缘/车载/数据中心场景下FPGA AI加速的设计要点，加速方案选型、模型优化、资源分配的标准化流程，
企业项目中的AI加速效率提升技巧。
常见坑点规避：模型量化精度损失过高、资源占用超标、时序违例、仿真与板级结果不一致、场景适配性差等坑点的规避技巧，
企业项目常见问题复盘。
团队协作设计：AI加速模块的版本管理，团队协作开发流程（算法工程师与FPGA工程师协同），设计评审要点，问题同步与解决技巧。
企业项目交付标准：AI加速模块的交付内容（源码、IP核配置文件、仿真脚本、部署手册、验证报告、性能测试报告），交付审核要点。

案例分析/演示

案例：企业级车载AI加速项目复盘实战—— 复盘车载目标检测FPGA加速项目，梳理设计规范、优化点与坑点，
按照企业交付标准完善设计文档与验证报告，优化加速方案。
演示：RTL编码规范实操，设计文档编写演示，设计评审流程演示，企业项目交付审核要点讲解，团队协作开发流程演示。

三、综合实战专题（贴合企业真实项目，落地应用）

3.1 实战目标

整合前面8个专题的核心技术，独立完成一个复杂FPGA AI加速项目的全流程开发

（需求分析→模型选型与优化→量化处理→加速架构设计→IP核配置/RTL实现→仿真验证→板级部署→性能优化→文档编写），

提升AI加速项目的工程化落地能力，积累可直接适配企业岗位的项目经验。

3.2 实战项目（二选一，贴合2026年企业主流场景）

实战项目1：车载端轻量化YOLOv8目标检测FPGA加速模块设计（热门）

项目需求：基于Xilinx Versal/Intel Agilex FPGA，设计车载端目标检测AI加速模块，对YOLOv8进行剪枝与INT8量化，

配置DPU/VPU IP核，设计低延迟、高可靠性加速架构，实现1080P图像的实时目标检测（延迟≤20ms），满足车规级时序与可靠性要求，

成仿真验证、板级部署与性能优化，交付完整设计文档。
涉及技术：模型量化、AI加速IP核应用、车载场景适配、时序/资源优化、仿真与调试技巧、车规级设计规范。
实战项目2：边缘端INT4量化ResNet18图像识别FPGA加速模块设计（高频）
项目需求：基于FPGA设计边缘端图像识别AI加速模块，对ResNet18进行剪枝与INT4量化，设计低功耗加速架构，实现边缘端图像识别的快速推理
- （吞吐量≥30FPS），适配边缘端小体积、低功耗需求，开发仿真脚本，完成板级部署与调试，编写符合企业规范的设计与验证报告。
- 涉及技术：模型剪枝与低比特量化、FPGA加速架构设计、低功耗优化、边缘端部署、仿真验证、企业级设计规范。

如果您想学习本课程，请预约报名
如果没找到合适的课程或有特殊培训需求，请订制培训
除培训外，同时提供相关技术咨询与技术支持服务，有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击

服务优势：
丰富专家资源，精准匹配相关行业，相关项目技术精英，面向用户实际需求，针对性培训或咨询，互动式交流，案例教学，精品小班，实际工程项目经验分享，快捷高效，节省时间与金钱，少走弯路与错路。

专家力量：
中国科学院相关研究所高级研究人员
西门子，TI,vmware，MSC,Ansys，MDI，Mentor, candence,Altium,Atmel 、Freescale,达索，华为等
大型公司高级工程师，项目经理，技术支持专家
中科信软培训中心，资深专家或讲师
大多名牌大学，硕士以上学历，相关学历背景专业，理论素养高
多年实际项目实践，大型复杂项目实战案例分享，热情，乐于技术分享
针对客户实际需要，真实案例演示，互动式沟通，学有所值

报名表下载

点击进入报名表

联系我们更多>>

咨询电话：010-62883247

4007991916

咨询邮箱：soft@info-soft.cn

微信咨询

随时听讲课

聚焦技术实践