
|
课程培训
|
电力行业强化学习培训
模块 1|强化学习在电⼒系统中“到底解决什么问题” ᆏ 电⼒系统中三类“天然 RL 问题” 场景 传统⽅法 RL 优势 储能充放电 MPC / 规则 ⾮线性、多⽬标、长期收益 负荷/需求响应 线性规划 ⽤户⾏为不确定 配电⽹电压/⽆功 OPF 快速近似、在线决策 ᆐ RL 与传统控制 / 优化的关系(⼯程师版) RL ≈ ⾃学习的策略搜索器 MPC ≈ 短视但稳定 RL 的核⼼价值 模型不准 ⽬标函数难写 长期收益压倒短期最优 模块 2|强化学习的⼯程化最⼩知识集 只讲 4 个概念(不多不少) 1. 状态(State) �� 电⼒系统中 = 你在线能测到的量 2. 动作(Action) �� = 你真的“能下发”的控制指令 3. 奖励(Reward) �� = KPI 的数学化(极难,也是 80% 失败原因) 4. 环境(Environment) �� = 仿真器 / 历史回放 / 数字孪⽣ RL 算法只保留 3 类(⼯程常⽤)PROFESSEUR : M.DA ROS BTS SIO BORDEAUX - LYCÉE GUSTAVE EIFFEL ✦ 2 / 4 ✦ 类别 算法 适⽤场景 类别 算法 适⽤场景 离散 DQN 开关、档位、策略选择 连续 PPO / SAC 储能、⽆功、电压 多智能体 MADDPG 多节点、多设备 模块 3|失败案例与风险 RL 在电⼒系统⾥常见 5 个坑 1. 奖励函数“作弊型最优” 2. 仿真器与真实系统分布漂移 3. 策略不稳定(安全事故) 4. 训练可⾏ ≠ 部署可⾏ 5. RL 被当成“黑盒 AI” 模块 4|开源项⽬速览 & Demo �� 必⽤基础框架 Python 3.9+ Gymnasium Stable-Baselines3 PyTorch 1 Grid2Op(强烈推荐) 法国 RTE 官⽅ 电⼒调度 / 拓扑 / 安全约束 输配电 拓扑重构 安全控制 2 CityLearn(储能 + 负荷)PROFESSEUR : M.DA ROS BTS SIO BORDEAUX - LYCÉE GUSTAVE EIFFEL 多建筑储能调度 天然 RL 场景 PPO/MARL 成熟案例 3 OpenAI Gym + ⾃定义环境(教学⽤) 快速造轮⼦ 为 Day 2 做铺垫 实操⽬标(⾮常具体) ⽤ PPO 控制⼀个储能系统,在负荷+电价波动下最⼤化长期收益 模块 5|实操 1电⼒ RL 最⼩闭环 做什么 ⼿写⼀个 储能调度 Gym 环境 包含 状态负荷、电价、SOC 动作充 / 放 奖励收益 - 惩罚 模块 6|实操 2PPO 训练 + 调参 内容 ⽤ Stable-Baselines3 训练 PPO 看 reward 收敛 SOC ⾏为是否合理 对⽐ 规则策略 vs RLPROFESSEUR : M.DA ROS BTS SIO BORDEAUX - LYCÉE GUSTAVE EIFFEL 模块 7|实操 3引⼊真实约束 加⼊现实因素 SOC 上下限 充放电效率 动作平滑惩罚 电⽹约束(简化) 模块 8|如何从 Demo ⾛向⽣产 ⼯程落地 Checklist 离线训练 + 在线推理 Shadow mode(影⼦策略) ⼈⼯兜底规则 策略回滚机制 监控指标(reward ≠ 安全)
如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训 除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916 技术服务需求表下载请点击 服务优势: 丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。 专家力量: 中国科学院相关研究所高级研究人员 西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等 大型公司高级工程师,项目经理,技术支持专家 中科信软培训中心,资深专家或讲师 大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高 多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享 针对客户实际需要,真实案例演示,互动式沟通,学有所值 |
|