人工智能, 复杂系统图表示学习
研究方向/Research Interests
复杂电网图表示学习和拓扑的低维表示, Power Network Representation Learning and Low-Dimension Representation for Topology
大模型在电了系统应用
从物理和复杂系统视角下看待电网中的计算不可约性,界定大模型在电力决策中的认知边界
随着大语言模型(LLM)在推理、编程辅助与跨模态生成方面快速进化,电力系统领域不可避免地会提出一个尖锐问题:它能否绕开复杂的仿真与迭代,直接给出 AC-OPF 的最优解,或对暂态稳定给出可置信的确定性结论?要回答这个问题,必须先把边界说清楚:电网不是“文本世界”,它受物理规律支配,而物理规律最不讲情面。这里的核心概念是计算不可约性。其直观含义是,对某些系统而言,未来状态或最优解并不存在普适的跳步公式;想获得可信的精确结果,就必须沿着系统的时空演化与约束结构逐步推进,该积分就积分,该迭代就迭代,该触发就触发。LLM 的强项是模式归纳与知识合成,但它并不天然拥有“替代演化过程”的能力。在电力系统里,这种不可约性主要集中体现在三类关键任务上。第一类是暂态稳定与保护连锁的路径敏感性。电网动态是强非线性系统,再叠加故障切除、限幅、保护动作等离散事件,本质上形成连续动力学 + 离散事件的混合系统。此时,微小的初值差异、测量扰动或逻辑分叉,就可能引导系统走向截然不同的演化轨迹。对于这类问题,统计规律可以提供经验性的快判断,但要给出可追责的结论,仍离不开时间域仿真与事件序列的精细刻画。第二类是 AC-OPF 的边界精确性。AC-OPF 同时面临非凸解空间与大量硬约束(电压、无功、潮流/电流、热稳、相角差、设备边界等),并且最优解往往贴着拥塞边界“走钢丝”。深度学习模型确实能快速生成高质量候选解,显著改善冷启动与收敛速度;但要确保候选解在物理上严格可行、在约束边界上不越线、在目标上足够接近最优,仍需要求解器进行机理校验与边界搜索。换句话说,学习模型更像聪明的起跑器,而不是最终裁判。第三类是调度与控制的零冗余容错。电网运行遵循安全裕度原则,看起来 99% 的正确,在硬约束场景里可能等价于 1% 的灾难窗口。对这类任务,任何缺乏确定性保障的统计推断,都必须被可验证的计算环节闭环约束:要么由物理保真模型进行在线校验与修复,要么由可证明的安全机制(例如约束投影、屏蔽策略、保护逻辑)兜底。否则,看起来合理并不构成工程意义上的可信。
在电力 AI 的新范式下,LLM 最有潜力的定位是:把人类经验与工程流程结构化、自动化,提供高质量候选方案与启发式策略,并与求解器/仿真器/校验器形成组合式闭环——由后者承担不可约部分的严格验证与修正。真正值得探索的方向,也正在这里:不是幻想用 LLM 消灭不可约性,而是发展一种新的“计算”范式,让大模型把不可约计算用得更少、更快、更稳,把计算资源集中花在必须“跑一遍”的地方。
多智能体量子神经网络, Multi-Agent Quantum Neural Network focuses on optimizing capacity dispatch and data flow across highly heterogeneous and dynamic network environments, with the overarching goal of maximizing energy efficiency and ensuring resilient system operation.
量子优化和人工智能算法
物理信息神经网络(physics-informed neural network)深度学习电网暂态稳定在线预测,复杂信息物理电力网络(cyber-physics power network)级联故障演化规律, 和复杂电网级联故障统计力学,复杂物理系统/设备老化
生物系统启发电力系统优化: https://zhuanlan.zhihu.com/p/67797658
计算物理没有银弹,当物理模型=超强可解释性遇上 Physics-informed AI 的现实
工业 AI 领域有一个越来越流行的万能论证,我们是 physics-based model/physics-informed AI,所以更准确、更可解释。
你肯定听过这样的推销话术,我们的解决方案使用基于物理的模型(physics-based models),因此具有卓越的可解释性和准确性。听起来很诱人。毕竟,物理学代表了基本真理——自然法则,以及支配宇宙运行的方程。这句话听起来像常识,因为它借用了一个很强的心理锚点:物理=真理。但工程上更接近真相的版本是:计算物理本身极难,工业现场更难,所以不存在银弹。physics-based不是优势宣言,而是应该是一张对误差预算、可校准性和可运维性负责的对账单。
1) 计算物理为什么难。难的不止是方程,而是闭合与可辨识
在教科书里,物理模型通常被默认为闭合的。给定方程、参数、边界条件,就能算出结果。工业里最先崩掉的是这三个前提,1.闭合关系不完整,很多你关心的指标(质量等级、风味、可加工性、失效率、材料性能)并没有明确的第一性原理方程。2. 参数不可辨识,即便方程写得出来,也常常存在“多个参数组合产生相同输出”的不可辨识性,导致你永远在调参而不是在建模。3. 边界条件不稳定,结垢、腐蚀、阀门卡滞、传感器漂移、原料批次波动、操作员策略变化。这些都在动态改写你的边界。所以计算物理很难的真实含义是,难在把现实过程变成一个可定义、可闭合、可识别、可稳定求解的问题。
2) 物理模型在工业里常常变成成本中心
physics-based听起来像更省数据,但在工业里经常意味着把成本从数据学习转移到工程校准,1. 需要大量物性与机理参数(很多不可测、只能估),2. 需要持续校准(工况变化就得重新标定),3. 需要保证数值收敛与稳定性(现场不会因为你写了 PDE 就变温柔),4. 需要维护模型与装置的一致性(设备状态改变,模型就过期)因此,很多所谓的“物理模型落地”,最后落成了一个现实形态,耦合 PDE + 大量经验修正项 + 手工调参 + 版本难以维护。这不是物理错,而是工业的复杂性把优雅模型逼成了补丁系统。
3) 可解释性不是“有方程,而是可诊断、可追责、可运维
市场上把物理模型与可解释性绑定,是一个常见的偷换概念。在工程里,真正有价值的解释性不是我能写出方程,而是 1. 模型错了,你能否定位错因?2. 误差来自假设、参数漂移、测量噪声,还是未建模扰动?3. 修复路径是否可重复、可验证、可回归测试?4. 上线后漂移如何监测与更新?如果一个 physics-based 系统的解释性只能体现在“方程很复杂”,但无法支撑定位与维护,那它对运行团队并不更可解释,反而更像一个黑箱, 只是黑箱外面贴了一层“物理皮”。
4) 为什么数据驱动经常更准,它学的是装置实际在做什么
工业过程的真实规律,往往由这四类因素共同决定,1. 机理(physics),2. 操作策略(human & control logic),3. 设备健康状态(degradation)4. 原料与环境扰动(uncertainty)。纯物理模型常常只覆盖第 1 类,最多勉强补一点第 3 类。 而数据驱动模型的优势在于:它天然能吸收 2、3、4 类中大量“教科书没有写”的信息——夜班操作习惯、隐性约束、批次差异、阀门粘滞、慢漂移等。
因此很多工业预测任务里,你会反复看到一个结果:物理模型做到了“形式正确”,却做不到“现场准确”。
5) Physics-informed AI 的正确位置:不是用物理替代学习,而是用物理约束学习。 Physics-informed AI (PIML) 的真正价值,不在于用物理替代学习,而在于用物理约束学习。靠谱的 PIML 路线通常在以下三个维度发挥物理的价值,1. 作为归纳偏置(Inductive Bias): 将守恒律、单调性、对称性等“硬结构”注入神经网络,大幅降低模型对数据的依赖,防止其犯“违反常识”的低级错误,2. 作为安全包络(Safety Envelope): 利用物理可行域(Feasible Region)约束模型的输出空间,确保模型“再聪明也不越界”,这对于控制与调度任务至关重要,3. 作为弱监督与正则化(Weak Supervision): 利用物理残差(Physical Residuals)作为损失函数的一部分,在小样本或分布外(OOD)场景下提升模型的泛化能力。
一句话总结,Physics AI 的核心价值不是物理更高级,而是物理提供结构与边界,数据负责复杂与漂移。
基于神经算符代数微分方程求解方法,暂态过程演化.


基于图表示和人工智能高纬Manifold Shape计算和复杂动力学系统裕度计算.
现代深度学习常把性能与“无约束扩张”画上等号:更多参数、更多数据、更少限制。但生物大脑在严格的代谢约束下运行,却依然能轻松泛化。
我们提出一个问题:如果这些物理约束不是障碍,而是特性呢?我们认为,耗散性约束本质上充当了一种关键的“时间归纳偏置”。通过分析信号传播的相空间,我们发现了一个关键的“过渡区间”,它位于“混沌式扩张”和“静态耗散”之间的临界边缘。
这一过渡区间迫使系统从嘈杂的数据流中抽象出不变特征,从而带来:
• 鲁棒表征:能够泛化到未见过的动力学编码方式。
• 涌现结构:在不显式加入稀疏惩罚的情况下,自发形成结构化的感受野。
• 行为迁移:在机器人控制任务中实现对新物理环境的零样本(Zero-Shot)强化学习迁移。鲁棒的 AI 也许不只是靠“做大”,更在于掌握塑造学习地形的时间动力学规律。一个系统要学会泛化,就必须被约束。它必须在每一步都放下对当下的执念(耗散),才能在长期中存活(泛化)。

气象电力耦合复杂系统统计力学演化, 气象气候尺度下新型电力系统 Spatio-temporal Patterns between ENSO and Weather-related Power Outages in the Continental United States



ENSO人工智能气候预测模型 ,阿里达摩院气候预测比赛创新奖(第一个基于图神经网络的ENSO预测)
复杂网络信息流控制分层深度学习多智能体控制, 强化学习分布式优化控制,车网V2G和新能源微网深度强化学习调度策略,复杂风场多智能体人工智能调度
数据驱动人工智能复杂设备剩余寿命预测
基于BMS数据流在线智能电池状态预测和故障诊断, 新一代BMS人工智能多状态电池预测,电池老化价值动态评估,电池异常诊断,多时间时间尺度多智能体混合储能系统多智能体调度
长时储能(LDES)为何可能改写电力系统规则
长时储能不是“更大号电池”,而是电力系统在高比例风光条件下从“靠瞬时平衡”走向“靠时间平移与能量兜底”的关键基础设施。行业常用的口径把LDES理解为8小时以上,延伸到多日、跨周甚至跨季的储能能力,但也必须承认:LDES并没有全球统一的严格定义,不同地区会按系统需求与采购规则给出不同阈值。
为什么这件事会改变规则?因为在高风光渗透下,系统挑战会从调频/爬坡逐步升级为长时间能量缺口的可用容量(firm capacity)问题:你需要的不只是快,而是能撑得久、撑得住、成本还能算得过账。
1. 锂电BESS的价值真实且巨大,但主要发生在短时尺度
锂离子电池在电网侧已经证明了自己:调频、备用、削峰、短时能量搬运、快速响应——这些都是真金白银的系统服务。更直观的是成本进步:BloombergNEF 2025年调查显示,锂电池包均价降至约 108美元/kWh 的历史低位, 过去十多年显著下降趋势。
2. 但这里有个经常被忽略的“工程真相”:
锂电的成本优势主要在4小时左右的主战场,大量公开成本预测与工程统计也往往以4小时系统为基准讨论。当你把“好用的4小时工具”硬拉去做多日/跨季兜底,物理与经济边界就开始集体投反对票。
3. 为什么短时优势不能被外推成长时保障能力
1) 经济结构决定:时长越长,锂电越吃亏(能量成本线性堆高)
电网侧储能成本可以粗暴拆成两块,功率侧(kW)包括PCS/逆变器、并网、站用系统等;能量侧(kWh)包括电芯/电池簇、热管理、消防、安全冗余等。短时(1–4h)时,功率侧与系统集成还能“摊薄”;但一旦追求12h、24h甚至多日,能量侧成本几乎线性叠加,锂电就天然进入不擅长的区间。NREL关于LDES价值与经济性的研究明确指出:锂离子在多日时长下往往不具成本效益;并给出一个很刺眼的量级例子,到2050年情景下,12小时锂电系统可能超过2000美元/kW,24小时可能超过4000美元/kW。 这不是“某家电池厂不够努力”,而是技术路线在长时段被成本结构卡住了。
2) 工况与寿命约束:长时兜底意味着更苛刻的循环与日历老化压力
多日/跨季兜底不是每天“浅充浅放”的优雅生活,而往往对应极端天气、低风低光、连续阴雨等事件下的深度放电与高SOC驻留。此时锂电的寿命、容量衰减、热安全、退化不确定性都会变成系统规划必须付费的“隐含税”。
3) 系统层面:真正的长时储能往往是“能量容量大到离谱”的那一类
一个冷幽默式证据:全球电力储能的能量容量长期由抽水蓄能统治。IEA指出,2020年全球电力储能能力约 8500 GWh,其中抽水蓄能占90%以上。原因很朴素:长时能量搬运需要极大的能量容量,不是靠“更便宜一点的电芯”就能轻松跨过去的,而是需要在物理载体与成本曲线上具备“能量侧可规模化”的技术族群。
4. 把锂电当成解决风光间歇性的核心解法会带来哪些系统性风险
如果政策与资本叙事把锂电BESS定位成风光未来的兜底主力,通常会产生三类结构性后果:
1)投资与监管错配 → 可靠性与能源安全受损
短时储能解决的是小时级波动与峰谷,不是多日能量缺口。把两者混为一谈,最危险的结果是,看起来装机很美,极端事件来临时却发现撑不久。
2)关键矿物与供应链风险被低估
IEA在关键矿物报告中强调:在净零情景下,锂需求增长极快(到2040年可达显著倍增量级),并指出多种矿物供应链存在集中度与扩产不确定性。这意味着:当储能规模上到多日/跨季级别,你面对的不只是钱,还有材料、加工、地缘、环境与审批周期的硬约束。
3)挤出效应:把有限资金从真正的兜底能力上挤走
一旦市场把短时储能当成万能解,容易挤出对更关键基础设施的投入:包括可调度电源、输电通道、需求响应、以及真正面向10小时以上乃至多日的LDES技术路线(热储能、压缩空气、液流、氢/氨链条等)的研发与示范。
5. 更稳健的路线:短时用锂电,长时用长时技术组合,并把政策目标说清楚
更可行的策略不是“押注单一技术”,而是承认时间尺度分工。1–4小时,锂电BESS继续做强项(调频、削峰、快速备用、短周期能量搬运);10小时以上到多日,系统需要LDES能量侧可扩展的技术族群。美国DOE的Long Duration Storage Shot就把目标明确为:面向10小时以上储能,把平准化储能成本(LCOS)推进到约0.05美元/kWh量级(目标导向非常清晰:解决长时的经济性门槛)。
6. 跨季节:更像是“能源系统”而不只是“电力设备”的问题,往往需要与氢能、热网、工业过程、燃料链条协同规划。
一句话:别用短周期工具承担长周期任务。锂电是低碳电力体系里非常重要的一块砖,但把它当成多日/跨季终局方案,既不经济,也不稳健,最终会被系统边界条件纠偏。
热失控和热传递方向人工智能预测
Cell-to-Pack(CTP) 电池架构已经成为电动车动力电池领域最重要的结构变革之一。它的思路很直接,取消传统模组层(module layer),将电芯直接集成到电池包中。这样做的好处非常明显,结构更简化、零部件更少、体积利用率更高,系统层面的体积能量密度往往可以显著提升。很多讨论中,CTP 被视为动力电池从模组时代走向高度一体化时代的关键一步。但问题也恰恰出在这里。去掉的不只是模组,也去掉了热缓冲区、结构冗余和热设计自由度。模组层在传统电池包中并不只是一个机械组装单元,它同时也是热扩散路径、热隔离空间和冷却设计的中间层。一旦这些层级被压缩甚至移除,热量就不再有那么多可周转的空间。在高倍率充电、低温环境、局部散热不均或热边界恶化的条件下,CTP 架构的热问题会比传统 pack 设计更快暴露出来。CTP 最大的问题之一,不是有没有热,而是热更难走。很多人理解电池热管理时,会下意识认为问题只是发热量变大了。这并不完整。真正棘手的是,在 CTP 结构下,热量的产生、积聚、扩散和排出路径都变得更敏感。模组被取消后,热缓冲层减少。传统模组结构虽然会牺牲一部分空间利用率,但它也天然形成了额外的热扩散和热阻调节空间。取消模组之后,电芯间距、结构支撑和冷却界面的布局更紧凑,局部热点更容易形成。结构更紧凑,热耦合更强。电芯直接集成到 pack 后,相邻电芯之间、结构件之间、底板与冷板之间的热耦合变得更直接。一旦某一区域温升偏快,局部不均匀性更容易向周围传播。高倍率充电下,热问题不是线性增加。高 C-rate 工况下,电池内部极化、欧姆损耗和反应热会共同抬升温升速度。结构冗余越少,热扩散通道越有限,局部温差就越容易被放大。低温环境下,问题更复杂。低温并不意味着“更安全”。相反,低温会抬升内阻,使得充电过程中的不可逆热更突出,同时也可能诱发更强的局部非均匀性。也就是说,低环境温度 + 高充电倍率 往往是 CTP 热管理的高风险组合。
容量衰减,不等于能量衰减:电池老化评估重整
它点出了一个电池领域长期存在、但在很多工程应用里并没有被真正重视的问题,电芯老化通常按容量衰减(Ah)来报告,但系统真正感受到的往往是能量衰减(Wh。 这是会直接影响寿命判断、系统设计和商业决策的核心问题。在单体电芯测试、论文和规格书里,老化最常见的表征方式是容量随循环次数下降;但对电动车、储能系统和各种电池供能设备来说,真正决定可用性的指标,其实是输出了多少能量,而不是单纯输出了多少电量。因为能量不仅取决于容量,还取决于放电过程中的平均电压。 说得更直白一点,容量是 Ah,能量是 Wh。而 Wh = Ah × 电压。所以,当电池老化导致平均放电电压下降时,即便容量退化看起来还不算严重,实际可交付的能量也可能掉得更快。这并不是停留在概念讨论,而是比较了大量公开锂离子单体循环数据,覆盖不同正极化学体系、倍率和温度条件,直接对比了容量损失和能量损失的相对速率。结果很明确:放电能量衰减几乎总是比放电容量衰减更快,原因就在于平均电压也在发生变化。 更值得注意的是,在一些情况下,如果把寿命终点从容量保持率 80%改成能量保持率 80%,电池达到寿命终点的循环次数可能会最多提前约 15%。这意味着,如果系统设计者只盯着容量保持率,就可能对实际寿命产生明显高估。 结论看起来朴素,但影响力很强。因为在很多应用里,用户根本不关心你的电芯还能不能放出80%的Ah,用户关心的是,电动车还能跑多远,储能系统还能释放多少 kWh,峰谷套利还能不能算得过来,调频、备用、削峰填谷能力还能不能兑现。这些都更接近能量视角,而不是单纯的容量视角。
1. 为什么这个问题在工程里容易被忽略?
根本原因是,不同背景的人对容量这个词的理解并不一样。材料/化学工程师、电气工程师和电力工程师对容量的理解存在差异,而很多储能标准甚至使用了容量这个术语,却没有明确单位定义。这就带来一个现实问题,在材料层、单体层,大家习惯看 Ah;到了系统层、应用层、商业层,真正起作用的往往是 Wh 或 kWh。如果中间没有完成这个概念转换,设计链条就会断掉。换句话说,电芯评价语言和系统运营语言之间,经常不是无缝衔接的。
2. 对电池设计和储能应用有什么启发?
最值得行业反思的,不只是容量不等于能量这句话本身,而是它提醒我们,脱离应用场景谈电池指标,很容易把问题看偏。对于电池设计者来说,这意味着不能只优化容量保持率,还要关注老化过程中平均工作电压的演化。因为同样的容量衰减,若伴随更明显的平台下移,系统端的实际损失会更大。对于 BMS 和寿命预测模型开发者来说,这意味着健康状态评估不能只围绕 SOH展开,更应该建立面向应用的 能量衰减 或等效可用能量指标。仅用容量做寿命标签,在很多场景下是不够的。对于储能系统集成商和运营方来说,这意味着收益模型、运维策略和寿命保修逻辑都应该更谨慎。尤其在电网侧储能、工商业储能和高频充放电场景下,如果你高估了后期可交付能量,实际收益、可用容量和调度能力都可能被系统性高估。
3. 一个更扎实的判断标准
一直觉得电池老化评估不能只问:还能存多少电?更该问的是:在目标工况下,还能稳定交付多少有价值的能量?这两者并不一样。前者更像实验室指标。后者才更接近真实应用。所以,这篇文章的真正价值,不只是指出一个定义差异,而是在提醒整个行业,电池不是为指标而设计的,而是为应用而服务的。如果评价指标和应用目标脱节,那么再漂亮的单体数据,也可能在系统层面失真。
生成式人工智能赋能新一代电网规划方法与复杂材料正向设计合成
面向电池电解液的生成式 AI,从性质预测到逆向设计
液态电解液堪称锂电池的血液。它在正负极之间搬运离子,而配方本身几乎决定快充能力、低温性能、界面稳定性、循环寿命乃至安全边界。但电解液设计之所以难到离谱,核心原因是组合爆炸。溶剂、盐、添加剂的候选动辄几十上百种,且每一种都有浓度/摩尔比这个连续维度。一个直观的量级例子是:如果从 100 个候选里选 8 种组分、摩尔比按 5% 的步长离散,可能的配方数可达 10¹⁷ 量级。更棘手的是,你真正想要的目标往往互相打架:比如想要更高的离子电导率以支撑快充,但又希望溶剂化结构更“富阴离子”来获得稳定界面。这两者常常存在权衡。这类问题,传统靠经验和少量试验迭代的方法很难覆盖足够大的空间,也很难系统地处理多目标约束。
统一框架包括一套模型同时做正向预测和逆向生成的统一的生成式人工智能框架。把两件事连成闭环。正向预测(forward)给定电解液配方 ,预测关键性质(如电导率、阴离子比例等)。 逆向生成(inverse)给定目标性质 , 直接生成满足要求的配方候选这一步非常关键。电解液设计不是预测一个数就结束,而是要给出可配、可买、可做、可验证的配方。
正向预测包括分子级预训练 + 配方级表示学习 + 物理先验约束
预测模块思路,包括1. 先在分子层面预训练 GNN,先用 24 万+ 的单分子性质数据进行预训练,让模型学到分子结构—性质的通用表征能力。2. 再把分子嵌入聚合为电解液级表示,一个电解液是多组分混合物,组分顺序本不该影响结果。因此他们用置换不变(permutation-invariant)的注意力聚合机制,把多个分子的表示汇总成配方级表示——这点在混合物学习里属于必须对的结构性归纳偏置。3. 引入物理先验,避免不物理的预测。额外融入一个经验方程形式的先验,用来刻画电导率随温度与盐浓度变化的规律。好处是两点,1. 防止模型输出明显不符合物理常识的曲线和2. 让模型可以通过一次推理生成完整的温度—浓度响应曲线,而不是只给一个点。对工业/工程场景来说,这种物理可控 + 曲线可用的输出,通常比单点预测更有价值。
逆向生成包括条件扩散模型 + 多目标约束的引导式生成
生成模块需要可控性和可用性。条件扩散模型(conditional diffusion)给定目标(如电导率、阴离子比例),模型先生成对应的电解液嵌入,再把嵌入解码回具体的分子混合配方和 多目标 + 约束设计:用 classifier-guided diffusion 做引导。引入更多现实约束(比如“碳酸乙烯酯至少 20%”这类配方门槛),采用分类器引导的扩散(classifier-guided diffusion)。在生成过程中把样本往可行区域推,而不需要为每一类约束重新训练一个模型。
这对工程落地很关键。真实研发的约束是不断变化的,不重训也能加约束,才是生产力。训练数据与效果包括从 MD 到实验,再到分布外外推。训练策略是仿真 + 实验两条腿走路。可以在 10 万分子动力学(MD)模拟数据 上训练。再用 1 万+实验电导率测量 进行微调校准。最终,模型在电导率预测上达到 R² = 0.985,并且能生成超出训练分布的配方候选(也就是不只是“背题”,还能外推到新的组合区域)。这类结果的意义在于:生成模型不仅“能生成”,还确实能生成可验证、可工作的候选。
更大的意义是,混合物设计的通用范式电解液只是一个代表样例。更广泛地看,许多材料与化工问题本质上都是分子混合物设计,燃料配方, 聚合物共混,离子液体, 催化体系,添加剂体系,高分子链等同样面临空间巨大、相互作用复杂、多目标强约束、实验昂贵。





