News

Advancing solar and wind penetration in China through energy complementarity

原文链接：https://www.nature.com/articles/s41586-026-10570-z 补充材料：https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-026-10570-z/MediaObjects/41586_2026_10570_MOESM1_ESM.pdf 作者：Yuan Hu, Hou Jiang, Chuan Zhang, Jianlong Yuan, Mengting Zhang, Ling Yao, Qiang Chen, Jichao Wu, Hualong Zhang, Subin Ma, Xiang Li, Weiyu Zhang, Quanhua Dong, Congcong Wen, Gege Yin, Fan Zhang, Chaohui Yu, Zhijun Jin, Yu Liu 机构：北京大学、阿里巴巴达摩院、中国科学院地理资源所、武汉大学等发布日期：2026-05-20

速查卡

项目	内容
一句话总结	这篇论文先用遥感+深度学习做出中国首张全国级风光设施清单，再把它接入电力系统模型，量化“跨县/跨省风光互补”究竟能多吃下多少绿电。
大白话版	过去大家都知道“白天有太阳、晚上有风，西北多风光、东部多负荷”，但没人真的把全国所有风机和光伏板先数清再算电网。作者这次先把设施位置找出来，再回答“全国协同调度到底值多少钱”。
核心数字	`319,972` 处光伏设施、`91,609` 台风机；在 `80%` dispatchable flexibility 场景下，全国跨省协同可多消纳 `99.88 TWh` 风光电；约等于全国平均负荷 `120` 小时。
评级	B+ — 不是新模型架构突破，但属于“AI for infrastructure”很硬的系统级研究。
代码	代码与处理后的省级/县级时间序列放在 Zenodo；高分辨率地理矢量数据因基础设施敏感性不完全公开。
关键词	遥感识别、HRNet、VFNet、风光互补、跨省调度、可再生能源消纳、电力系统建模、AI for Science

核心 Insight

这篇论文最重要的 insight 不是“风和光能互补”，而是：

互补性这件事过去大多停留在假设部署、理想化资源图或省级粗颗粒统计上；
真正限制中国新能源进一步吃负荷的，不只是单点发电效率，而是“现有设施实际长在哪、长了多少、跟负荷中心的时空错配有多严重”；
一旦先把全国真实基础设施底图补齐，再把它接进统一的发电与调度框架，很多关于储能需求、跨省协同价值和输电优先级的争论就能从口号变成可计算问题。

过去同类工作常见的问题有两个。

第一，资源评估和系统评估是脱节的。研究者会用再分析数据说“这里风大、那里太阳强”，但并不知道 2022 年真实世界里到底已经建了多少风机、多少地面光伏、多少屋顶光伏。于是研究结果常常是“理论最优部署”，而不是“在既有基础设施上还能挖出多少系统收益”。

第二，互补性常被过度局部化理解。很多讨论停在“同一个县里白天太阳、晚上有风”的日内互补，或者“相邻省份可以互济”。但这篇论文要证明的是，真正大的系统收益来自空间尺度的不断扩大：从同县，到跨县，到邻省，到全国跨省配对，互补带来的波动平滑与消纳提升会持续放大。

为什么这个想法成立？

因为风光波动本来就不是完全同步的，而且中国的资源禀赋和负荷中心天然分离：西北、华北、东北是资源大头，东部沿海和中部是消费大头。只要输电、调度和灵活性资源允许更大范围协调，系统就能把一个区域的“弃风弃光时刻”变成另一个区域的“补负荷时刻”。作者真正贡献的是把这个常识第一次压到了真实设施清单和全国统一算账框架上。

方法详解

整体架构

整篇论文的方法可以拆成两段：

高分辨率卫星影像
  → 深度学习识别风机/光伏设施
  → 全国设施清单 + 装机容量估算
  → 结合 ERA5 重建县级小时发电序列
  → 计算县级互补性指标
  → 上卷到省级调度/消纳模型
  → 比较不同空间协调策略下的新能源渗透率与灵活性需求

前半段是“看见世界”，后半段是“计算系统价值”。

组件 1：全国级风机/光伏设施识别

做什么： 先从 0.5 米分辨率卫星影像中找出全国真实存在的光伏设施和风机。

怎么做：

数据源：2022 年覆盖中国全境的 Google Level 18 影像，总量 7.56 TB。
标注：27,174 张图像做光伏多边形标注，11,000 张图像做风机框标注，每张图 1024×1024 像素。
划分：8:2 训练/测试；光伏训练样本 21,679、测试 5,495；风机训练样本 8,800、测试 2,200。
模型：
- 光伏：HRNet 语义分割，先分割像素，再矢量化成光伏 polygon。
- 风机：VFNet 目标检测，直接输出风机 bounding boxes。
算力：
- 风机检测：32 张 V100，11,520 GPU-hours
- 光伏分割：5 张 T4，2,520 GPU-hours
后处理：全国人工复核，去掉误检；对漏检区域再用 0.5 米分辨率吉林一号卫星影像补跑一次，提高 recall。

关键结果：

风机检测验证集 mAP = 0.956
光伏分割验证集 mIoU ≈ 0.85
最终识别出 319,972 处光伏设施、91,609 台风机

这里最值得注意的是作者没有停在“模型分数好看”。真正重的是全国范围人工复核+补推理。这一步非常土，但也非常关键，因为后面所有系统结论都建立在这个底图上。若底图漏得厉害，后面电力系统推演就是空中楼阁。

组件 2：把遥感对象变成发电对象

光把设施圈出来还不够，还要估算它们能发多少电。

作者区分了两类光伏：

开阔地面光伏（open-field）
屋顶光伏（rooftop）

分类方法是把光伏 polygon 与 settlement / building footprint 数据叠加：落在建成区且与建筑轮廓相交的，归到 rooftop；其余归到 open-field。

然后对两类光伏分别建模：

地面光伏：默认南向固定倾角，倾角随纬度变化；无遮挡；SVF = 1
屋顶光伏：显式建 skyline profile，考虑周边建筑遮挡、sky view factor 和 urban canyon 的 ground albedo

组件 3：POA 辐照度与光伏出力重建

补充材料给出了用于小时级光伏发电重建的 plane-of-array irradiance 公式：

POA_{beam} = R_{dir} \frac{\cos(\theta_i)}{\cos(\theta_z)}

POA_{dif} = R_s(0.012\theta_z - 0.04)\frac{(1-\cos\beta)}{2} + R_{dif}\frac{(1+\cos\beta)}{2}

POA_{ref} = \rho_g R_s \frac{(1-\cos\beta)}{2}

其中：

$\theta_i$ ：入射角
$\theta_z$ ：太阳天顶角
$\beta$ ：组件倾角
$\rho_g$ ：地表反照率
$R_s$ ：总短波辐照
$R_{dir}$ ：直射辐照
$R_{dif} = R_s - R_{dir}$ ：散射辐照

直觉上，这三个量分别表示：

太阳直射打到板子上的那部分；
天空漫散射补进来的那部分；
地面反射回来的那部分。

屋顶场景比地面场景复杂，是因为同样的太阳角度，城市建筑会吃掉一部分直射与天空视野。作者进一步定义 skyline angle：

\alpha(\phi) = \arctan\left(\frac{H_b - H_{roof}}{d(\phi)}\right)

再用 logistic 形式得到时变遮挡系数：

S(\tau) = \sigma\left(\frac{\alpha_{eff}(\tau) - EL(\tau)}{\epsilon}\right)

这套东西的意义是：它不是在做“全国平均一块板子”的发电估算，而是在尽可能把不同安装形态的几何差异吃进去。

组件 4：县级互补性指标

作者在县级层面重建风电/光伏小时发电序列后，用 Kendall rank correlation $\tau$ 来衡量互补性。

为什么用 Kendall 而不是普通 Pearson？

因为这里更关心“高低变化的排序是否反向一致”，而不只是线性关系强弱。对发电互补来说，某个时段风高光低、另一个时段光高风低，这种序关系比绝对值是否线性更重要。

如果两个序列相关性越负，说明互补性越强：

白天光伏起来时，风可能较弱；
夜里或另一季节风起来时，光伏又下去；
合起来以后总波动会比单独任何一种更平。

作者不仅算“同一个县里风光互补”，还算：

solar-source strategy：从光伏主县去找最匹配的风电县
wind-source strategy：从风电主县去找最匹配的光伏县

这个设计很重要，因为它把问题从“本地资源自平衡”推进到“跨空间配对”。

组件 5：省级渗透率模拟与四种空间协调策略

前面算完县级互补后，作者把结果进一步送进省级/全国层面的新能源消纳模拟。

论文的核心不是比模型架构，而是比四种空间协调策略：

Strategy A：更局部的同地或近地配对
Strategy B：邻近省份配对
Strategy C：全国范围的最优跨省配对
Strategy D：更完全的全国一体化整合

论文最关键的结论之一是：随着空间协调范围增大，消纳能力稳定提升，而且 C 已经非常接近 D。这意味着“先做全国最优跨省配对”已经能拿到大部分收益，不一定非要一步走到最理想化的完全整合系统。

训练与计算细节

维度	细节
影像数据	2022 年 Google Level 18，0.5m 分辨率，7.56 TB
光伏模型	HRNet + MMSegmentation
风机模型	VFNet + MMDetection
风机训练	AdamW，学习率 `1e-4`，batch size 16，48 epochs
光伏训练	SGD，学习率 `0.01`，batch size 16，50 epochs
风机算力	32×V100，11,520 GPU-hours
光伏算力	5×T4，2,520 GPU-hours
人工质检	全国逐省可视化核验，约 30 person-days

这张表已经说明了一点：这不是“把一个现成遥感模型微调一下”的轻量工作，而是重数据、重工程、重人工质检的基础设施级项目。

与现有工作的关键区别

维度	过去常见做法	本文方法	为什么更好
设施底图	假设性部署或粗颗粒统计	全国真实设施清单	不再只算理想世界，而是算 2022 年中国真实世界
空间粒度	省级/区域级为主	县级设施 → 省级系统	能先捕捉局地互补，再上卷到系统协调
光伏建模	粗略容量系数	区分屋顶/地面，考虑遮挡	更接近真实部署结构
互补分析	偏资源潜力讨论	配对策略 + 调度收益量化	直接回答“对系统值多少钱”
AI 角色	辅助可视化	设施识别是全链路起点	AI 真正进入了能源底图生产环节

实验结果

主结果：扩大空间协调范围，消纳量稳定上升

补充材料给出了在 flexibility = 0.8 时四种策略的基线结果：

策略	可服务的风光发电量（TWh）	相对 A 的增量	解释
A	1003.80	—	更局部的协调方式
B	1075.43	+71.63	邻近/区域协同已有明显收益
C	1103.68	+99.88	全国最优跨省配对收益最大头基本拿到
D	1103.89	+100.09	几乎与 C 持平

解读：

从 A 到 B，说明“从本地看问题”升级到“跨区域互济”，系统已经显著变好；
从 B 到 C，再多拿 28.25 TWh，说明全国尺度协调确实还能继续榨收益；
从 C 到 D 只多 0.21 TWh，是整篇论文最有政策含义的一组数字：很多收益并不需要完美理想化全国统一市场才出现，先把跨省最优配对做好，已经能拿到几乎全部边际好处。

论文 headline 结果

指标	数值	含义
额外有效渗透量	`99.88 TWh`	在 80% dispatchable flexibility 场景下，全国跨省协调相对局部方案能多吃下的风光电
占总风光发电比例	`9.1%`	不是小修小补，而是接近一成的系统级增益
折算全国平均负荷	约 `120 h`	这个量纲更直观：相当于为全国平均负荷额外供电 120 小时

灵敏度与稳健性结果

补充材料里有三类稳健性分析值得注意。

15 分钟分辨率敏感性：
- 更细时间分辨率会让局部策略更吃储能；
- 但更大范围协调（C、D）的优势基本不变。
2000–2022 多年气象稳定性：
- Kendall $\tau$ 的年际 IQR 很小；
- 省级系统结果也只在几十 TWh 的窄区间内浮动；
- 说明这不是碰巧挑中某一年天气的偶然结论。
容量估算偏差敏感性：
- 在不同 solar/wind 容量扰动下，A/B/C/D 的排序保持不变；
- C 仍然稳定逼近 D。

“不是只有边缘县才互补”

补充材料里一个容易被忽略但很重要的点是：高互补性并不只发生在发电量很小的边缘县。作者举例说，最佳配对县既包含年发电只有 3.8 TWh/yr 的小玩家，也包含超过 2,900 TWh/yr 的大风电 hub。换句话说，互补性不是小样本偶然，而是大系统结构特征。

复现评估

维度	评分(1-5)	详细说明
数据可得性	⭐⭐⭐	省级/县级时间序列、配置文件和部分示例数据公开，但最关键的高分辨率地理设施数据因敏感性不完全开放。
代码可得性	⭐⭐⭐⭐	论文明确给出 Zenodo，配置文件与分析脚本可得，复现实验逻辑比很多 Nature 文章透明。
算力需求	⭐⭐	全国级遥感推理和再建模很吃资源，个人基本无望完整复刻，实验室/企业可做局部复现。
工程复杂度	⭐⭐	遥感识别、GIS 处理、功率重建、电力系统仿真链条都很长，门槛高。
预期收益	⭐⭐⭐⭐⭐	对能源规划、设施普查、电网协同和 AI for infrastructure 都很有实用价值。

复现建议：

最现实的复现路径，不是上来就重建全国，而是：

选一个省或几个资源差异明显的省份；
先复现“设施识别 + 容量估算”；
再复现县级小时发电曲线；
最后验证 A/B/C 类空间配对策略在局部系统上的收益排序是否稳定。

批判性分析

论文承认的局限

从正文与补充材料看，至少有三类局限：

高分辨率设施矢量数据无法完全公开，限制外部完全复核；
容量估算会受安装密度、倾角和遥感识别误差影响；
基于 ERA5 的 bottom-up 发电重建没有直接纳入真实运维行为，如维护停机、真实弃电、设备老化等。

我们额外看到的问题

它证明了“协调有价值”，但没有完整解决“协调怎么落地”。 从 C 接近 D 可以推出跨省协调很值钱，但现实里卡人的通常不是算不出来，而是省间交易、输电定价、调度权责和市场机制。论文对这一层只能触及，不能解决。
系统模型强调电量与波动，未充分展开经济性。 论文已经做了 transmission-cost-aware 的敏感性分析，但总体仍偏“物理可行性 + 渗透率收益”，没有展开更细颗粒度的资本开支、线路扩建优先级、储能投资回报率对比。
AI 识别链条仍有“基础设施更新时滞”问题。 2022 年底图很强，但新能源建设是高速变化系统。如果不能持续更新，几个月后地图就会过时。真正产业化要解决的不是“一次性普查”，而是“高频更新”。

改进方向

动态更新版能源底图： 把这套识别链条做成季度或月度刷新，价值会远超一次性论文。 |
与真实调度日志对齐： 若能接入部分真实弃风弃光、外送和负荷响应数据，系统结论会更硬。 |
经济优化一体化： 把线路投资、储能 CAPEX、现货电价和省间交易规则都揉进来，才能进一步变成政策工具。 |

独立观察

这篇论文最像的不是传统“遥感识别论文”，也不是传统“电力系统论文”，而是一次很标准的“AI 把基础设施观测层补齐，然后把上层优化问题从经验判断推向可计算”的范式示范。
达摩院在这里的角色很值得盯。它不是单纯提供模型，而是把云算力、视觉识别与行业问题绑定，走的是“AI 基础能力 → 行业底图生产 → 系统级决策输入”的路线。
如果这条路线继续往前走，电网、交通、水利、城市更新都会出现类似工作：先把物理世界做成 machine-readable inventory，再谈优化。

对领域的影响

短期看，这篇论文会提升两个方向的可信度：

AI for infrastructure 不是只能做 demo，它可以直接生成国家级资产底图；
中国新能源系统的下一段红利，不一定只来自多建板子和多上风机，更来自更大范围的协调与调度。

中期看，它会推动更多人重估“全国统一能源数据底座”的价值。不是只有模型训练才需要大规模数据，能源基础设施治理同样需要。

长期看，这类研究最有可能改变的是决策习惯：未来关于输电、储能、消纳和区域协调的争论，越来越会要求先拿出真实底图和系统仿真，而不是继续停在经验直觉和粗颗粒报表层面。

对动动来说，这篇文章最值得记住的一句话不是“Nature 发了篇 AI 论文”，而是：AI 已经开始从“解释新能源”走向“编排新能源”。