Processing math: 100%

基于改进条件生成扩散模型的新能源日前场景生成方法

王长刚, 刘伟, 曹宇, 梁栋, 李扬, 莫静山

王长刚, 刘伟, 曹宇, 梁栋, 李扬, 莫静山. 基于改进条件生成扩散模型的新能源日前场景生成方法[J]. 电网技术, 2025, 49(4): 1358-1368. DOI: 10.13335/j.1000-3673.pst.2024.1399
引用本文: 王长刚, 刘伟, 曹宇, 梁栋, 李扬, 莫静山. 基于改进条件生成扩散模型的新能源日前场景生成方法[J]. 电网技术, 2025, 49(4): 1358-1368. DOI: 10.13335/j.1000-3673.pst.2024.1399
WANG Changgang, LIU Wei, CAO Yu, LIANG Dong, LI Yang, MO Jingshan. The Day-ahead Scenario Generation Method for New Energy Based on An Improved Conditional Generative Diffusion Model[J]. Power System Technology, 2025, 49(4): 1358-1368. DOI: 10.13335/j.1000-3673.pst.2024.1399
Citation: WANG Changgang, LIU Wei, CAO Yu, LIANG Dong, LI Yang, MO Jingshan. The Day-ahead Scenario Generation Method for New Energy Based on An Improved Conditional Generative Diffusion Model[J]. Power System Technology, 2025, 49(4): 1358-1368. DOI: 10.13335/j.1000-3673.pst.2024.1399

基于改进条件生成扩散模型的新能源日前场景生成方法

基金项目: 

国家自然科学基金项目 52307084

详细信息
    作者简介:

    王长刚(1987),男,博士,讲师,研究方向为电力系统稳定与控制,E-mail:wangcg@neepu.edu.cn

    刘伟(2001),男,硕士研究生,研究方向为人工智能在电力系统中的应用,E-mail: 2202300116@neepu.edu.cn

    通讯作者:

    曹宇(1986),男,通信作者,博士,教授,研究方向为高比例可再生能源并网的电力系统优化调度,E-mail:ycao@neepu.edu.cn

  • 中图分类号: TM715

The Day-ahead Scenario Generation Method for New Energy Based on An Improved Conditional Generative Diffusion Model

Funds: 

National Natural Science Foundation of China 52307084

  • 摘要: 在新能源发电占比不断提高的背景下,如何准确生成新能源出力场景对电力系统日前调度至关重要。基于深度学习的场景生成方法能够完成上述任务,但其黑盒性质使之存在可解释性差等问题。对此,文章提出一种基于改进条件生成扩散模型的新能源日前场景生成方法。该方法的构建基于马尔可夫链和变分推理的理论框架,先通过扩散过程将历史数据转化为纯噪声,再由条件信息引导去噪过程从而生成满足条件分布的场景。并改进噪声表为余弦形式,提高生成场景质量。最后,将方法应用于实际风光出力数据中,结果表明,该方法能够有效生成新能源出力场景,且适应性较好。
    Abstract: In the context of the rising share of new energy generation, accurately generating new energy output scenarios is crucial for day-ahead power system scheduling. Deep learning-based scenario generation methods can address this need, but their black-box nature raises concerns about interpretability. To tackle this issue, this paper introduces a method for day-ahead new energy scenario generation based on an improved conditional generative diffusion model. This method is built on the theoretical framework of Markov chains and variational inference. It first transforms historical data into pure noise through a diffusion process, then uses conditional information to guide the denoising process, ultimately generating scenarios that satisfy the conditional distribution. Additionally, the noise table is improved to a cosine form, enhancing the quality of the generated scenarios. When applied to actual wind and solar output data, the results demonstrate that this method effectively generates new energy output scenarios with good adaptability.
  • 随着“双碳”目标的提出,我国的能源结构逐渐的从化石能源向新能源转型[1]。近年来,我国可再生能源呈现出高比例跃升发展的势头[2]。截至2024年3月底,全国可再生能源装机达到15.85亿kW,同比增长26%,约占我国总装机的52.9%,其中,风电和光伏发电之和突破11亿kW[3]。在当前新能源发电占比不断提高的背景下,如何有效的描述新能源的不确定性对于电力系统的规划和稳定安全运行至关重要。

    目前,通常使用场景分析法来描述风电光伏出力的波动性[4]。该方法基于历史数据、统计分析、建立模型等来生成一系列可能发生的场景。由于日前风光出力场景是电力系统进行日前优化调度的关键依据,通过生成符合实际出力特性的场景,可以更好地预测风电和光伏的输出,从而优化电力系统的调度计划,以提高电力系统调度对其不确定性的鲁棒性。因此,如何构建准确的场景集成为当前研究新能源不确定性的一个重要方向。

    现如今,国内外学者已开展了新能源场景生成的大量研究,场景生成问题可以分为不确定性建模、时间序列建模以及抽样方法3类[5]。其中,构建风光出力不确定性模型是研究场景生成的基础,现有方法主要有物理方法[6]、统计学方法[7-10]等。文献[6]考虑到太阳辐射和温度是光伏出力的两个最大的影响因素,建立了基于不确定理论的太阳辐射值预测模型。文献[7-8]使用正态分布,文献[9]使用Beta分布,文献[10]使用Weibull分布来对风光出力的概率分布进行假设,但这些方法仅通过改变概率分布中某些参数来拟合数据,难以描述风光出力的高维非线性特征。因此,一系列考虑时空相关性的方法被提出,常见针对时间序列建模方法有场景树法、马尔可夫链法等。文献[11]采用Markov链的方法,考虑误差状态的时间关联性,利用马尔可夫链模型来描述不确定单元出力误差在时间轴上的变化过程。文献[12]根据场景树的方法,构造风光出力的最优分位点,合理划分整个调度区间,在子区间内遍历全部场景,形成场景集。但是不确定性模型所包含的概率信息无法直接应用于电力系统优化调度问题,通常需要使用抽样方法获得初始场景集。常用的抽样方法主要有蒙特卡洛抽样和拉丁超立方抽样方法[13]

    随着人工智能技术的不断发展,基于深度学习的生成模型在新能源的场景生成方向中的到了广泛的应用。主要包括变分编码器(variational auto- encoder,VAE)和生成对抗网络(generative adversarial networks,GAN)两类。文献[14]提出了一种基于条件变分自动编码器的风电光伏出力随机场景生成方法,其可以根据one-hot编码生成指定标签下的场景。文献[15]首次将生成对抗网络用于新能源场景生成。通过生成器与判别器两个独立深度学习网络之间的相互博弈,来提高生成器生成样本的真实性。文献[16]提出了条件生成对抗网络,将日前预测值作为条件,学习满足条件噪声分布与场景集的映射关系,并且采用Wasserstein距离作为判别器损失函数,提高了场景生成质量。文献[17]提出了改进条件生成对抗网络,耦合卷积运算局部泛化能力与Transformer全局注意力机制,建立了适应于提取多种分布式电源特征的CGAN模型,可以可控地生成场景。

    目前为止,尽管新能源场景生成技术有了很大的成果,但仍具有以下的问题:1)传统的场景生成方法通常需要对数据进行先验假设,且大多数模型仅针对某一特征分析,在多变的实际环境中很难找到广泛适用的模型;2)基于深度学习的方法使用数据驱动的方式通过神经网络自适应学习数据的内在关系,适应性较好,但大多为黑盒模型,潜在空间与生成场景之间的关系未知,可解释性较差。

    针对上述问题,本文提出改进条件生成扩散模型的新能源场景生成方法。该方法将历史实测数据与日前预测数据分别作为真实样本与条件输入模型,首先通过扩散过程将输入的历史实测数据变为纯噪声,其次在通过条件信息引导去噪过程逐渐的去除噪声,以生成满足条件分布的数据。通过模型的训练,扩散模型可以学习到满足条件分布的预测噪声,从而可以生成蕴含条件的实际场景。对于该模型,使用基于马尔可夫链和变分推理的理论框架。在前向过程,通过定义的噪声表,可以明确每一步添加的噪声量,从而了解模型在每一步生成的不确定性。在反向过程,每一步的去噪基于上一步的结果,使得整个的生成过程更加透明。且通过变分下界最大化来训练模型,增加了可解释性。此外,本文将线性噪声表改进为余弦噪声表,提高了模型的适应性。最后,本文以实际的光伏、风电出力数据进行算例仿真,验证了本文所提出的改进条件生成扩散模型的有效性和适应性。

    生成扩散模型最早是由Jonathan Ho等人于2020年提出的一种深度学习方法[18],如附录A图A1所示为生成扩散模型的理论框图,主要用于计算机视觉、图像生成等领域。生成扩散模型是一个参数化的马尔可夫链,它使用变分推理进行训练,以产生与输入数据分布规律相匹配的样本。该方法主要由前向(扩散)过程、反向(去噪)过程与训练过程3部分组成。前向过程就是在原始数据中不断的添加噪声,直到数据变为无规律的纯噪声。接着通过反向过程逐步的去除噪声以恢复历史数据。在通过训练过程,扩散模型学习到实际数据的概率分布,从而可以生成符合实际分布规律的场景。基于生成扩散模型的新能源日前场景生成方法理论框图如图 1所示,以一天的光伏出力功率为例,令其为原始数据x0进行绘制。

    图  1  基于生成扩散模型的新能源日前场景生成方法理论框图
    Figure  1.  Theoretical framework diagram of the day-ahead new energy scenario generation method based on the generative diffusion model

    若假设现有一组从高斯分布采样的噪声$ z $,生成扩散模型的最终目的就是对噪声$ z $进行变换,使其满足$ q({x_0}) $的原始概率分布。其主要是通过扩散、去噪与训练过程完成,下面将详细阐述这3个过程。

    1)前向过程。

    所谓前向过程,就是在每次迭代中,不断对原始数据$ {x_0} $添加高斯噪声,使其形成$ {x_1},{x_2}, \ldots ,{x_T} $,将这个过程参数化,可由下述公式表达:

    $$ q({x_{1:T}}|{x_0}): = \prod\limits_{t = 1}^T {q({x_t}|{x_{t - 1}})} $$ (1)
    $$ q({x_t}|{x_{t - 1}}) = N({x_t};\sqrt {1 - {\beta _t}} {x_{t - 1}},{\beta _t}I) $$ (2)

    式中:$ T $为扩散总步骤;$ N $为标准高斯分布函数;$ {\beta }_{t}ϵ\text{(}0,1\text{)} $为一个常数,控制着在每一步加入噪声的强度,并且$ {\beta _0} < {\beta _1} < \ldots < {\beta _{t - 1}} < {\beta _t} < \ldots < {\beta _T} $,即$ {\beta _t} $随着$ t $的增大逐渐增大,加入噪声的程度也就越来越大;$ q({x_t}|{x_{t - }}_1) $表示$ {x_t} $在$ {x_{t - 1}} $下的分布属于正态分布,其平均值为$ \sqrt {1 - {\beta _t}} {x_{t - 1}} $,方差为$ \beta _t^2 $。

    对(2)式利用重参数化技巧,可以改写为

    $$ {x_t} = \sqrt {1 - {\beta _t}} {x_{t - 1}} + \sqrt {{\beta _t}} {\varepsilon _{t - 1}} $$ (3)

    由(3)式可以直观的看出噪声的添加方式。并且,当前状态xt的概率分布仅依赖于上一个状态xt–1,这个性质被称为马尔可夫性质。因此,整个扩散过程可以看作是一个马尔可夫链。所以,若给出原始数据x0,就可以通过计算得到加噪任意$ t $次之后的xt

    $$ \left\{ \begin{array}{l} {\alpha _t} = 1 - {\beta _t} \hfill \\ {\overline \alpha _t} = \prod\limits_{t = 1}^T {(1 - {\beta _t})} \hfill \\ \end{array} \right. $$ (4)
    $$ {x_t} = \sqrt {{{\overline \alpha }_t}} {x_0} + \sqrt {1 - {{\overline \alpha }_t}} {\varepsilon _t} $$ (5)

    式中:$ {\epsilon }_{t}ϵN\text{(}0,I\text{)} $。

    根据式(5)就可通过一次采样获得状态$ t $时刻的样本。当$T \to \infty $时,$ {x_T} $的概率分布符合标准高斯噪声分布$ N(0,I) $。

    在前向过程中,依据马尔可夫链的性质,每一步的结果仅与上一步有关,且通过定义的噪声表,独立的添加高斯噪声,从而可明确每一步添加的噪声量,此外每一步均为高斯分布,因此可以很容易的通过可视化展现每一步的效果,观察数据逐渐被噪声覆盖的过程,从而了解模型在每一步生成的不确定性,增加了模型的可解释性。

    2)反向过程。

    对于反向过程,也称为逆扩散过程,就是通过一个满足噪声分布的xT来逐步的预测原始分布x0。反向过程仍然是一个马尔可夫链过程,所以其就是通过输入的xt来求xt–1的分布,即$ q({x_{t - 1}}|{x_t}) $。由贝叶斯公式可以得到:

    $$ q({x_{t - 1}}|{x_t}) = q({x_t}|{x_{t - 1}})\frac{{q({x_{t - 1}})}}{{q({x_t})}} $$ (6)

    对于式(6),$ q({x_t}|{x_{t - 1}}) $可以由前向过程直接求取出来,但$ q({x_{t - 1}}) $与$ q({x_t}) $是未知的,但可以加入一个先决条件$ q({x_0}) $,即:

    $$ q({x_{t - 1}}|{x_t},{x_0}) = q({x_t}|{x_{t - 1}},{x_0})\frac{{q({x_{t - 1}}|{x_0})}}{{q({x_t}|{x_0})}} $$ (7)

    对于式(7)可以利用重参数技巧将概率分布运算转化为指数运算,从而得到:

    $$ \begin{gathered} q({x_{t - 1}}|{x_t},{x_0}) \propto {\text{exp}}( - \frac{1}{2}[(\frac{{{\alpha _t}}}{{{\beta _t}}} + \frac{1}{{1 - {{\overline \alpha }_{t - 1}}}})x_{t - 1}^2 - \hfill \\ {\text{ }}(\frac{{2\sqrt {{\alpha _t}} }}{{{\beta _t}}}{x_t} + \frac{{2\sqrt {{{\overline \alpha }_{t - 1}}} }}{{1 - {{\overline \alpha }_{t - 1}}}}{x_0}){x_{t - 1}} - C({x_t},{x_0})] \hfill \\ \end{gathered} $$ (8)

    根据式(8),可以得到$ {x_{t - 1}} $的均值为$ {x_t} $与$ {x_0} $的函数,令其为$ \overline {{\mu _t}} ({x_t},{x_{\text{0}}}) $,即:

    $$ \overline {{\mu _t}} ({x_t},{x_0}) = \frac{{\sqrt {\alpha t} (1 - {{\overline \alpha }_{t - 1}})}}{{1 - \overline {{\alpha _t}} }}{x_t} + \frac{{\sqrt {{{\overline \alpha }_{t - 1}}} {\beta _t}}}{{1 - \overline {{\alpha _t}} }}{x_0} $$ (9)

    通过式(5)(8)(9)可以得到$ {x_{t - 1}} $的方差与均值分别为

    $$ \overline {{\beta _t}} = \frac{{1 - {{\overline \alpha }_{t - 1}}}}{{1 - \overline {{\alpha _t}} }} \cdot {\beta _t} $$ (10)
    $$ \overline {{\mu _t}} = \frac{1}{{\sqrt {{\alpha _t}} }}({x_t} - \frac{{1 - {\alpha _t}}}{{\sqrt {1 - \overline {{\alpha _t}} } }}{\varepsilon _t}) $$ (11)

    由上式可以看出,后验高斯分布的均值只与超参数xtεt有关,方差只与超参数有关。

    根据上述结果,可以给出生成扩散模型的反向过程的去噪方式为

    $$ {p_\theta }({x_{0:T}}): = p({x_T})\prod\limits_{t = 1}^T {{p_\theta }({x_{t - 1}}|{x_t})} $$ (12)
    $$ {p_\theta }({x_{t - 1}}|{x_t}): = N({x_{t - 1}};{\mu _\theta }({x_t},t),{\varepsilon _\theta }({x_t},t)) $$ (13)

    式中:$ {p_\theta }({x_{0:T}}) $表示近似$ q({x_{0:T}}) $的概率分布;$ {\mu _\theta }({x_t},t) $表示后验高斯分布的均值;$ {\varepsilon _\theta }({x_t},t) $表示$ t $时刻添加的噪声,是一个未知可学习的参数。

    在反向过程中,与前向过程类似,依据马尔可夫链的性质,可以对去噪过程中的每一步进行可视化,使得数据如何从噪声逐步恢复到原始数据的过程变得直观和透明。

    3)训练过程。

    对于训练过程,通过极大似然估计,来找到反向过程中马尔可夫链变换的概率分布。即最小化负对数似然:

    $$ L = {E_q}[ - \ln {p_\theta }({x_0})] $$ (14)

    式中:$ E $表示对应分布的期望值。这个过程类似变分编码过程,因此可以使用变分下界(variable lower boundary,VLB)来优化负对数似然,而变分下界在数学上有着明确的可解释性。

    KL (Kullback-Leibler)散度是一种不对称距离度量,主要用于比较两个概率分布的差异程度,即:

    $$ {L_t} = {D_{{\text{KL}}}}(q({x_{t - 1}}|{x_t}),{p_\theta }({x_{t - 1}}|{x_t})) $$ (15)
    $$ {E_{q({x_0})}}{p_\theta }({x_0}) \leqslant {L_{{\text{VLB}}}} = {E_{q({x_{1:T}}|{x_0})}}[\ln \frac{{q({x_{1:T}}|{x_0})}}{{{p_\theta }({x_{T:0}})}}] $$ (16)

    式中:$ {L_{{\text{VLB}}}} $表示变分下界。进一步可以写出交叉熵的上界,并化简可以得到:

    $$ \begin{array}{l} {L_{{\text{VLB}}}} = {E_q}\underbrace {[{D_{KL}}(q({x_T}|{x_0})||{p_\theta }({x_T}))}_{{L_T}} + \\ {\text{ }}\text{ }\sum\limits_{t = 2}^T {\underbrace {{D_{KL}}(q({x_{t - 1}}|{x_t},{x_0})||{p_\theta }({x_{t - 1}}|{x_t}))}_{{L_{t - 1}}} - } \\ {\text{ }}\text{ }\underbrace {\ln {p_\theta }({x_0}|{x_1})}_{{L_0}}] \\ \end{array} $$ (17)

    式中:$ {L_T} $表达为前向过程,因为没有可学习的参数,并且$ {x_T} $为纯噪声,因此LT可以视为常量,可以忽略;$ {L_0} $与$ {L_{t - }}_1 $表示为可优化的项,对于$ {L_0} $的优化效果远比不上$ {L_{t - }}_1 $,因此模型只对$ {L_{t - 1}} $进行优化;$ {L_{t - }}_1 $表示了$ q({x_{t - 1}}|{x_t},{x_0}) $与$ {p_\theta }({x_{t - 1}}|{x_t}) $两个分布的KL散度无限逼近。对于前者属于高斯分布,其方差与均值分别为式(10)(11)所示。对于后者也属于高斯分布,是神经网络所期望拟合的目标分布,其均值需要估计,而方差被设置为与$ {\beta _t} $有关的固定值。因此,$ {L_{t - }}_1 $的优化目标就是这两个分布均值的二范数,即:

    $$ \begin{array}{l}{L}_{t-1}={E}_{q}[||\overline{{\mu }_{t}}({x}_{t},{x}_{0})-{\mu }_{\theta }({x}_{t},t)|{|}^{2}]={E}_{{x}_{0},ϵ}\cdot \\ \text{ }[||\frac{1}{\sqrt{{\alpha }_{t}}}({x}_{t}({x}_{0},\epsilon )-\frac{{\beta }_{t}}{\sqrt{1-{\overline{\alpha }}_{t}}}\epsilon )-{\mu }_{\theta }({x}_{t}({x}_{0},\epsilon ),t)|{|}^{2}]\end{array} $$ (18)

    由上式可知,神经网络的优化目标就是使$ {\mu _\theta }({x_t},t) $近似$ \overline {{\mu _t}} ({x_t},{x_0}) $,对于$ {\mu _\theta } $,只有噪声$ {\varepsilon _\theta }({x_t},t) $未知,因此可以通过网络预测出噪声$ {\varepsilon _\theta } $,在通过计算得到均值。所以,最终训练过程的目标函数为

    $$ {L_t} = {{\rm E}_{{x_0},\varepsilon }}[||\varepsilon - {\varepsilon _\theta }(\sqrt {{{\overline \alpha }_t}} {x_0} + \sqrt {1 - {{\overline \alpha }_t}} \varepsilon ,t)|{|^2}] $$ (19)

    式中:$|| \cdot ||$表示L2范数;$ {\varepsilon _\theta } $表示预测的噪声。

    根据国家风电和光伏电站的并网标准,电站需要在电力系统调度机构规定时间内,提交次日的发电功率预测曲线[19-20]。因此,新能源的日前场景生成问题,可以被视为在已知日前预测信息的基础上,构建次日新能源出力分布。由此,本文提出了改进条件生成扩散模型(improve condition generative diffusion model,ICGDM)的新能源日前场景生成方法。通过将新能源预测信息作为条件参与模型训练,并在反向过程引导新能源出力场景的生成。

    在无条件情况下,反向过程$ {p_\theta }({x_{0:T}}) $用于定义最终的数据模型$ {p_\theta }({x_0}) $。那么,在考虑条件下,公式(12)(13)则扩展为

    $$ {p_\theta }({x_{0:T}}|c): = p({x_T})\prod\limits_{t = 1}^T {{p_\theta }({x_{t - 1}}|{x_t},c)} $$ (20)
    $$ {p_\theta }({x_{t - 1}}|{x_t},c): = N({x_{t - 1}};{\mu _\theta }({x_t},t|c),{\varepsilon _\theta }({x_t},t|c)) $$ (21)

    式中:$ c $表示条件信息。由于公式(21)与公式(13)具有相同的参数化,且两者之间的差异只是εθ的形式,因此可以使用无条件模型训练程序。但此时神经网络所预测的目标变为满足条件分布下的噪声$ {\varepsilon _\theta }({x_t},t,c) $,则此时损失函数为

    $$ {L_t} = {E_{{x_0},\varepsilon }}[||\varepsilon ({x_t},t) - {\varepsilon _\theta }({x_t},t,c)|{|^2}] $$ (22)

    上述公式的推导主要参考文献[21]。ICGDM在经过模型训练后,这时采样的噪声εθ 中就蕴含了条件信息,从而引导反向过程向着满足条件分布的方向去噪,从而生成满足条件分布的场景。

    由于在前向过程使用超参数βt来控制加入噪声强度。在原方法中,βt线性变化,如附录A图A2(a)所示。但这种线性添加噪声的方式对于某些样本并不适用,如图 2所示,以一天风电数据为原始样本,共进行扩散100步,每10步进行采样。在使用线性噪声表的方式添加噪声时,扩散后1/3部分基本全为纯噪声,这对后向采样生成数据是不利的。针对该问题,本文采用余弦噪声表的方式添加噪声,如附录A图A2(b)所示。

    图  2  不同加噪方式对比图
    Figure  2.  Comparison diagram of different noise adding modes

    首先,为了方便计算,定义${\overline \alpha _t}$为

    $$ \left\{ \begin{array}{l} {\overline \alpha _t} = \frac{{f(t)}}{{f(0)}} \hfill \\ f(t) = \cos {(\frac{{t/T + s}}{{1 + s}} \cdot \frac{\pi }{2})^2} \hfill \\ \end{array} \right. $$ (23)

    从而,可以得到$ {\beta _t} $为

    $$ {\beta _t} = 1 - \frac{{{{\overline \alpha }_t}}}{{{{\overline \alpha }_{t - 1}}}} $$ (24)

    此外,为了防止在扩散过程中当$ t = T $时出现奇点,令$ {\beta _t} < 0.999 $。而且使用一个小的偏移量$ s $,防止$ {\beta _t} $在$ t = 0 $时太小,增加了神经网络预测噪声的准确性。

    在使用余弦噪声表时,${\overline \alpha _t}$在中间的变化过程中有一个线性下降。而在当$ t = 0 $与$ t = T $时的极值附近变化很小,防止了噪声的突然变化。如图 3所示,为${\overline \alpha _t}$的变化对比图,图 3中纵轴代表${\overline \alpha _t}$的变化趋势,横轴代表扩散步数$ T $。从图 3中可以看出,使用线性噪声表${\overline \alpha _t}$更快的趋近于零,可以更快的破坏原始信息,使样本变为纯噪声。此外由图 2更加直观地表示了使用余弦噪声表添加噪声的方式。

    图  3  ${{\mathbf{\bar \alpha }}_{\mathbf{t}}}$的变化对比图
    Figure  3.  Comparison of changes in ${{\mathbf{\bar \alpha }}_{\mathbf{t}}}$

    在原方法中,主要使用UNet (U-shaped Network)网络来预测所添加的噪声$ {\varepsilon _\theta }({x_t},t) $,但是UNet网络主要适用于生物医学图像处理领域,对于新能源场景方面已然不是最优方法。因此,本文根据UNet网络,结合文献[22]设计神经网络结构如附录A图A3所示。

    首先,该神经网络结构基于膨胀卷积设计。膨胀卷积就是在跳过一些输入值的情况下,使卷积滤波器可以覆盖更大的输入区间。卷积核可以根据膨胀因子均匀的采样输入数据。这个过程类似UNet网络中的池化层,但与之不同的是,本方法输出的大小维度与输入相同。使用膨胀卷积的主要优点是可以明显的增加感受野,即在相同的计算成本下可以获取更大范围的信息。

    其次,整个神经网络由$ N $个残差层组成。每个残差层包含一个残差连接与跳跃连接。其可以防止在训练深层网络时出现梯度消失或爆炸等,并且,这些连接还可以加速网络的收敛。在该模型中,令每一个残差层中的膨胀因子翻倍,即$\{ 1,2,4, \ldots ,{2^{N - 1}}\} $。因此随着深度的增加,可以成指数级的增加膨胀卷积的感受野,且网络的整体容量也随之增加。

    接着,为了更好的挖掘历史数据之间的关系,使用门控激活单元作为非线性激活形式。该激活单元结合Sigmoid激活函数和双曲正切(tanh)激活函数,远比修正线性激活函数(ReLU)的效果好。门激活单元的公式如下:

    $$ \tanh ({W_{f,k}}*x) \odot \sigma ({W_{g,k}}*x) $$ (25)

    式中:$ W $是可学习的卷积滤波器;$ f $和$ g $分别表示滤波器和门;$ \sigma ( \cdot ) $表示Sigmoid算子;$ k $为残差层索引。在每个残差层中,都会有一个门控激活单元。

    然后,所预测噪声$ {\varepsilon _\theta }({x_t},t) $有个最大的特点,那就是他有两个输入。第一个是样本$ {x_t} $,第二个是时间步$ t $。因为$ {\varepsilon _\theta }({x_t},t) $必须针对不同的步数产生不同的输出,因此在模型中嵌入时间步$ t $是非常重要的。本文将时间步$ t $转换为包含不同频率的正弦和余弦向量,使用维度为64的向量来嵌入时间步$ t $,其公式如下:

    $$ \boldsymbol{t} = \left[ \begin{gathered} \sin ({10^{\frac{{0 \times 4}}{{31}}}}t) \cdots \sin ({10^{\frac{{31 \times 4}}{{31}}}}t), \hfill \\ \cos ({10^{\frac{{0 \times 4}}{{31}}}}t) \cdots \cos ({10^{\frac{{31 \times 4}}{{31}}}}t) \hfill \\ \end{gathered} \right] $$ (26)

    附录A图A3可以看出,在生成嵌入后,时间步首先经过两个全连接层,这两个层被所有残差层共享,因此参数也共享。接着,会再次通过一个全连接层,将前两层的输出映射到一个嵌入向量上,以作为每一个残差层时间步的输入。

    最后,为条件信息的嵌入。条件信息由输入特征向量形成,与时间步$ t $的嵌入类似,条件信息将经过3层结构嵌入到网络中。前两层为所有残差层共享的全连接层,如图A3中条件块正是条件信息经过这两个通用全连接层得到的输出。最后在通过一层一维卷积使条件信息嵌入网络,从而使条件信息有效影响神经网络的输出。该神经网络的具体参数如附录A表A1所示。

    基于改进条件生成扩散模型的新能源场景生成方法框架如图 4所示。

    图  4  基于改进条件生成扩散模型的新能源场景生成方法框架
    Figure  4.  New energy scenario generation method framework based on improved condition generation diffusion model

    步骤1,将光伏、风电的历史日前预测数据与实测数据作为该方法的输入。对原始数据进行预处理,将其归一化至[0, 1]。

    步骤2,通过改进条件生成扩散模型进行加噪处理。对于原始样本实测数据x0使用余弦噪声表的方式,通过式(5)对其依次加入满足标准高斯分布的噪声。直到满足设置的扩散步数,使原始分布变为纯噪声。

    步骤3,为训练过程。将加入噪声的样本xt、位置编码t与日前预测数据c输入到神经网络中,神经网络根据t生成正弦和余弦位置编码将三者进行结合,从而预测xt中所加入的噪声。将神经网络预测的满足条件分布的噪声与之前所采样的随机噪声求L2损失函数,计算梯度,根据Adam优化算法更新权重。重复这个过程,直至网络收敛,神经网络训练完成。

    步骤4,为新能源场景生成过程。从标准正态分布中采样出xT,然后根据神经网络所预测的满足条件分布的噪声,计算出样本噪声的均值,利用重参数技巧,得到$ {x_{t - }}_1 $。通过依次迭代,求解出满足条件分布的场景$ {x_0} $。

    为了保证生成场景的质量,场景生成应该最大程度地拟合新能源不确定性的特性。本文构建关于生成场景的有效性、准确性、随机性的评价体系,采用自相关系数、覆盖率、功率区间宽度、欧式距离平均值作为为评价指标。

    1)有效性。由于光照、风速等因素的影响,新能源出力应有较强的时间相关性,因此分析时序特征是验证日前生成场景有效性的关键[23]。本文选择自相关系数对生成场景进行分析验证。自相关系数反应了不同滞后时间τ的关联程度。随着滞后时间的增加,自相关系数应逐渐减小。因此可以通过自相关系数的大小及变化特点来衡量生成场景的有效性。

    自相关系数(autocorrelation function,ACF)计算公式如下:

    $$ R(\tau ) = \frac{{E[({S_t} - \mu )({S_{t + \tau }} - \mu )]}}{{{\sigma ^2}}} $$ (27)

    式中:$ {S_t} $表示真实场景或生成场景在$ t $时刻出力的值;$\tau $表示时间间隔;$\mu $表示风光出力的均值;$ {\sigma ^2} $表示风光出力的方差。

    2)准确性。

    本文选择覆盖率与功率区间宽度来评价生成场景的准确性[24]。覆盖率用于衡量生成场景的置信区间对实际数据点的包含程度。其值越大,表明实际场景落入生成场景范围的概率越大。功率区间宽度用于评价生成场景聚集不确定信息的表达能力。其值越小,表明生成场景越稳定。但覆盖率与功率区间宽度均不能单独作为评价指标,应该综合比较。当覆盖率越大功率区间越小时,生成的场景越能准确描述新能源的不确定性。当覆盖率相似功率区间越小,模型的精确性越好。

    覆盖率(coverage rate,CR)和功率区间宽度(power interval width,PIW)的计算公式如下:

    $$ \left\{ \begin{array}{l} {\delta _{{\text{CR}}}}_{_\theta }{\text{ = [}}\frac{1}{N}\sum\limits_{n = 1}^N {1(P_{n,\theta }^{\min } \leqslant {P_n} \leqslant P_{n,\theta }^{\max })} {\text{]}} \times 100{\text{% }} \hfill \\ P_{n,\theta }^{\min } = \min ({\omega _{w,n}}),w = 1, \ldots ,W \hfill \\ P_{n,\theta }^{\max } = \max ({\omega _{w,n}}),w = 1, \ldots ,W \hfill \\ \end{array} \right. $$ (28)

    式中:$ {\delta _{{\text{CR}}}}_{_\theta } $表示置信度$ \theta $下的覆盖率值;$ N $表示测试集采样点总数;$ 1(·) $为一个二进制变量,若括号里的条件满足,则取值为1,否则为0;$ {P_n} $为第$ n $个采样点的功率;$ P_{n,\theta }^{\min } $与$ P_{n,\theta }^{\max } $分别表示第$ n $个采样点在置信度$ \theta $下功率的最小值与最大值。

    $$ {\delta _{{\text{PI}}{{\text{W}}_\theta }}} = \frac{1}{N}\sum\limits_{n = 1}^N {(P_{n,\theta }^{\max } - P_{n,\theta }^{\min })} $$ (29)

    式中:$ {\delta _{{\text{PI}}{{\text{W}}_\theta }}} $为置信度在$ \theta $下的功率区间平均宽度;$ P_{n,\theta }^{\max } - P_{n,\theta }^{\min } $表示第$ n $个采样点在置信度$ \theta $下的功率区间宽度。

    3)随机性。

    本文选择欧式距离平均值来评价生成场景的随机性[25]。欧式距离平均值反应了生成场景与真实场景的差异程度。其值越小,生成的场景越接近于实际值,模型越精确。

    欧式距离平均值(average Euclidean distance,AED)的计算公式如下:

    $$ {e_{{\text{AED}}}}{\text{ = }}\frac{1}{N}\sum\limits_{n = 1}^N {{{\left\| {{R_n} - R} \right\|}_2}} $$ (30)

    式中:$ {e_{{\text{AED}}}} $表示生成场景与实际场景的欧式距离平均值;$ {R_n} $表示生成的第$ n $个场景序列;$ R $为历史实际场景序列;||·||2表示两个序列差的L2范数。

    本文选择比利时地区全年光伏[26]与风电[27]的日前预测与实测数据作为算例数据。数据间隔为1h,风电光伏均有8760组数据。算例以一天24组的连续数据作为1天的样本,选取315天为训练集以训练模型,剩余50天为测试集验证模型的有效性。

    改进条件生成扩散模型由深度学习框架Pytorch搭建[28]。计算机硬件配置为:Intel(R) Core(TM) i5-1035G1 CPU 1.19 GHz,内存为16.0GB,GPU为NVIDIA GeForce MX350,显存为2.0GB。算例由本文所提出方法有效性验证,和本文方法与生成扩散模型、采用Wasserstein距离生成对抗网络场景生成方法效果进行仿真对比以及在不同数据集下的适应性3部分构成。

    采用Adam梯度下降算法进行模型训练。使用余弦噪声表添加噪声,超参数βt设置为从0.0001到0.05。算例训练了两套模型分别用于光伏风电的场景生成,光伏的扩散步长为250,风电的扩散步长为200。其训练过程的损失量如图 5所示,图 5中纵轴代表由式(19)所计算的损失值,横轴代表模型训练的轮次。

    图  5  光伏和风电训练过程的损失量
    Figure  5.  Amount of losses during PV and wind power training

    对于模型训练的起始阶段,神经网络并不能精确的预测所添加的噪声,因此风光的损失函数均会很大,随着训练次数的增加将逐渐下降并趋向稳定,此时模型收敛。

    模型训练完成后,从测试集中选取一天的光伏风电预测与实测数据作为测试样本。由于两者数据均来自于测试集,未经过模型训练,可以在一定程度上验证模型的泛化性。提取100组纯噪声,利用神经网络所预测前向过程加入的噪声,并使用预测信息进行反向过程的引导,根据改进条件生成扩散模型,分别生成光伏与风电的日前场景集,如图 6所示。

    图  6  生成场景集
    Figure  6.  Generated scene set

    图 6中的虚线为基于ICGDM方法所生成的100个日前场景,红色的实线代表历史数据的真实值,蓝色的实线代表历史数据的预测值。从图 6中可以看出,所生成的光伏、风电场景出力趋势与预测值基本相同,真实值能够被较好的包括在生成场景集中,且无明显的随机波动。由此证明了本文所提出的方法可以较好的描述新能源的出力趋势。

    为了验证本文生成场景的有效性,本文计算了生成场景集与历史真实数据时间间隔在0~6h的自相关系数,如图 7所示。图中红色圆点表示历史真实值的自相关系数,箱型图表示生成场景集的自相关系数分布图。

    图  7  自相关系数箱型图
    Figure  7.  Box diagram of autocorrelation coefficient

    图 7中可以看出,光伏风电的生成场景集均有一定的自相关性,并且随着滞后时间的增加自相关系数会逐渐的降低。其中,光伏的生成场景集自相关系数较集中,异常值较少,其中位线与历史真实值相距较近,符合光伏出力的变化特征。风电的生成场景集自相关系数更为均匀分布,其历史真实值在中位线附近。综上,光伏与风电所生成场景集的自相关系数均能把历史真实值包含在内,并且其变化趋势与真实值的变化趋势基本相同,符合新能源的变化特征,验证了本文方法的有效性。

    为了研究本文所提方法的优越性,本文设置了3种方案进行准确性与随机性的对比分析。

    方案一为生成对抗网络的场景生成方法,通过生成器与判别器之间的博弈以学习到新能源场景的概率映射,并且使用Wasserstein距离作为判别器的损失函数,以增加模型的训练精度[16]。方案二为原始的生成扩散模型的场景生成方法,使用线性噪声表的方式添加噪声。方案三为本文所提出的改进条件生成扩散模型的新能源场景生成方法,使用余弦噪声表的方式添加噪声。

    此外,由于新能源的出力具有显著的季节性特征,因此本文分别考虑季节性更为明显的夏季典型日与冬季典型日进行方法对比。

    1)准确性。

    为了更直观的对比不同方案生成场景集的准确性,算例分别给出3种方案夏季典型日光伏与风电生成场景的置信区间如图 8附录A图A4A5所示,以及为了更精确的对比3种方案,将上述结果整理成表,如附录A表A2所示。

    图  8  夏季典型日方案三生成场景集的置信区间
    Figure  8.  Confidence interval for the scenario set generated by the third typical summer day plan

    图 8可以看出,方案三所生成的夏季典型日日前场景集有着较高的覆盖率,对于100%置信区间均能完整的包含光伏风电的历史真实值,且生成场景集的变化趋势与日前预测值的变化趋势一致。

    通过与附录A图A4图A5以及附录A表A2的对比,3种方案对于光伏风电生成场景集均有着较高的覆盖率,但是可以看出采用方案一的方法生成的场景集在不同时刻均有着较宽的功率区间,而方案二较方案一的情况功率区间宽度有所降低,但随着置信度的下降,方案一与方案二的覆盖率也有着明显的降低。而方案三不仅有着较高的覆盖率,其功率区间宽度也较窄。因此,使用方案三生成夏季典型日的光伏风电日前出力场景集更贴近新能源的变化特征。

    2)随机性。

    统计3种方案夏季典型日生成场景集与历史真实值的欧氏距离平均值,结果如图 9所示。

    图  9  夏季典型日3种方案欧式距离平均值对比
    Figure  9.  Comparison of the average Euclidean distance among the three typical summer day plans

    图 9可以看出,对于夏季典型日生成场景集的欧氏距离平均值,无论是波动性较小的光伏出力,还是波动性较大的风电出力,方案三的欧式距离平均值均为最小,其生成场景在距离上更接近实际场景。通过3种方案夏季典型日欧式距离平均值的对比,证明了本文提出的方法在刻画新能源场景生成随机性方面的优越性。

    1)准确性。

    附录A图A8所示,为方案三生成冬季典型日的日前场景生成集。其中,光伏出力的季节性特征更为明显。在夏季典型日中,光伏出力大约在04:00—20:00时间段;在冬季典型日中,大约在07:00—17:00时间段,光照时间有着明显的缩短。对于风电而言,则有着较大的波动性,其出力基本无规律。但是,由方案三所生成冬季典型日的生成场景集,在100%与90%置信度下均能完整的包含风电光伏出力的历史真实值,且生成场景集的变化趋势与日前预测值的变化趋势基本相同。

    通过与附录A图A6图A7以及附录A表A3中3种方案的对比,与夏季典型日类似,方案三由于引入日前预测信息,且通过余弦噪声表添加噪声,因此在不同置信度下风电光伏生成场景集均有着较高的覆盖率和较窄的功率区间宽度。因此,使用方案三生成夏季典型日的光伏风电日前出力场景集更贴近新能源的变化特征。

    2)随机性。

    附录A表A4所示,为3种方案下冬季典型日生成场景集与历史真实值的欧式距离平均值。从表中可以看出,方案三的欧式距离平均值在光伏与风电上均小于方案一与方案二,由此说明了本文所提方法在生成冬季典型日的场景上其距离更接近于实际场景,随机性较小。

    为了验证本文所提方法的适用性,算例以波动性更大的风电为例,分别使用瓦隆和弗兰德伦风电场[27]的全年日前预测及实测数据作为原始数据训练模型。从训练集中随机选取一天,使用3种方案分别生成日前出力场景,其生成场景集置信区间计算结果如附录A表A5所示。

    从表A5中可以看出,对于两个地区的风电场3种方案均有着较高的覆盖率,这是由于3种方案均为数据驱动的方法,对于数据的分布有着一定的挖掘能力。但是,方案一较其余两种方法所生成的场景更为保守,其功率区间宽度更宽。而方案三在不同数据集下所生成的场景在相近覆盖率下均有着较窄的功率区间宽度。由此可见,本文所提出的方法在不同数据集下生成日前场景也有着较高的准确性。

    同时为了验证本文方法在不同数据集下的随机性,统计3种方案在不同风电场下的欧式距离平均值,计算结果如附录A表A6所示。

    从表A6中可以看出,方案三在不同地区的风电场下的欧式距离平均值均较小。因此,由本文所提出的方法在不同数据集下生成日前场景有着较低的随机性。

    综上所述,方案一、方案二与方案三在描述新能源出力不确定性方面均有着较好的效果,但方案三所生成的场景集准确性更好,随机性更低,所生成的场景更符合实际情况。方案一所刻画的出力不确定性区间更为保守,随机性较大。方案二较方案一生成效果有所提升,但由于未引入新能源预测信息及使用线性噪声表添加噪声,所生成场景集功率区间宽度相对较宽,欧式距离平均值相对较大。通过上述的对比结果,可以看出本文所提出的基于改进条件生成扩散模型的场景生成方法能够较为准确的描述新能源出力的不确定性。

    针对基于现有场景生成方法存在适应性和可解释性较差的问题,本文提出了基于改进条件生成扩散模型的新能源日前场景生成方法。该方法基于马尔可夫链与变分推理的理论框架,其加噪以及去噪过程的每一步均有着马尔可夫性质,从而可以了解模型在每一步生成的结果,且通过变分下界最大化来训练模型。最后以算例中以真实的风光出力数据验证了本文方法的有效性,具体结论如下:

    1)ICGDM能够以数据驱动的方式自适应学习风光出力的特征及变化规律,从而有效生成符合新能源变化趋势的场景。

    2)将本文方法与原始生成扩散模型以及WGAN场景生成方法的生成效果对比可见。本文方法所生成的场景集在同一置信度下,对实际场景均有着较高的覆盖率和较窄的功率区间宽度,随机性较小。此外,在不同地区的风光出力场景生成中也均有着较高的准确性和较小的欧氏距离平均值。由此表明,本文方法能够较为准确描述新能源日前出力不确定性。

    3)本文方法不涉及显式特征分析,具有一定的适应性,为新能源日前场景生成提供了一种新方法。在未来的研究中,应将风光之间的互补特性及多风场之间的关联特性纳入考虑范围。

    附录见本刊网络版(http://www.dwjs.com.cn/CN/1000-3673/current.shtml)。

      A1  生成扩散模型理论框图
      A1.  Theoretical framework diagram of the generative diffusion model
      A2  噪声表
      A2.  Noise schedule
      A3  神经网络结构图
      A3.  Neural network architecture diagram
      A1  神经网络参数
      A1.  Neural network parameter
    参数名称 参数大小
    时间嵌入维度 16
    残差块数量 8
    残差通道数量 8
    膨胀周期长度 2
    残差块中隐藏层大小 64
    下载: 导出CSV 
    | 显示表格
      A4  夏季典型日方案一生成场景集的置信区间
      A4.  Confidence interval of the generated scenario set for scheme 1 on a typical summer day
      A5  夏季典型日方案二生成场景集的置信区间
      A5.  Confidence interval of the generated scenario set for scheme 2 on a typical summer day
      A2  夏季典型日不同方案生成场景集的置信区间
      A2.  Confidence intervals of the generated scenario sets for different schemes on a typical summer day
    能源 置信度/
    %
    方案一 方案二 方案三
    覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW
    光伏 100 100 8853.339 100 6858.181 100 4765.854
    90 100 6272.418 100 4651.974 100 3313.958
    80 83.333 4096.569 91.667 3059.899 95.833 2197.816
    60 45.833 2439.185 58.333 1696.318 79.167 1213.733
    风电 100 100 4904.491 95.833 2885.174 100 2166.651
    90 87.5 3964.571 95.833 2008.368 95.833 1514.184
    80 75 3311.367 91.667 1352.188 91.667 1071.189
    60 58.333 2272.750 58.333 708.851 87.5 586.658
    下载: 导出CSV 
    | 显示表格
      A6  冬季典型日方案一生成场景集的置信区间
      A6.  Confidence interval of the generated scenario set for scheme 1 on a typical winter day
      A7  冬季典型日方案二生成场景集的置信区间
      A7.  Confidence interval of the generated scenario set for scheme 2 on a typical winter day
      A8  冬季典型日方案三生成场景集的置信区间
      A8.  Confidence interval of the generated scenario set for scheme 3 on a typical winter day
      A3  冬季典型日不同方案生成场景集的置信区间
      A3.  Confidence intervals of the generated scenario sets for different schemes on a typical winter day
    能源 置信度/% 方案一 方案二 方案三
    覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW
    光伏 100 100 3568.139 100 2411.989 100 1560.636
    90 95.833 2737.603 91.667 1571.203 100 1053.025
    80 87.5 1846.632 87.5 1088.671 91.667 645.134
    60 58.33 1106.932 75 610.727 70.833 337.657
    风电 100 100 8100.673 100 6510.519 100 4496.629
    90 100 5814.273 100 4649.081 100 3200.673
    80 100 3907.079 95.833 2950.053 87.5 2150.994
    60 75 2182.439 70.833 1529.542 79.167 1291.913
    下载: 导出CSV 
    | 显示表格
      A4  冬季典型日3种方案欧式距离平均值对比
      A4.  Comparison of the average Euclidean distance among the three typical summer day plans
    随机性 方案一 方案二 方案三
    光伏 0.933 0.589 0.459
    风电 0.936 0.531 0.424
    下载: 导出CSV 
    | 显示表格
      A5  不同地区下场景生成置信区间计算结果
      A5.  Scene generates confidence interval calculation results
    地区 置信度/% 方案一 方案二 方案三
    覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW
    瓦隆地区 100 100 6371.859 100 4618.632 100 3146.734
    90 100 4716.378 100 3045.814 100 2064.654
    80 100 3133.313 100 2007.088 100 1342.246
    60 91.667 1755.365 95.833 1034.368 95.833 736.505
    弗兰德伦地区 100 100 2066.747 100 1725.961 100 1375.448
    90 100 1570.581 100 1159.003 100 949.789
    80 83.333 983.571 91.667 732.463 91.667 631.929
    60 75 545.673 66.667 405.082 83.333 357.32
    下载: 导出CSV 
    | 显示表格
      A6  不同风电场的欧式距离平均值
      A6.  Average European distance of different wind farms
    随机性 方案一 方案二 方案三
    风电场1 1.038 0.962 0.766
    风电场2 0.537 0.466 0.45
    下载: 导出CSV 
    | 显示表格
  • 图  1   基于生成扩散模型的新能源日前场景生成方法理论框图

    Figure  1.   Theoretical framework diagram of the day-ahead new energy scenario generation method based on the generative diffusion model

    图  2   不同加噪方式对比图

    Figure  2.   Comparison diagram of different noise adding modes

    图  3   ˉαt的变化对比图

    Figure  3.   Comparison of changes in ˉαt

    图  4   基于改进条件生成扩散模型的新能源场景生成方法框架

    Figure  4.   New energy scenario generation method framework based on improved condition generation diffusion model

    图  5   光伏和风电训练过程的损失量

    Figure  5.   Amount of losses during PV and wind power training

    图  6   生成场景集

    Figure  6.   Generated scene set

    图  7   自相关系数箱型图

    Figure  7.   Box diagram of autocorrelation coefficient

    图  8   夏季典型日方案三生成场景集的置信区间

    Figure  8.   Confidence interval for the scenario set generated by the third typical summer day plan

    图  9   夏季典型日3种方案欧式距离平均值对比

    Figure  9.   Comparison of the average Euclidean distance among the three typical summer day plans

    A1   生成扩散模型理论框图

    A1.   Theoretical framework diagram of the generative diffusion model

    A2   噪声表

    A2.   Noise schedule

    A3   神经网络结构图

    A3.   Neural network architecture diagram

    A4   夏季典型日方案一生成场景集的置信区间

    A4.   Confidence interval of the generated scenario set for scheme 1 on a typical summer day

    A5   夏季典型日方案二生成场景集的置信区间

    A5.   Confidence interval of the generated scenario set for scheme 2 on a typical summer day

    A6   冬季典型日方案一生成场景集的置信区间

    A6.   Confidence interval of the generated scenario set for scheme 1 on a typical winter day

    A7   冬季典型日方案二生成场景集的置信区间

    A7.   Confidence interval of the generated scenario set for scheme 2 on a typical winter day

    A8   冬季典型日方案三生成场景集的置信区间

    A8.   Confidence interval of the generated scenario set for scheme 3 on a typical winter day

    A1   神经网络参数

    A1   Neural network parameter

    参数名称 参数大小
    时间嵌入维度 16
    残差块数量 8
    残差通道数量 8
    膨胀周期长度 2
    残差块中隐藏层大小 64
    下载: 导出CSV

    A2   夏季典型日不同方案生成场景集的置信区间

    A2   Confidence intervals of the generated scenario sets for different schemes on a typical summer day

    能源 置信度/
    %
    方案一 方案二 方案三
    覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW
    光伏 100 100 8853.339 100 6858.181 100 4765.854
    90 100 6272.418 100 4651.974 100 3313.958
    80 83.333 4096.569 91.667 3059.899 95.833 2197.816
    60 45.833 2439.185 58.333 1696.318 79.167 1213.733
    风电 100 100 4904.491 95.833 2885.174 100 2166.651
    90 87.5 3964.571 95.833 2008.368 95.833 1514.184
    80 75 3311.367 91.667 1352.188 91.667 1071.189
    60 58.333 2272.750 58.333 708.851 87.5 586.658
    下载: 导出CSV

    A3   冬季典型日不同方案生成场景集的置信区间

    A3   Confidence intervals of the generated scenario sets for different schemes on a typical winter day

    能源 置信度/% 方案一 方案二 方案三
    覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW
    光伏 100 100 3568.139 100 2411.989 100 1560.636
    90 95.833 2737.603 91.667 1571.203 100 1053.025
    80 87.5 1846.632 87.5 1088.671 91.667 645.134
    60 58.33 1106.932 75 610.727 70.833 337.657
    风电 100 100 8100.673 100 6510.519 100 4496.629
    90 100 5814.273 100 4649.081 100 3200.673
    80 100 3907.079 95.833 2950.053 87.5 2150.994
    60 75 2182.439 70.833 1529.542 79.167 1291.913
    下载: 导出CSV

    A4   冬季典型日3种方案欧式距离平均值对比

    A4   Comparison of the average Euclidean distance among the three typical summer day plans

    随机性 方案一 方案二 方案三
    光伏 0.933 0.589 0.459
    风电 0.936 0.531 0.424
    下载: 导出CSV

    A5   不同地区下场景生成置信区间计算结果

    A5   Scene generates confidence interval calculation results

    地区 置信度/% 方案一 方案二 方案三
    覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW 覆盖率/% 功率区间/MW
    瓦隆地区 100 100 6371.859 100 4618.632 100 3146.734
    90 100 4716.378 100 3045.814 100 2064.654
    80 100 3133.313 100 2007.088 100 1342.246
    60 91.667 1755.365 95.833 1034.368 95.833 736.505
    弗兰德伦地区 100 100 2066.747 100 1725.961 100 1375.448
    90 100 1570.581 100 1159.003 100 949.789
    80 83.333 983.571 91.667 732.463 91.667 631.929
    60 75 545.673 66.667 405.082 83.333 357.32
    下载: 导出CSV

    A6   不同风电场的欧式距离平均值

    A6   Average European distance of different wind farms

    随机性 方案一 方案二 方案三
    风电场1 1.038 0.962 0.766
    风电场2 0.537 0.466 0.45
    下载: 导出CSV
  • [1] 齐绍洲, 程师瀚. 中国碳市场建设的经验、成效、挑战与政策思考[J]. 国际经济评论, 2024(3): 108-128.

    QI Shaozhou, CHENG Shihan. Experiences, achievements, challenges and policy reflections on China's carbon emissions trading system[J]. International Economic Review, 2024(3): 108-128(in Chinese).

    [2] 杨敬言, 阮梓纹, 杨秀, 等. 陆上风电碳足迹动态变化的国际比较研究[J]. 中国工程科学, 2024, 26(4): 152-163.

    YANG Jingyan, RUAN Ziwen, YANG Xiu, et al. International comparative study on dynamic change of onshore wind power carbon footprint[J]. Strategic Study of CAE, 2024, 26(4): 152-163(in Chinese).

    [3] 国家能源局. 国家能源局举行新闻发布会 发布一季度可再生能源并网运行情况[N/OL]. [2024-04-29]. http://www.nea.gov.cn/2024-04/29/c_1212357856.htm.
    [4]

    WU Lei, SHAHIDEHPOUR M, LI Zuyi. Comparison of scenario-based and interval optimization approaches to stochastic SCUC[J]. IEEE Transactions on Power Systems, 2012, 27(2): 913-921. DOI: 10.1109/TPWRS.2011.2164947

    [5] 董骁翀. 基于数据驱动的可再生能源场景生成与约简方法研究[D]. 北京: 华北电力大学(北京), 2020.
    [6] 赵书强, 王明雨, 胡永强, 等. 基于不确定理论的光伏出力预测研究[J]. 电工技术学报, 2015, 30(16): 213-220. DOI: 10.3969/j.issn.1000-6753.2015.16.027

    ZHAO Shuqiang, WANG Mingyu, HU Yongqiang, et al. Research on the prediction of PV output based on uncertainty theory[J]. Transactions of China Electrotechnical Society, 2015, 30(16): 213-220(in Chinese). DOI: 10.3969/j.issn.1000-6753.2015.16.027

    [7]

    LI Jinghua, ZHOU Jiasheng, CHEN Bo. Review of wind power scenario generation methods for optimal operation of renewable energy systems[J]. Applied Energy, 2020, 280: 115992.

    [8] 唐雅洁, 李俊豪, 林达, 等. 考虑分布式光伏高效消纳与负荷损失最小的区域配电网应急资源协同配置策略[J]. 电力自动化设备, 2024, 44(7): 78-85.

    TANG Yajie, LI Junhao, LIN Da, et al. Coordinated allocation strategy of emergency resource for regional distribution network considering distributed photovoltaic efficient absorption and minimum load loss[J]. Electric Power Automation Equipment, 2024, 44(7): 78-85(in Chinese).

    [9] 米阳, 赵海辉, 付起欣, 等. 考虑风光不确定与碳交易的区域综合能源系统双层博弈优化运行[J]. 电网技术, 2023, 47(6): 2174-2184. DOI: 10.13335/j.1000-3673.pst.2022.1859

    MI Yang, ZHAO Haihui, FU Qixin, et al. Two-level game optimal operation of regional integrated energy system considering wind and solar uncertainty and carbon trading[J]. Power System Technology, 2023, 47(6): 2174-2184(in Chinese). DOI: 10.13335/j.1000-3673.pst.2022.1859

    [10] 杨富程, 韩二红, 王彬滨, 等. 风电场风速概率Weibull分布的参数估计研究[J]. 江西科学, 2019, 37(2): 264-269, 299.

    YANG Fucheng, HAN Erhong, WANG Binbin, et al. Estimation algorithm on the Weibull probabilistic distribution parameters of wind speed in wind farms[J]. Jiangxi Science, 2019, 37(2): 264-269, 299(in Chinese).

    [11] 董雷, 孟天骄, 陈乃仕, 等. 采用马尔可夫链—多场景技术的交直流主动配电网优化调度[J]. 电力系统自动化, 2018, 42(5): 147-153.

    DONG Lei, MENG Tianjiao, CHEN Naishi, et al. Optimized scheduling of AC/DC hybrid active distribution network using Markov chains and multiple scenarios technique[J]. Automation of Electric Power Systems, 2018, 42(5): 147-153(in Chinese).

    [12] 王群, 董文略, 杨莉. 基于Wasserstein距离和改进K-medoids聚类的风电/光伏经典场景集生成算法[J]. 中国电机工程学报, 2015, 35(11): 2654-2661.

    WANG Qun, DONG Wenlue, YANG Li. A wind power/photovoltaic typical scenario set generation algorithm based on Wasserstein distance metric and revised K-medoids cluster[J]. Proceedings of the CSEE, 2015, 35(11): 2654-2661(in Chinese).

    [13] 尚文强, 李广磊, 丁月明, 等. 考虑源荷不确定性和新能源消纳的综合能源系统协同调度方法[J]. 电网技术, 2024, 48(2): 517-526. DOI: 10.13335/j.1000-3673.pst.2023.0577

    SHANG Wenqiang, LI Guanglei, DING Yueming, et al. Collaborative scheduling for integrated energy system considering uncertainty of source load and absorption of new energy[J]. Power System Technology, 2024, 48(2): 517-526(in Chinese). DOI: 10.13335/j.1000-3673.pst.2023.0577

    [14] 王守相, 陈海文, 李小平, 等. 风电和光伏随机场景生成的条件变分自动编码器方法[J]. 电网技术, 2018, 42(6): 1860-1867. DOI: 10.13335/j.1000-3673.pst.2018.0291

    WANG Shouxiang, CHEN Haiwen, LI Xiaoping, et al. Conditional variational automatic encoder method for stochastic scenario generation of wind power and photovoltaic system[J]. Power System Technology, 2018, 42(6): 1860-1867(in Chinese). DOI: 10.13335/j.1000-3673.pst.2018.0291

    [15]

    CHEN Yize, WANG Yishen, KIRSCHEN D, et al. Model-free renewable scenario generation using generative adversarial networks[J]. IEEE Transactions on Power Systems, 2018, 33(3): 3265-3275.

    [16] 董骁翀, 孙英云, 蒲天骄. 基于条件生成对抗网络的可再生能源日前场景生成方法[J]. 中国电机工程学报, 2020, 40(17): 5527-5535.

    DONG Xiaochong, SUN Yingyun, PU Tianjiao. Day-ahead scenario generation of renewable energy based on conditional GAN[J]. Proceedings of the CSEE, 2020, 40(17): 5527-5535(in Chinese).

    [17] 张帅, 刘文霞, 万海洋, 等. 基于改进条件生成对抗网络的可控场景生成方法[J]. 电力自动化设备, 2024, 44(6): 9-17.

    ZHANG Shuai, LIU Wenxia, WAN Haiyang, et al. Controllable scenario generation method based on improved conditional generative adversarial network[J]. Electric Power Automation Equipment, 2024, 44(6): 9-17(in Chinese).

    [18]

    HO J, JAIN A, ABBEEL P. Denoising diffusion probabilistic models[EB/OL]. [2023-12-16]. https://arxiv.org/abs/2006.11239v2.

    [19] 中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会. 风电场接入电力系统技术规定: GB/T 19963—2011[S]. 北京: 中国标准出版社, 2012.
    [20] 中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会. 光伏发电站接入电力系统技术规定: GB/T 19964—2012[S]. 北京: 中国标准出版社, 2013.
    [21]

    HO J, SALIMANS T. Classifier-free diffusion guidance[M/OL]. [2023-07-26]. https://arxiv.org/abs/2207.12598.

    [22]

    KOLLOVIEH M, ANSARI A F, BOHLKE-SCHNEIDER M, et al. Predict, refine, synthesize: self-guiding diffusion models for probabilistic time series forecasting[EB/OL]. [2023-12-22]. https://arxiv.org/abs/2307.11494v3.

    [23] 孙锴, 张大海, 李亚平, 等. 考虑时空不确定性的风电出力场景生成方法[J]. 电力自动化设备, 2024, 44(7): 101-107.

    SUN Kai, ZHANG Dahai, LI Yaping, et al. Scenario generation method of wind power output considering spatiotemporal uncertainty[J]. Electric Power Automation Equipment, 2024, 44(7): 101-107(in Chinese).

    [24] 黄越辉, 孙亚南, 李驰, 等. 基于条件生成对抗网络的多区域风电短期出力场景生成方法[J]. 电网技术, 2023, 47(1): 63-72. DOI: 10.13335/j.1000-3673.pst.2022.1191

    HUANG Yuehui, SUN Yanan, LI Chi, et al. Constructing method of short-term output scenarios for multi-regional wind power based on conditional generative adversarial network[J]. Power System Technology, 2023, 47(1): 63-72(in Chinese). DOI: 10.13335/j.1000-3673.pst.2022.1191

    [25] 牟长兴, 张俊涛, 程春田, 等. 考虑时空相关性的流域水风光多能互补系统高维不确定性场景生成方法[J]. 电网技术, 2024, 48(9): 3614-3623. DOI: 10.13335/j.1000-3673.pst.2023.2213

    MU Changxing, ZHANG Juntao, CHENG Chuntian, et al. High-dimensional uncertainty scenario generation method for hydro-wind-solar multi-energy complementary system considering spatio-temporal correlation[J]. Power System Technology, 2024, 48(9): 3614-3623(in Chinese). DOI: 10.13335/j.1000-3673.pst.2023.2213

    [26]

    ELIA Group. Solar power generation[DS/OL]. [2024-01-26]. https://www.elia.be/en/grid-data/power-generation/solar-pv-power-generation-data.

    [27]

    ELIA Group. Wind power generation[DS/OL]. [2024-02-20]. https://www.elia.be/en/grid-data/generation-data/wind-power-generation.

    [28]

    FACEBOOK. Pytorch 0.4. 0[EB/OL]. [2023-04-25]. https://pytorch.org.

图(17)  /  表(6)
计量
  • 文章访问数:  0
  • HTML全文浏览量:  0
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-07-24
  • 网络出版日期:  2025-03-31
  • 发布日期:  2025-02-26
  • 刊出日期:  2025-04-04

目录

/

返回文章
返回