一、研究背景与意义
在“碳达峰、碳中和”目标推动下,太阳能作为最具发展潜力的清洁能源之一,其开发利用已成为我国能源结构调整的核心方向。光伏系统在长期运行中,受产品质量、环境因素等影响,易发生短路、接地、老化等故障,其中光伏阵列端侧故障占比最高,直接影响发电效率与运行稳定性。因此,实现光伏阵列故障的精准诊断对保障新能源系统可靠运行具有重要意义。
现有故障诊断方法存在明显局限:基于计算机视觉的方法依赖红外热成像,对短路等特征不明显的故障识别精度低;基于I-V曲线的方法需完整数据输入,难以应对实时监测与数据缺失场景;基于电气参数的深度学习方法受限于故障数据稀缺问题,在小样本场景下性能不佳。此外,传统数字孪生模型生成的数据与实际系统贴合度不足,随机配置网络(SCN)存在节点冗余问题,均制约诊断精度提升。
针对上述问题,本文提出深度生成数字孪生框架下的光伏阵列故障诊断方法,通过机理建模、特征优化、数据增强与智能诊断的全流程创新,实现小样本条件下的高精度故障诊断,为光伏系统运维提供新的技术路径。
二、关键技术与方法架构
整体框架设计
该框架由“深度生成数字孪生模型”与“AOSCN诊断网络”两部分构成。前者实现故障数据的生成、特征筛选与增强,后者完成故障类型的精准识别,通过数字虚体与物理实体的动态映射,解决实际故障数据不足的核心痛点。
(二)光伏系统机理模型构建
基于250kW光伏并网系统的实际物理参数,在Matlab/Simulink平台搭建机理模型,模拟四种典型运行状态:正常运行、串内短路、串内接地、串间连接故障。模型包含88个光伏串(通过汇流器并联)、三相全桥IGBT、升压变压器等关键组件,其中3个光伏串单独建模以方便故障实验,其余合并为4-88号光伏串。
为贴近实际工况,模型设置辐照度调节范围为100-1000 W/m²,温度调节范围为10-35℃,采集电流、电压、功率等电信号特征,每个样本时间跨度为0.4s,最终生成500个样本(正常100个、串内短路130个、串内接地130个、串间连接故障140个),解决了实际故障数据采集困难的问题。
(三)LS-SVM-RFECV特征筛选模块
机理模型生成的原始数据包含24个特征,部分特征缺乏显著性,可能干扰诊断结果。为此,设计基于最小二乘支持向量机(LS-SVM)的交叉递归特征消除(RFECV)方法,实现关键特征的自动筛选:
1. 递归特征消除:通过LS-SVM对特征重要性排序,递归移除最不重要特征,直至保留最优特征子集;
2. 交叉验证:将数据集划分为5个子集,交替使用训练集与测试集评估模型性能,确定最佳特征数量;
3. 核函数映射:通过核函数将输入特征映射至高维空间,提升分类精度,最终筛选出14个关键特征(如支路电流极值、总电流波动范围等),使交叉验证准确率达96.83%,在降低数据维度的同时保留核心信息。
(四)1DPCC-UNet DDPM深度生成模型
为解决机理数据与实际数据分布差异及样本不平衡问题,提出一维皮尔逊系数UNet扩散模型(1DPCC-UNet DDPM),实现数据增强与分布优化:
1. 网络结构改进:将传统UNet的二维卷积改为一维卷积,适配光伏电信号的一维特性;加入点积自注意力机制,增强对长程依赖特征的捕捉能力;
2. 训练终止机制:通过皮尔逊相关系数衡量生成样本与真实样本的分布一致性,当系数大于0.8(表明强相关性)时停止训练,确保生成数据的真实性;
3. 扩散过程优化:正向扩散逐步添加噪声至标准正态分布,反向扩散通过神经网络逐步去噪还原数据,最终生成600个平衡样本,使各类故障数据分布更贴近实际系统。
(五)AOSCN故障诊断网络
针对传统SCN隐藏层节点冗余导致的效率与精度问题,引入天鹰优化算法(AO)优化SCN参数,构建AOSCN诊断网络:
1. 参数优化:AO算法通过扩大搜索范围、轮廓飞行攻击、低飞慢降攻击、猎物处理四阶段策略,自适应寻找SCN的最优正则化参数(r∈[0.9,0.999999])与比例因子(λ∈[0.5,250]),避免节点冗余;
2. 网络构建:以分类准确率为适应度函数,通过迭代优化确定最佳隐藏层节点数量,在保证精度的同时简化网络结构;
3. 诊断流程:将增强后的数据集输入AOSCN,通过单隐藏层前馈网络实现故障分类,兼顾小样本场景下的泛化能力与诊断效率。
三、实验验证与结果分析
(一)数据集构建
实验共生成4个数据集:
- 数据集A:500个原始样本,含24个特征;
- 数据集B:经LS-SVM-RFECV筛选后的500个样本,含14个特征;
- 数据集C:100个真实样本,匹配数据集B的14个特征;
- 数据集D:经1DPCC-UNet DDPM增强后的600个平衡样本,含14个特征。
(二)消融实验验证
1. 特征筛选效果:通过t-SNE可视化分析,特征筛选后的数据聚类效果显著提升,同类样本聚集度更高,证明LS-SVM-RFECV有效保留关键信息;
2. 数据增强效果:生成样本与真实样本的皮尔逊系数均大于0.8(正常0.811、短路0.807、接地0.826、串间故障0.809),折线趋势一致性高;数据平衡后诊断准确率提升11%,验证了1DPCC-UNet DDPM的有效性;
3. 整体方法验证:十轮消融实验显示,完整框架(1DPCC-UNet DDPM+LS-SVM-RFECV+AOSCN)的平均准确率达97.9%,显著高于仅使用AOSCN(49.1%)、AOSCN+1DPCC-UNet DDPM(74.1%)、AOSCN+LS-SVM-RFECV(87.4%)的对照组,证明各模块协同作用的必要性。
(三)对比实验结果
将AOSCN与7种主流算法对比:
- 传统方法:反向传播神经网络(BPNN 91.2%)、支持向量机(SVM 90.0%)、逻辑回归(LR 89.2%);
- 深度学习方法:多尺度Transformer-CNN(MSTCNN-FDN 96.2%)、循环神经网络-全卷积网络(RNN-FCN 95.9%)、多输入卷积神经网络(MICNN 95.7%);
- 原始SCN(95.6%)。
结果显示,AOSCN以97.9%的平均准确率位居首位,且均方根误差(RMSE)下降更快,训练效率更高,验证了其在小样本故障诊断中的优越性。
四、创新点总结
1. 深度生成数字孪生框架:首次将机理建模与深度生成模型结合,通过“机理数据生成-特征筛选-数据增强”的全流程孪生映射,解决光伏故障数据稀缺与分布偏差问题,实现虚拟数据与真实数据的动态适配。
2. LS-SVM-RFECV特征筛选方法:改进传统RFECV,采用LS-SVM替代SVM作为基分类器,简化二次规划问题求解复杂度,提升特征筛选效率与精度,使关键特征子集的交叉验证准确率达96.83%。
3. 1DPCC-UNet DDPM数据增强模型:针对光伏电信号的一维特性,改进UNet结构并引入皮尔逊系数终止机制,生成数据与真实数据的分布一致性达80%以上,有效平衡样本分布并增强数据多样性。
4. AOSCN诊断网络:通过天鹰优化算法解决SCN的节点冗余问题,自适应优化正则化参数与比例因子,在简化网络结构的同时提升诊断精度,较原始SCN准确率提升2.3%。
五、结论与展望
本文提出的深度生成数字孪生故障诊断方法,通过机理建模弥补数据不足,通过特征筛选与数据增强优化数据质量,通过智能诊断网络实现高精度分类,在250kW光伏系统中验证了97.9%的诊断准确率,为小样本场景下的光伏阵列故障诊断提供了有效解决方案。
未来研究可进一步拓展故障类型覆盖范围,优化数字孪生模型的实时性,探索多源数据融合(如红外图像与电气参数)的诊断策略,提升复杂工况下的适应性与鲁棒性。
科学技术的发展离不开科研仪器的进步。凯视迈(KathMatic)自2014年创建以来,一直“致力于高精尖光学测量技术”,已成为集“研发、制造、销售”为一体的国产高端光学精密测量仪器新力量。推出了KC系列多功能精密测量显微镜、KS系列超景深3D数码显微镜以及KV系列激光多普勒测振系统,取得了良好的市场成绩。详情欢迎留言咨询!