【抢先看】《浙江电力》2020年第1期目录及重点关注文章

【抢先看】《浙江电力》2020年第2期目录及重点关注文章

征文 |“储能技术规模化应用技术”专题征文通知

百度搜索《浙江电力》,认准唯一官方投稿网站:

http://www.zjdl.cbpt.cnki.net/

基于逻辑回归模型的电能替代用户辨识研究

陈吉奂1,卢毓东2,苗 博3,刘 强1,韩嘉佳2,李 磊1(1.国网浙江省电力有限公司,杭州 310007;2.国网浙江省电力有限公司电力科学研究院,杭州 310014;3.中国电力科学研究院有限公司,北京 100192)

本文引文信息:陈吉奂,卢毓东,苗博,刘强,韩嘉佳,李磊.基于逻辑回归模型的电能替代用户辨识研究[J].浙江电力,2020,39(01):16-21.

0 引言

严重雾霾等污染问题是我国能源发展方式不合理、结构性矛盾长期积累并集中暴露的结果,解决环境问题必须改变以煤为主的能源结构,尽量减少煤炭、石油等化石能源的使用,控制能源总量和调整能源消费结构[1]。在此形势下,国家提出了电能替代战略,积极倡导“以电代煤、以电代油、电从远方来”的能源消费新模式,不断提高电能占终端能源消费的比重,大力优化能源结构,促进节能减排,减轻大气污染,提升环境质量和经济可持续发展能力。

目前,国内外学者已开展电能替代方面的相关研究。赵会茹等学者指出影响我国电能消耗的主要因素有经济发展水平、电价、人口增长、技术进步、能源政策的调整等[2-4]。文献[5]从宏观层面阐述了电能替代战略中面临的机遇、挑战以及政策选择。文献[6]结合高校生活热水供应系统来具体量化电能替代所带来的经济效益和环境效益,对高校生活热水供应系统电能替代的效益进行全面的量化评价,为进一步推广电能替代技术提供了参考。文献[7]从节能减排的角度阐述了全面实施电能替代项目的优势,不仅提高电能占终端能源消费比重,而且对缓解城市雾霾困扰、促进生态文明建设具有重要作用。文献[8]定义电能替代量来量化电能替代潜力,建立了关于电能替代的环境负荷模型,并通过脱钩理论模型确定多情景下的多种模型参数,实现对不同情景下终端电能替代量的有效预测。

从上述研究文献中可以看出,大部分学者对电能替代的研究主要集中于宏观分析层面,而对于如何推动电能替代项目在企业、用户端的工作开展得较少。从电力公司具体业务中可以看出,当前电能替代改造主要采用人工实地走访的方式,这种传统方式存在两大问题:一是实地走访效率较低,客户经理盲目性较大;二是无法对信息进行整合和共享。因此,无论是从理论研究角度,还是实际业务角度,都有必要对电能替代项目中的潜在用户特征进行深度挖掘,通过大数据分析和模型应用来减少电能替代改造成本,提高改造效率。

本文以大数据挖掘技术在浙江电网的应用为切入点,通过分析用电客户的用电行为特征,构建出电网公司合理、高效的电能替代潜力用户判别模型,从而提升电网企业在开展电能替代工作上的专业化和精准性。

1 建模思路及架构设计

本文采用“行业-领域-用户”三层架构来构建潜在用户判别模型:首先分析电能替代行业的基本情况,按电网用户在不同行业使用的耗能设备的不同以及各行业生产周期、生产特征的差异,将用户划分到19 个领域;然后针对不同领域构建合适的数学模型参数,采用逻辑回归模型算法深入挖掘每个领域内的用户。

本文以金属制造领域为例,首先进行特征分析,选取金属制造领域影响电能替代的指标因素;其次进行指标筛选,采用皮尔逊检验等相关算法筛选重要指标用以建模;然后构建基于数据挖掘的逻辑回归模型,用以进行电能替代潜在用户的判别;最后进行模型输出及验证,检验模型的合理性。模型构建的具体流程如图1 所示。

图1 “行业—领域—用户”三层架构

2 电能替代技术领域划分

根据GB/T 4754—2002《国民经济行业分类》,我国行业分为20 个门类913 个小类,电能替代在行业选取上应遵循“二八原则”,有所侧重,选取煤、石油、天然气等石化能源占比较高的行业重点突破。

从用电量情况看,2018 年浙江电网高压、非居用户数量占比不足二成,但用电量却占到全省的86.7%,其中皮革制造、金属冶炼、金属精加工、化工制造等制造行业是用电主力。

根据国务院下发的《关于推进电能替代的指导意见》(以下简称“意见”)的指示,各行业可被电能替代的主要耗能设备集中于电锅炉、窑炉、采暖等,结合上述两点行业选取原则及《意见》涉及的耗能设备类别,从913 个细分行业中选取84个重点用能行业,并划分到19 个领域分别构建模型,如表1 所示。

3 模型指标体系构建

3.1 模型影响因素分析

甄别企业能耗情况可以从企业基本信息、企业生产经营信息、企业用电特性和企业用电习惯特征4 个方面考虑,这4 类数据可分别从电网营销系统和用电采集系统中获取。

(1)企业基本信息分析

表1 19 个领域及对应替代技术

不同的细分行业使用的机器生产设备、产品生产周期、用电特性等都存在差异,进而影响其能耗量和用能规律;同行业不同户龄的企业使用的耗能设备具有一定的时段特征,如2018 年之后建立的企业因为受到政策影响,用能以电、天然气为主。受行业、历史等因素影响,目标企业与非目标企业的户龄分布存在一定差异。

(2)企业生产经营信息分析

企业经营是否景气直接影响到企业后续的生产计划与设备改造意愿,经营情况较好的企业对于电能替代接受的意愿相对更高;近期企业的减容情况也会影响到企业的电能替代可能性,最近有过减容特别是减容容量占合同容量比例较高的企业,如果其生产进度并未搁置,产能并未减少,则该企业很有可能近期用其他能源替代了电能。

(3)企业用电特性分析

企业用电特性是基于电网用电标准对用户的人为划分,主要表现在用户类别、供电电压、用电类别、运行容量4 个方面。

用户类别分为高压用户、低压非居用户和低压居民用户,不同类别的用户其用电特性存在较大差异。

供电电压按用户立户时的电压等级进行划分,由于各类企业高耗能设备所需电压有所差别,该指标能够起到较好的模型识别作用,如纺织业中电压380 V 的企业多为小作坊或代加工,一般不用锅炉或定型机,因此可被电能替代的可能性就非常小。

用电类别是根据企业的行业特性所作的划分,可分为大工业用电、普通工商业用电、居民用电。不同用电类别的企业在用电周期、用电高峰、用电量上都存在显著差异。

运行容量是指用户用电过程中实际所需容量大小。结合企业的规模、产能与当前使用的容量分析,可以了解企业的电能在其生产过程中所占比重,电能比重越低,其用其他能源的可能性就越大。如图2 展示了目标企业与非目标企业的运行容量密度分布,可以看出,相比于非目标企业,目标企业在高运行容量上分布更多。

图2 目标企业与非目标企业的运行容量密度分布

(4)企业用电习惯特征分析

企业用电习惯是基于电网用电采集系统收集的企业峰谷用电、负荷用电数据而来,使用煤、石油、天然气等能源的企业与仅使用电能的企业在峰谷电及用电负荷上的日、月、季度表现都有显著差异。如图3 所示,五金、电器等金属铸造业电能替代改造后,在凌晨这段时间用电负荷有一波高峰,结合实际业务情况分析,金属铸造业特别是浇铸业,金属熔炼一般使用窑炉设备,而该设备使用时段为01:00—06:00,电能替代改造后,企业用电窑炉替代了燃煤窑炉,致使该时段用电负荷出现峰值。

3.2 模型变量筛选与确立

通过对上述变量影响因素的分析与整理,初步确定如图4 所示13 个模型变量。

图3 不同企业电能改造前后24 h 负荷曲线

图4 变量模型分类情况

为把握各个变量xi对替代结果影响程度,可将上述各影响因素作为自变量,替代结果yi作为因变量,通过相关性分析来考察自变量与因变量的相关程度。

通过因变量(替代结果)与自变量的相关分析得到表2 所示结果,电压类型、负荷类型、减容率、峰电量指数与目标变量相关系数较小,这些指标与模型结果线性关系较弱,在后期模型构建中可以考虑舍去。从输入变量与目标变量的显著性水平来看,除了负荷类型P 值为0.77,大于0.05而未通过显著性检验,其他指标都通过皮尔逊检验。

表2 各类指标变量与目标变量的相关系数及显著性水平

另外,变量间的多重共线性可由kappa 条件数来确定,通过各变量间的多重共线性分析可得kappa 条件数为12.776,低于100,因此模型输入变量间共线程度较低,可全部用于模型的构建。

4 构建基于数据挖掘的逻辑回归模型

4.1 模型技术原理说明

Logistic 函数(或称为Sigmoid 函数)如式(1)所示:

式中:e 是自然对数;z 为曲线的陡度。

对于线性分类的情况,其边界形式如式(2)所示:

式中:θ0为常数;θ1,θ2,…,θn为变量的系数;x1,x2,…,xn为具体变量。本文中,变量为能够影响用户电能替代潜力结果的具体用电指标,如电压、负荷、电量、用电类别、企业规模等。

结合式(1)、式(2)构造的预测函数为:

式中:g(θTx)=g(z),g(θTx)指是否替代的两个结果,是则取1 的概率,否则取0 的概率。因此式(3)又可以转化为:

式(4)、式(5)合并起来可以写成:

在变量处理上,应注重以下两点:一是逻辑回归模型的线性化特征使连续变量的影响方向存在单一性,但根据实际业务经验,部分变量并非呈现这种特征,如电压为10 kV 时,企业替代可能性最高,而10 kV 以上或以下可能性都较低,呈现中间高两边低的峰状特征,通过对部分变量进行人为的因子转换或切片操作可以避免上述问题,但这必然会造成部分数据的失真,因此切片的精确度与数量是保证模型效果的重要因素;二是各变量的绝对值大小差异极大,容易造成某个单一变量对θTx 函数的影响权重过大,因此需在模型变量输入前对连续性变量作归一化处理。

对式(6)取对数,可推导最大似然估计Cost函数为:

此处Cost 损失函数用了最大似然估计,因此Cost 值越小,函数越收敛,对模型的估计效果越好。

求Cost 函数的最小值可以使用梯度下降法,根据梯度下降法可得θ 的更新过程,其中α 为学习率(步长):

利用梯度下降法,式(7)可以写成:

由式(9)可知,当Cost 最小时,即为残差[hθ(x(i))-y(i)]和最小,整个模型函数与实际结果拟合效果最好。在文中,使用R 语言自带的逻辑回归赤池检验与残差和的对比来验证Cost 损失值。

4.2 模型输出及应用

分析电能替代潜力用户判别模型系数输出结果(金属制造业)可以发现,除行业景气指数外,其他变量对模型结果的影响都较为显著(P≤0.05)。其中,用电类型为大工业用电、电压为10 kV时,企业电能替代的可能性较大;而其他变量,特别是负荷指数与峰电量指数越高,企业电能替代的可能性越小。这是因为负荷指数越高,企业的电力负荷波动越大,电能在其主要生产设备中的能耗占比越大,电能替代的可能性越小。

模型预留了30%的数据用于验证模型的适用性,由图5 可知,模型整体覆盖率、命中率表现较优,其中命中率在后半段有小幅波动。通过后期检验发现,这是由于部分行业目标变量过少,导致模型的命中率在前半段过拟合造成的,对模型实际应用影响不大。

图5 模型验证集检验结果(R 语言分析结果)

根据模型的输出结果,采用大数据存储技术中的查询优化技术,将模型固化到电网业务系统中,为了达到快速进行标签组合运算的目的,系统将客户与模型结果数据的关系以布尔值的方式进行存储,从而保证业务应用与模型结果的更新效率。

5 结语

电能替代模型投入使用后,已完成浙江全省除居民用户以外的450 万家企业的潜力分析,并在绍兴、嘉兴两地完成2 次现场实地走访,涉及企业4 612 家,平均命中率分别达到23.2%和30.7%,与未构建模型时的走访效率相比,提升了5~6 倍。

经走访,从行业角度分析,实际有潜力的企业大多分布在纺织、金属、橡胶等制造业领域,而交通运输、信息传输、商业等领域几乎无潜力企业,这也验证了第二部分的行业耗能分析。

研究表明:电能替代潜力用户判别模型能够快速响应业务需求,帮助业务人员从海量数据中筛选出电能替代潜力客户并制定相应推进策略,有针对性地开展日常电能替代工作。模型在绍兴、嘉兴两地的试点应用中取得了较好的效果,为业务人员精准定位用户,以及后期推进策略和服务的精准化、差异化提供了科学工具。

参考文献:(略)

DOI:10.19585/j.zjdl.202001003

开放科学(资源服务)标识码(OSID):

基金项目:国网浙江省电力有限公司科技项目(5211DS17002T)

作者简介:陈吉奂(1971),男,高级工程师,研究方向为电力营销管理。

往期热点

配网优化 | 基于负荷重组的城市配电网供电能力提升研究综述 | 能源互联网视角下的未来配电网发展电动汽车 | 基于小波消噪法的电动汽车直流充电电能计量算法优化技术交流 | 干风联合停炉保护技术在9E级联合循环机组的应用发电技术 | 基于负荷轴工况划分的发电厂关键设备非平稳状态监测技术探讨 | 基于采样值差动原理的变压器差动速断保护抗饱和优化措施经验交流 | 不同方式下“低气压闭锁重合闸”回路分析状态检测 | H2O对尖端放电缺陷下SF6分解产物含量的影响柔性直流输电 | 舟山柔直直流断路器用电容器运行评价智能检修 | 基于HOG-SVM的GIS设备智能拆装机器人系统研究变压器振动 | 大型电力变压器冷却器振动故障诊断与处理负荷预测 | 考虑气象因子的区域电网梅雨期负荷预测网络安全 | 基于根因分析的电力监控系统日志大数据处理方法

电力电子 | 基于SiC MOSFET的电力电子变压器双有源桥功率模块设计

泛在电力物联网 | 泛在电力物联网环境下网络安全攻击研究发电技术 | 国内光热发电现状及应用前景综述

石墨烯 | 石墨烯电压稳定剂对聚乙烯共混物介电性能的影响

发电技术 | 发电厂DCS 网络安全评估与防护电力市场 | 基于全成本分析的广东燃气机组发电合同转让交易套利探究及启示电气设备 | 基于参数自适应动态差分进化算法的变压器局放源定位电力市场 | 基于多源流理论的中国电力现货市场政策制定框架与关闭风险

本文为原创作品,纸媒、网站、微博、微信公众号转载、摘编我编辑部的作品,务必请提前联系我编辑部。个人请按本微信原文转发、分享。

上可以替代mobaxterm_电能替代 | 基于逻辑回归模型的电能替代用户辨识研究相关推荐

  1. 基于逻辑回归模型对鸢尾花数据集进行分类

    基于逻辑回归模型对鸢尾花数据集进行分类 理论知识 不做过多赘述,相关知识有:指数分布族.GLM建模(分布函数+连接函数,对于本例来说是二项分布+sigmoid函数).最大似然函数.交叉熵函数(评估逻辑 ...

  2. Python数据分析案例06——现代人的婚育意愿调查分析(基于逻辑回归模型和问卷数据)

    如今中国的人口生育率已经是越来越低,年轻人的婚育愿望也越来越低.这对社会老龄化以及发展产生了巨大的危害,探索现代人们的婚育意愿的影响因素是很有必要的. 本次案例采用问卷的形式收集数据,从年龄,性别,学 ...

  3. 机器学习笔记I: 基于逻辑回归的分类预测

    逻辑回归的介绍 逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中.虽然现在深度学习相 ...

  4. 机器学习笔记-基于逻辑回归的分类预测

    天池学习笔记:AI训练营机器学习-阿里云天池 基于逻辑回归的分类预测 1 逻辑回归的介绍和应用 1.1 逻辑回归的介绍 逻辑回归(Logistic regression,简称LR)虽然其中带有&quo ...

  5. 基于逻辑回归的鸢尾花分类预测

    基于逻辑回归的分类预测 1 逻辑回归的介绍和应用 1.1 逻辑回归的介绍 1.2 逻辑回归的应用 2 学习目标 3 代码流程 4 算法实战 4.1 Demo实践 Step1:库函数导入 Step2:模 ...

  6. ML机器学习算法(一): 基于逻辑回归的分类预测

    机器学习算法(一): 基于逻辑回归的分类预测 1 逻辑回归的介绍和应用 1.1 逻辑回归的介绍 逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个 ...

  7. 推荐系统 | 基础推荐模型 | 逻辑回归模型 | LS-PLM | PyTorch实现

    基础推荐模型--传送门: 推荐系统 | 基础推荐模型 | 协同过滤 | UserCF与ItemCF的Python实现及优化 推荐系统 | 基础推荐模型 | 矩阵分解模型 | 隐语义模型 | PyTor ...

  8. 第五章 逻辑回归模型在评分卡开发中的应用

    逻辑回归模型在评分卡开发中的应用 课程简介:在分类场景中,逻辑回归模型是常用的一类算法.它具有结构简单.可解释性强.输出结果是"软分类"的特点.评分模型多采用这类算法.同时逻辑回归 ...

  9. AI上推荐 之 逻辑回归模型与GBDT+LR(特征工程模型化的开端)

    1. 前言 随着信息技术和互联网的发展, 我们已经步入了一个信息过载的时代,这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战: 信息消费者:如何从大量的信息中找到自己感兴趣的信息? 信息生产 ...

最新文章

  1. 订阅点评有奖,本人获奖了
  2. 2012r2备域控服务器搭建,Windows2012R2备用域控搭建
  3. golang 时间日期 时区 格式 简介
  4. vxworks 学习和windows azure 学习
  5. 在outlook里设置程序员的996工作属性
  6. math.sqrt 有问题_JavaScript中带有示例的Math.sqrt()方法
  7. 按ESC关闭当前窗口
  8. python斐波那契前20递归_算法python实现经典递归问题(汉诺塔, 斐波那契数列,阶乘)...
  9. Be My Eyes app:我是你的眼
  10. 机器学习之支持向量机算法(二)
  11. echo输出到stderr
  12. 经典神经网络 -- SSD : 设计原理与pytorch实现
  13. Unity5.x 灯光烘焙GI和LightingMap
  14. 微博第三方+海外国际版+V2EX第三方
  15. 无脑安装教程:windows 10—QT5.9.5 + vs2013
  16. c语言定义寄存器中的两位,汇编语言:编写一个程序,显示AL寄存器中的两位十六进制数...
  17. Win32的时间类型
  18. simulink/stateflow官方案例之自动变速器
  19. Golang字符串拼接的方法
  20. Codeforces Round #652 div2 总结 端午节前小结

热门文章

  1. 关于前端页面在IE浏览器下无法显示的问题
  2. 2021 年 Q4 随笔
  3. SSH+ExtJs4开发项目的Demo实例视频讲解
  4. DWARF dSYM
  5. Linux 学习之创建、删除文件和文件夹命令
  6. Python 练习实例03:一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,请问该数是多少?
  7. H264编码器5( x264源代码简单分析:x264_slice_write() 与H264 编码简介)
  8. 直接修改class文件的方式
  9. 人工智能-一种现代的方法-chapter3-通过搜索进行问题求解
  10. PHP获取用户访问IP地址的5种方法