公務(wù)員期刊網(wǎng) 論文中心 正文

用電信息大數(shù)據(jù)分析反竊智能識別技術(shù)

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了用電信息大數(shù)據(jù)分析反竊智能識別技術(shù)范文,希望能給你帶來靈感和參考,敬請閱讀。

用電信息大數(shù)據(jù)分析反竊智能識別技術(shù)

針對目前電力系統(tǒng)竊電趨勢不容樂觀的現(xiàn)象,急需提升大數(shù)據(jù)反竊電水準(zhǔn),構(gòu)建反竊電的智能識別模型,進(jìn)而實(shí)現(xiàn)對不同竊電事件的精準(zhǔn)分類與預(yù)測。面對如此嚴(yán)峻的形勢,本文采用基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)的滑動(dòng)窗方法對用戶日電量的變化特征進(jìn)行提取分析,識別異常用電行為。將用戶用電信息導(dǎo)入訓(xùn)練好的模型進(jìn)行分析,實(shí)現(xiàn)基于用電信息采集大數(shù)據(jù)分析的反竊電智能識別。隨著科技的不斷發(fā)展,竊電手段愈發(fā)隱蔽,竊電量也越來越大,對我國電力行業(yè)造成了嚴(yán)重不利影響。根據(jù)相關(guān)調(diào)查數(shù)據(jù),每年我國由竊電而損失的經(jīng)濟(jì)已經(jīng)超過200億元人民幣,對我國經(jīng)濟(jì)的發(fā)展產(chǎn)生了難以估計(jì)的不良影響,急需相應(yīng)有效的反竊電方法。本項(xiàng)目采用基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)的滑動(dòng)窗方法對用戶日電量的變化特征進(jìn)行提取分析,智能識別異常用電行為。只需將用戶用電信息導(dǎo)入訓(xùn)練好的模型進(jìn)行分析,電網(wǎng)工作人員就可以有針對性的對疑似竊電用戶進(jìn)行排查,提高反竊電工作效率。

1基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)的滑動(dòng)窗方法

1.1長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)基本原理

長短時(shí)記憶網(wǎng)絡(luò)(LongShortTermMemoryNetwork,LSTM),是一種改進(jìn)之后的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),在解決和預(yù)測長時(shí)間序列的問題中都有很好的運(yùn)用,如圖1、圖2所示。LSTM是一種類RNN結(jié)構(gòu),但與其又有些不同,LSTM有四個(gè)以非常特殊方式進(jìn)行交互的網(wǎng)絡(luò)層。在每個(gè)記憶單元(圖中A)中包括細(xì)胞狀態(tài)(Ct),遺忘門,輸入門和輸出門。這些門結(jié)構(gòu)能讓信息選擇性通過,用來去除或者增加信息到細(xì)胞狀態(tài)。遺忘門控制遺忘上一層細(xì)胞狀態(tài)的內(nèi)容,根據(jù)上一序列的ht-1和本序列的Xt為輸入,通過Sigmoid激活函數(shù),得到上一層細(xì)胞狀態(tài)內(nèi)容哪些需要去除,哪些需要保留;輸入門處理當(dāng)前序列位置的輸入,確定需要更新的信息,去更新神經(jīng)元狀態(tài);輸出門要基于神經(jīng)元狀態(tài)保存的內(nèi)容來確定輸出什么內(nèi)容,即選擇性的輸出神經(jīng)元狀態(tài)保存的內(nèi)容。

1.2基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)的滑動(dòng)窗方法

若要判斷用戶某天的用電行為是否存在異常,對該日前后各一周的電量趨勢進(jìn)行分析,得出的結(jié)果會更加準(zhǔn)確。因此本項(xiàng)目采用雙向長短時(shí)記憶網(wǎng)絡(luò)作為反竊電判斷的基本分類模型,采用滑動(dòng)窗口的方式輸入數(shù)據(jù),輸入的窗口長度設(shè)置為13(連續(xù)13天的日電量數(shù)據(jù)),網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示??梢钥吹角跋?qū)雍头聪驅(qū)庸餐B接著輸出層,其中包含了6個(gè)共享權(quán)值w1-w6。使用神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型需要大量的帶標(biāo)簽數(shù)據(jù),給數(shù)據(jù)添加準(zhǔn)確的標(biāo)簽是本項(xiàng)目的一個(gè)重點(diǎn);另外神經(jīng)網(wǎng)絡(luò)的超參數(shù)對結(jié)果的影響較大,因此神經(jīng)網(wǎng)絡(luò)的搭建與超參數(shù)的設(shè)置是本項(xiàng)目的另一個(gè)重點(diǎn)。

2反竊電系統(tǒng)數(shù)學(xué)模型

2.1數(shù)據(jù)選取

從營銷系統(tǒng)和計(jì)量自動(dòng)化系統(tǒng)中抽取以下數(shù)據(jù):(1)從營銷系統(tǒng)抽取用戶基本信息數(shù)據(jù);(2)從計(jì)量自動(dòng)化系統(tǒng)采集實(shí)時(shí)負(fù)荷數(shù)據(jù)和終端報(bào)警信息。

2.2研究內(nèi)容

(1)基于歷史竊電用戶相關(guān)信息,研究竊電識別模型的專家樣本數(shù)據(jù)集構(gòu)建方法;(2)結(jié)合低壓用戶用電信息采集數(shù)據(jù)特征,研究基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)的滑動(dòng)窗數(shù)據(jù)處理算法,研究竊電識別模型的參數(shù)優(yōu)化方法,構(gòu)建低壓用戶竊電診斷分類模型。

2.3實(shí)施方案

(1)從系統(tǒng)中提取歷史竊電低壓用戶相關(guān)信息,對數(shù)據(jù)進(jìn)行清洗,構(gòu)建竊電識別模型的專家樣本數(shù)據(jù)集,提取數(shù)據(jù)特征。(2)結(jié)合低壓用戶用電信息采集數(shù)據(jù)特征,基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)與輸入數(shù)據(jù)窗口化提取方法,使用Matlab創(chuàng)建雙向長短時(shí)記憶網(wǎng)絡(luò),網(wǎng)絡(luò)的隱含單元個(gè)數(shù)設(shè)置為100,求解器設(shè)置為adam,訓(xùn)練輪數(shù)設(shè)置為250輪,梯度閾值設(shè)置為1,初始學(xué)習(xí)率設(shè)置為0.01,在訓(xùn)練125輪后通過乘以因子0.2來降低學(xué)習(xí)率。(3)將竊電用戶原始用電數(shù)據(jù)導(dǎo)入Matlab中,提取用戶編號、數(shù)據(jù)日期與總電量信息,然后計(jì)算出用戶日電量,對于缺失值及采集的首日電量填充為0。數(shù)據(jù)預(yù)處理完成后對數(shù)據(jù)進(jìn)行窗口劃分,將連續(xù)13天[T-6,T+6]的電量數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的一個(gè)輸入,第T天的竊電狀態(tài)(0或1)作為輸出。對于信息采集的首尾日,使用0對首尾日的窗口進(jìn)行填充。(4)使用經(jīng)過預(yù)處理的數(shù)據(jù)對模型進(jìn)行訓(xùn)練并對模型超參數(shù)進(jìn)行調(diào)整,以提高模型精度。(5)對模型進(jìn)行測試,并采用采用貝葉斯優(yōu)化算法對超參數(shù)進(jìn)行優(yōu)化,完善模型,提高識別精度。3實(shí)例分析本案例輸入文件為某中心城市某低壓用戶的用電數(shù)據(jù),時(shí)間為2018年1月1日-2019年7月16日,同時(shí)包含每天是否有竊電情況的標(biāo)志。20180101天的數(shù)據(jù)形式如表1所示。首先對網(wǎng)絡(luò)樣本輸入數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,并將處理后的數(shù)據(jù)作為輸入數(shù)據(jù),其中選擇竊電嫌疑系數(shù)作為輸出數(shù)據(jù)?;贛atlb建立基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)的滑動(dòng)窗模型,選定Sigmoid函數(shù)作為激活函數(shù)?;跀?shù)據(jù)變換,得到新的評價(jià)指標(biāo)來表征竊電行為所具有的規(guī)律,經(jīng)過數(shù)據(jù)處理后的專家樣本數(shù)據(jù)如表2所示。對專家樣本隨機(jī)選取25%作為測試樣本,剩下的75%作為訓(xùn)練樣本。結(jié)合低壓用戶用電信息采集數(shù)據(jù)特征,基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)與輸入數(shù)據(jù)窗口化提取方法,使用Matlab創(chuàng)建雙向長短時(shí)記憶網(wǎng)絡(luò),網(wǎng)絡(luò)的隱含單元個(gè)數(shù)設(shè)置為100,求解器設(shè)置為adam,訓(xùn)練輪數(shù)設(shè)置為250輪,梯度閾值設(shè)置為1,初始學(xué)習(xí)率設(shè)置為0.01,在訓(xùn)練125輪后通過乘以因子0.2來降低學(xué)習(xí)率。訓(xùn)練樣本建模的混淆矩陣,如圖4所示。分類準(zhǔn)確率為97.9%,正常用電日被誤判為竊電日的占正常用電日的0.5%,竊電日被誤判為正常用電日的占竊電日的1.6%。

結(jié)束語:

本文基于用電信息采集系統(tǒng)的用戶用電數(shù)據(jù),采用基于雙向長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)的滑動(dòng)窗方法對用戶日電量的變化特征進(jìn)行提取分析,實(shí)現(xiàn)反竊電的智能識別。通過實(shí)例分析,利用歷史用戶用電數(shù)據(jù),將用戶用電信息導(dǎo)入訓(xùn)練好的模型進(jìn)行分析,實(shí)現(xiàn)基于用電信息采集大數(shù)據(jù)分析的反竊電智能識別,驗(yàn)證了本文反竊電模型的有效性,為解決大數(shù)據(jù)時(shí)代下的反竊電智能識別問題提供了參考。

作者:燕躍豪 鮑薇 單位:國網(wǎng)鄭州供電公司