前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式主題范文,僅供參考,歡迎閱讀并收藏。
[關(guān)鍵詞]神經(jīng)網(wǎng)絡(luò);燃?xì)庹{(diào)壓器;故障識別
中圖分類號:TM645.11 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-914X(2015)41-0212-01
引言
神經(jīng)網(wǎng)絡(luò)也簡稱為人工神經(jīng)網(wǎng)絡(luò)(簡稱ANN)或稱作連接模型,它是一種以模仿動物神經(jīng)網(wǎng)絡(luò)行為特征的數(shù)學(xué)模型,這種數(shù)學(xué)模型可以進(jìn)行分布式并行信息處理。ANN經(jīng)過幾十年的研究和發(fā)展,已經(jīng)形成一套嚴(yán)密的、系統(tǒng)的理論,廣泛應(yīng)用于國防、電子、化工、機(jī)械和電力等多種行業(yè)和部門,成為處理問題的強(qiáng)有力工具之一。下面筆者探討了神經(jīng)網(wǎng)絡(luò)在燃?xì)庹{(diào)壓器故障識別中的應(yīng)用。
1 神經(jīng)網(wǎng)絡(luò)的基本原理
1.1 神經(jīng)元模型
神經(jīng)網(wǎng)絡(luò)以計算機(jī)仿真的方法從物理結(jié)構(gòu)上模擬人腦,使系統(tǒng)具有人腦的思維特性,是由大量簡單處理單元廣泛連接形成的以模擬人腦行為為目的復(fù)雜網(wǎng)絡(luò)系統(tǒng),該系統(tǒng)是靠其狀態(tài)對外部輸入的信息動態(tài)處理信息的。神經(jīng)網(wǎng)絡(luò)中的節(jié)點(diǎn)稱為神經(jīng)元。常用人工神經(jīng)元模型主要是基于模擬生物神經(jīng)元信息的傳遞特性,即輸入、輸出關(guān)系,神經(jīng)元信息傳遞的主要特征可以用圖1的模型來模擬。
1.2 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)又可以稱之為訓(xùn)練,是指在受到外部環(huán)境刺激下神經(jīng)網(wǎng)絡(luò)調(diào)整自身的參數(shù),使得神經(jīng)網(wǎng)絡(luò)用一種新的方式對外界環(huán)境做出反應(yīng)的一個過程。
神經(jīng)網(wǎng)絡(luò)可以從外界環(huán)境中學(xué)習(xí)以及在學(xué)習(xí)中提高自身的性能,這是神經(jīng)網(wǎng)絡(luò)最有意義的性質(zhì),通過反復(fù)學(xué)習(xí)樣本達(dá)到對環(huán)境的了解。常見神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式有3種:有導(dǎo)師學(xué)習(xí)、無導(dǎo)師學(xué)習(xí)和再勵學(xué)習(xí)。其中,有導(dǎo)師學(xué)習(xí)也稱之為監(jiān)督學(xué)習(xí),是指組織一批正確的輸入輸出數(shù)據(jù)對,將輸入數(shù)據(jù)加載到網(wǎng)絡(luò)輸入端后,把網(wǎng)絡(luò)的實(shí)際輸出與理想的輸出相比較得到誤差,然后根據(jù)誤差的情況修改各連接權(quán),使網(wǎng)絡(luò)朝著能正確響應(yīng)的方向不斷地變化下去,直到實(shí)際響應(yīng)輸出與理想的輸出之差在允許范圍之內(nèi)。這種學(xué)習(xí)算法通常稱誤差修正算法。BP算法就是這類算法的典型代表。而無導(dǎo)師學(xué)習(xí)亦稱為無監(jiān)督學(xué)習(xí),這時僅有一批輸入數(shù)據(jù),待診斷的模式類別未知,網(wǎng)絡(luò)結(jié)構(gòu)和連接權(quán)值根據(jù)某種聚類法則,自動對模式樣本進(jìn)行學(xué)習(xí)和調(diào)整,直至網(wǎng)絡(luò)的結(jié)構(gòu)和連接權(quán)值能合理地反映訓(xùn)練樣本的統(tǒng)計分布。再勵學(xué)習(xí)亦稱強(qiáng)化學(xué)習(xí),介于上述兩種情況之間,外部環(huán)境對系統(tǒng)輸出結(jié)果只給出評價(獎和罰)而不是給出正確答案,學(xué)習(xí)系統(tǒng)通過強(qiáng)化那些受獎勵的動作來改善自身性能。
1.3 神經(jīng)網(wǎng)絡(luò)的故障診斷能力
現(xiàn)行的故障診斷系統(tǒng)均具有以下兩個特點(diǎn):一是需要構(gòu)造專門的龐大的知識庫和數(shù)據(jù)庫以集中專家經(jīng)驗(yàn);二是具有串行運(yùn)行的處理方式。神經(jīng)網(wǎng)絡(luò)具有一些傳統(tǒng)的線性系統(tǒng)所沒有的如下優(yōu)點(diǎn):
(1)具有學(xué)習(xí)能力訓(xùn)練過地神經(jīng)網(wǎng)絡(luò)能存儲有關(guān)過程的信息,能直接從定量的、歷史的故障信息學(xué)習(xí)。可以根據(jù)對象的歷史數(shù)據(jù)進(jìn)行訓(xùn)練,然后將此信息與當(dāng)前測量數(shù)據(jù)進(jìn)行比較以確定故障。
(2)在神經(jīng)網(wǎng)絡(luò)中,信息分散在神經(jīng)元的連接上,單個的神經(jīng)元和連接權(quán)值都沒有很大用途,單個的神經(jīng)元和連接權(quán)值地?fù)p壞也不會對信息造成太大地影響,表明神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)地獸棒性(受干擾時自動穩(wěn)定的特性)和容錯能力。
(3)并行性各個神經(jīng)元在處理信息時是各自獨(dú)立的,分別接受輸入產(chǎn)生輸出,這種并行處理能力,使神經(jīng)網(wǎng)絡(luò)有可能用于實(shí)時快速信息處理。
(4)非線性神經(jīng)網(wǎng)絡(luò)因具有較好的非線性擬合能力,能夠有效地實(shí)現(xiàn)輸入空間到輸出空間的非線性映射,成為非線性系統(tǒng)研究地重要工具,也成為故障診斷的一種有效方法。
2 基干小波包的神經(jīng)網(wǎng)絡(luò)在燃?xì)庹{(diào)壓器故障識別中的應(yīng)用
2.1 基于小波包的神經(jīng)網(wǎng)絡(luò)故障識別的原理
燃?xì)庹{(diào)壓器出口壓力作為故障特征提取的原始信號,對出口壓力進(jìn)行小波包分解后,取適當(dāng)?shù)淖宇l帶的小波包能量函數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入向量,利用神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷。神經(jīng)網(wǎng)絡(luò)選用BP網(wǎng)隱含層激發(fā)函數(shù)采用正切S形函數(shù),輸出層激發(fā)函數(shù)采用線性函數(shù),網(wǎng)絡(luò)訓(xùn)練函數(shù)為自適應(yīng)學(xué)習(xí)率算法。輸入層節(jié)點(diǎn)數(shù)等于調(diào)壓器原始出口壓力信號的小波包分解子頻帶能量函數(shù)的向量維數(shù),輸出層的節(jié)點(diǎn)則由故障分類器的類型決定,主要有3類,分別為調(diào)壓器正常運(yùn)行、調(diào)壓器閥頭有污物和調(diào)壓器閥口堵塞。
2.2 經(jīng)網(wǎng)絡(luò)在燃?xì)庹{(diào)壓器故障識別中的應(yīng)用
2.2.1 實(shí)驗(yàn)數(shù)據(jù)來源
燃?xì)庹{(diào)壓器作為燃?xì)廨斉湎到y(tǒng)的重要部件,其安全運(yùn)行情況影響著整個燃?xì)廨斉湎到y(tǒng)的可靠性和安全性。筆者使用SCADA系統(tǒng)對城市燃?xì)夤芫W(wǎng)進(jìn)行數(shù)據(jù)采集和監(jiān)測,通過SCADA系統(tǒng)實(shí)現(xiàn)對燃?xì)廨敋夤芫W(wǎng)的全線遠(yuǎn)程監(jiān)控,不僅可以實(shí)現(xiàn)對控制工藝的改進(jìn),提高企業(yè)管理水平,而且將在確保安全生產(chǎn)基礎(chǔ)上獲得更大的經(jīng)濟(jì)效益。
SCADA監(jiān)控系統(tǒng)中燃?xì)庹{(diào)壓器的監(jiān)測內(nèi)容和控制對象是分離的,監(jiān)視發(fā)現(xiàn)問題,經(jīng)過人的主觀判斷找出問題原因,決定解決問題的辦法,通過遠(yuǎn)程對現(xiàn)場設(shè)備的控制而達(dá)到解決問題的目的,這種管理方式通常用于分散監(jiān)控點(diǎn)和過程控制要求一般的現(xiàn)場。集團(tuán)下屬分公司每天根據(jù)壓力自動記錄紙反映的燃?xì)庹{(diào)壓器出口壓力的情況來判斷調(diào)壓器是否出現(xiàn)故障,若下屬公司工作人員發(fā)現(xiàn)壓力自動記錄紙的壓力波動異?;蚴抢袡z修,則通知集團(tuán)總部監(jiān)控部門關(guān)閉調(diào)壓器前后閥門后進(jìn)行檢修。
2.2.2 燃?xì)庹{(diào)壓器故障識別
為了驗(yàn)證小波包能量檢測技術(shù)在燃?xì)庹{(diào)壓器特征提取的有效性,本文對燃?xì)庹{(diào)壓器在無故障、調(diào)壓器閥口堵塞、調(diào)壓器閥頭有污物這三種不同狀態(tài)15天SCADA系統(tǒng)所檢測調(diào)壓器實(shí)際出口壓力值進(jìn)行特征信號提取,調(diào)壓器出口壓力值為一天內(nèi)每五分鐘取一個數(shù),一天共取288點(diǎn)作為分析信號。
為了驗(yàn)證小波包能量檢測技術(shù)在燃?xì)庹{(diào)壓器特征提取的有效性,對分別采集的燃?xì)庹{(diào)壓器在無故障、調(diào)壓器閥口堵塞、調(diào)壓器閥頭有污物三種不同狀態(tài)出口壓力信號,利用小波包基函數(shù)db4分別對其進(jìn)行3層小波包分解,分別提取第三層從低頻到高頻成分的信號特征,每個節(jié)點(diǎn)都代表一定的信號特征,共得到8個頻帶。每種燃?xì)庹{(diào)壓器狀態(tài)15組出口壓力數(shù)據(jù),其中10組作為訓(xùn)練樣本,5組數(shù)據(jù)作為測試樣本??紤]到篇幅有限,這里不全部列出。表1為燃?xì)庹{(diào)壓器不同狀態(tài)測試樣本歸一化數(shù)據(jù)。
結(jié)論
比較測試結(jié)果與理想輸出狀態(tài)值可以看出,診斷結(jié)果較為準(zhǔn)確,可以證明神經(jīng)網(wǎng)絡(luò)對燃?xì)庹{(diào)壓器故障識別的可行性和有效性。
參考文獻(xiàn)
關(guān)鍵詞 徑向基神經(jīng)網(wǎng)絡(luò);大壩變形;監(jiān)控模型;預(yù)測預(yù)報;白石水庫
中圖分類號 TV135.3 文獻(xiàn)標(biāo)識碼 A 文章編號 1007-5739(2013)06-0191-01
變形監(jiān)控是了解大壩工作狀態(tài),實(shí)施安全管理的重要內(nèi)容之一。變形觀測方法簡便易行,其成果直觀可靠,能夠真實(shí)反映大壩的工作性態(tài),既是大壩安全監(jiān)測的主要監(jiān)測量,又是大壩安全監(jiān)控的重要指標(biāo)。
早期人們通過繪制過程線、相關(guān)圖,直觀地了解大壩變形測值的變化大小和規(guī)律,并運(yùn)用比較法、特征值統(tǒng)計法,檢查變形在數(shù)量變化大小、規(guī)律、趨勢等方面是否具有一致性和合理性,對大壩變形進(jìn)行定性分析。隨著各種分析理論的產(chǎn)生,模糊數(shù)學(xué)、突變理論、灰色系統(tǒng)理論、神經(jīng)網(wǎng)絡(luò)等理論方法被相繼引入大壩變形監(jiān)控領(lǐng)域。
1 徑向基神經(jīng)網(wǎng)絡(luò)
1.1 人工神經(jīng)網(wǎng)絡(luò)概述
人工神經(jīng)網(wǎng)絡(luò)是人工智能控制技術(shù)的主要分支之一,具有自適應(yīng)、自組織和實(shí)時學(xué)習(xí)等智能特點(diǎn),能夠?qū)崿F(xiàn)聯(lián)想記憶、非線性映射、分類識別等功能[1]。應(yīng)用人工神經(jīng)網(wǎng)絡(luò)的非線性函數(shù)逼近能力,構(gòu)建大壩監(jiān)控模型,能夠?qū)崿F(xiàn)對大壩變形的實(shí)時、有效監(jiān)控,其預(yù)報效果和精度遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的逐步回歸統(tǒng)計模型[2]。
基于BP算法的多層前饋神經(jīng)網(wǎng)絡(luò)應(yīng)用較為廣泛,但是存在建模難度較大,訓(xùn)練時間較長,容易陷入局部極小點(diǎn),不易找到理想模型等固有的缺陷。徑向基神經(jīng)網(wǎng)絡(luò)解決非線性影射(曲線擬合)問題,是通過網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練,在高維空間中尋找一個統(tǒng)計意義上能夠最佳擬合樣本數(shù)據(jù)的曲面,泛化(預(yù)測預(yù)報)等價于利用這個多維曲面對樣本進(jìn)行插值[3]。它采用局部逼近的方法,學(xué)習(xí)速度快,能夠更好地解決有實(shí)時性要求的在線分析問題。
1.2 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)
徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)一般由3層組成,輸入層只傳遞輸入信號到隱層,隱層節(jié)點(diǎn)由類高斯函數(shù)的輻射狀基函數(shù)構(gòu)成,輸出層節(jié)點(diǎn)通常是簡單的線性函數(shù)。
基函數(shù)對輸入信號在局部產(chǎn)生響應(yīng),當(dāng)輸入信號靠近基函數(shù)中央位置,即歐幾里得距離(歐氏距離)較近時,隱層節(jié)點(diǎn)將產(chǎn)生較大的輸出。神經(jīng)元根據(jù)各輸入向量與每個神經(jīng)元權(quán)值的距離產(chǎn)生輸出,只有那些與神經(jīng)元權(quán)值相差較小,距離較近的輸入向量才能激活,產(chǎn)生響應(yīng)。這種局部響應(yīng),使得徑向基網(wǎng)絡(luò)具有良好局部逼近能力。
一般對于一個n維輸入、m維隱層節(jié)點(diǎn)的徑向基網(wǎng)絡(luò),其輸入向量表示為:
X=(x1,x2,…,xi,…,xn)T(1)
那么,網(wǎng)絡(luò)輸出Y為:
Y=■wiφi(||X-vi||)(2)
式中,φi(||X-vi||)為徑向基函數(shù);||X-vi||為歐氏距離(范數(shù));vi為第i個徑向基函數(shù)中心,一個與X同維數(shù)的向量;wi為閾值。
1.3 徑向基神經(jīng)網(wǎng)絡(luò)和基于BP算法的多層前饋神經(jīng)網(wǎng)絡(luò)比較
徑向基網(wǎng)絡(luò)和基于BP算法的多層前饋神經(jīng)網(wǎng)絡(luò)一樣,都屬于有導(dǎo)師學(xué)習(xí)方式的前饋型反向傳播網(wǎng)絡(luò),都能解決非線性函數(shù)的擬合、逼近問題,但是他們之間也存在差異。
(1)網(wǎng)絡(luò)結(jié)構(gòu)不同。徑向基網(wǎng)絡(luò)只有一個隱層,而多層前饋神經(jīng)網(wǎng)絡(luò)的隱層可以是多層的,也可以是單層的。
(2)神經(jīng)元模型不同。徑向基網(wǎng)絡(luò)的隱層和輸出層激勵函數(shù),分別是基函數(shù)和線性函數(shù)。而多層前饋神經(jīng)網(wǎng)絡(luò)的隱層激勵函數(shù)一般為非線性函數(shù),輸出層激勵函數(shù)可以是非線性函數(shù),也可以是線性函數(shù)。
(3)隱層激勵函數(shù)計算方法不同。徑向基網(wǎng)絡(luò)基函數(shù)計算的是輸入向量與函數(shù)中心的歐氏距離,而多層前饋神經(jīng)網(wǎng)絡(luò)隱層激勵函數(shù)計算的是輸入向量與其連接權(quán)值向量的內(nèi)積。
(4)非線性映射的特性不同。由于它們所采用的隱層激勵函數(shù)以及激勵函數(shù)的計算方法不同,使得這2種網(wǎng)絡(luò)的權(quán)值、閾值修正方式也不同。在徑向基網(wǎng)絡(luò)訓(xùn)練過程中,只有被激活的神經(jīng)元才能修正權(quán)值和閾值,這種以指數(shù)衰減形式映射的局部特性被稱為函數(shù)的局部逼近。多層前饋神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,也是所有權(quán)值和閾值的調(diào)整過程,屬于全局尋優(yōu)模式。
2 白石水庫大壩變形徑向基神經(jīng)網(wǎng)絡(luò)模型
2.1 白石水庫工程概況
白石水庫位于遼寧省北票市上園鎮(zhèn)附近的大凌河干流上,總庫容16.45億m3,是干流上唯一的大(I)型控制性骨干工程。大壩為混凝土重力壩,部分采用RCD碾壓混凝土技術(shù)。最大壩高49.3 m,壩頂長513 m,分為32個壩段。水庫1996年9月正式開工,1999年9月下閘蓄水。
2.2 大壩變形徑向基神經(jīng)網(wǎng)絡(luò)模型
一般情況下,大壩變形數(shù)學(xué)模型分為3個分量,即水壓變形分量(δH)、溫度變形分量(δT)和時效變形分量(δt),模型可以表示為[4]:
δ=δH+δT+δt(3)
該文水壓變形分量采用壩前水深(H)的一次冪、二次冪、三次冪呈線性關(guān)系;溫度變形分量采用1、15、30、60、90 d的庫區(qū)日常平均氣溫;時效變形分量選用對數(shù)函數(shù)和線性函數(shù)2種。根據(jù)公式(3),設(shè)計網(wǎng)絡(luò)輸入為11個節(jié)點(diǎn),輸出為1個節(jié)點(diǎn)的3層大壩變形徑向基神經(jīng)網(wǎng)絡(luò)。
2.3 神經(jīng)網(wǎng)絡(luò)模型預(yù)測、預(yù)報效果分析
為比較徑向基神經(jīng)網(wǎng)絡(luò)的擬合和預(yù)報效果,以白石水庫6#壩段壩頂變形為例,分別建立傳統(tǒng)的逐步回歸統(tǒng)計模型、BP神經(jīng)網(wǎng)絡(luò)與徑向基神經(jīng)網(wǎng)絡(luò)模型3種模型,特征值見表1,預(yù)報曲線見圖1??梢钥闯觯孩購较蚧窠?jīng)網(wǎng)絡(luò)模型、BP神經(jīng)網(wǎng)絡(luò)模型、統(tǒng)計回歸模型的復(fù)相關(guān)系數(shù)均高于0.9,說明3種模型擬合程度良好,3種模型均可以作為變形監(jiān)控模型;②從殘差平方和、平均相對誤差、殘差變幅等方面比較,廣義回歸徑向基神經(jīng)網(wǎng)絡(luò)監(jiān)控模型的擬合效果最佳,其次是BP神經(jīng)網(wǎng)絡(luò)模型,統(tǒng)計回歸模型最差;③基于LM算法的BP神經(jīng)網(wǎng)絡(luò)監(jiān)控模型的殘差平方和、殘差最小值,分別為10.15和-0.90 mm,相比之下預(yù)報精度最高;廣義回歸徑向基神經(jīng)網(wǎng)絡(luò)監(jiān)控模型次之,殘差平方和、殘差最小值分別為50.22和-2.38 mm;統(tǒng)計回歸模型最差,殘差平方和、殘差最小值分別為110.89和-2.70 mm。
3 結(jié)論
應(yīng)用人工神經(jīng)網(wǎng)絡(luò),建立大壩變形的人工智能監(jiān)控模型,能夠?qū)崿F(xiàn)對大壩變形的實(shí)時、有效監(jiān)控,其預(yù)報效果和精度遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的逐步回歸統(tǒng)計模型。BP網(wǎng)絡(luò)的預(yù)報精度最高,但它存在建模難度較大,訓(xùn)練時間較長,容易陷入局部極小點(diǎn),不易找到理想模型等缺點(diǎn)。徑向基神經(jīng)網(wǎng)絡(luò)模型,雖然在預(yù)報精度上略遜于BP神經(jīng)網(wǎng)絡(luò),但是在不過于苛求預(yù)報精度的前提下,從建模容易程度、訓(xùn)練速度和預(yù)報精度等方面綜合考慮,遠(yuǎn)遠(yuǎn)好于BP神經(jīng)網(wǎng)絡(luò)。
4 參考文獻(xiàn)
[1] 韓力群.人工神經(jīng)網(wǎng)絡(luò)教程[M].北京:北京郵電大學(xué)出版社,2006.
[2] 韓衛(wèi).基于神經(jīng)網(wǎng)絡(luò)的大壩變形智能監(jiān)控模型研究[D].大連:大連理工大學(xué),2009.
關(guān)鍵詞 供應(yīng)鏈金融中小企業(yè)BP神經(jīng)網(wǎng)絡(luò)
1引言
本文主要是對中小企業(yè)貸款信用風(fēng)險進(jìn)行預(yù)測??紤]到各個商業(yè)銀行都積累了有關(guān)信貸業(yè)務(wù)的海量數(shù)據(jù),本文以一些企業(yè)的貸款信息數(shù)據(jù)為對象,通過運(yùn)用BP神經(jīng)網(wǎng)絡(luò),根據(jù)中小企業(yè)信息的訓(xùn)練集數(shù)據(jù)找到可以描述并且可以區(qū)分?jǐn)?shù)據(jù)類別的分類模型,從而通過它預(yù)測數(shù)據(jù)的類別,挖掘出有價值的信息,為商業(yè)銀行供應(yīng)鏈金融貸款風(fēng)險管理起到積極的輔助作用。
2相關(guān)理論
供應(yīng)鏈金融跳出了銀行授信只針對單個企業(yè)的傳統(tǒng)局限,站在產(chǎn)業(yè)供應(yīng)鏈全局的高度,切合產(chǎn)業(yè)經(jīng)濟(jì),提供金融服務(wù),將資金有效注入處于相對弱勢的中小企業(yè),有望成為解決國內(nèi)中小企業(yè)融資難問題的一個有效途徑。
BP神經(jīng)網(wǎng)絡(luò),由信息的正向傳播和誤差的反向傳播兩個過程組成。輸入層各神經(jīng)元負(fù)責(zé)接收來自外界的輸入信息,并傳遞給中間層各神經(jīng)元;中間層是內(nèi)部信息處理層,根據(jù)信息變化能力的需求,中間層可以設(shè)計為單隱層(多隱層)結(jié)構(gòu);最后一個隱層傳遞到輸出層各神經(jīng)元的信息,由輸出層向外界輸出信息處理結(jié)果。當(dāng)實(shí)際輸出與期望輸出不符時,進(jìn)入誤差的反向傳播階段。誤差通過輸出層,按誤差梯度下降的方式修正各層權(quán)值,向隱層、輸入層反傳。通過信息正向傳播和誤差反向傳播過程,是神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程,此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可以接受的程度。
3基于BP神經(jīng)網(wǎng)絡(luò)的供應(yīng)鏈金融信用風(fēng)險預(yù)測模型設(shè)計
(1)評價指標(biāo)的選取
通過對己有的企業(yè)信用風(fēng)險評價體系研究,在構(gòu)建供應(yīng)鏈金融信用風(fēng)險評估指標(biāo)體系時應(yīng)遵循以下指導(dǎo)原則:
全面性原則:為了全面評價中小融資企業(yè)的信用風(fēng)險,在構(gòu)建指標(biāo)時,所選取的指標(biāo)覆蓋面要廣,盡可能完整地反應(yīng)影響企業(yè)信用的各方面因,即要全面反應(yīng)企業(yè)目前信用綜合水平,又要反映出企業(yè)長期的發(fā)展前景。
層次性原則:評價指標(biāo)應(yīng)分出層次,建立從低到高、從簡單到綜合的層次分布結(jié)構(gòu),最底層指標(biāo)要具體到企業(yè)的日常經(jīng)營活動,各層次具有逐級綜合的趨勢。在每一個層次的指標(biāo)篩選中應(yīng)突出重點(diǎn),避免不必要的重復(fù)計算。
操作性原則:指標(biāo)數(shù)據(jù)要便于采集,可以衡量。對于定量的指標(biāo),計算公式要科學(xué)合理,評價方法便于操作對于定性的指標(biāo),評價要盡量避免過多主觀因素影響。
本文在已有的信用評價指標(biāo)基本框架之上結(jié)合供應(yīng)鏈金融自身的特點(diǎn),并采用專家調(diào)查法最終確定了本文的指標(biāo)體系。本文將指標(biāo)分為兩類,一類是硬指標(biāo),包括盈利能力、經(jīng)營能力、償債能力、成長潛力四個方面;另一類是軟指標(biāo),包括財務(wù)報表質(zhì)量、領(lǐng)導(dǎo)及員工素質(zhì)、行業(yè)背景及發(fā)展前景、核心企業(yè)狀況、供應(yīng)鏈穩(wěn)定性、交易資產(chǎn)特征六個方面,所以BP神經(jīng)網(wǎng)絡(luò)的輸入層節(jié)點(diǎn)數(shù)為10。
(2)信用風(fēng)險預(yù)警模型的建立
BP網(wǎng)絡(luò)模型包括其輸入輸出模型、作用函數(shù)模型、誤差計算模型和自學(xué)習(xí)模型。
①節(jié)點(diǎn)輸出模型
隱節(jié)點(diǎn)輸出模型:Oj=f(∑Wij×Xi-?j),輸出節(jié)點(diǎn)輸出模型:
Yk=f(∑Tjk×Oj-?k)(2)
f-非線形作用函數(shù);-神經(jīng)單元閾值。
各層神經(jīng)元個數(shù)對輸入層起緩沖存儲器的作用,其神經(jīng)元數(shù)目取決于輸入矢量的維數(shù)根據(jù)上文確定的指標(biāo)體系可以確定輸入層的神經(jīng)元數(shù)目為10。輸出層神經(jīng)元對應(yīng)于信用評價結(jié)果。在本文中,研究對象的期望輸出為對中小企業(yè)信用風(fēng)險的總體評價,是一個數(shù)值(0或1),所以輸出層神經(jīng)元數(shù)目選擇為1。本文隱層到輸出層的傳輸函數(shù)分別為tansig和logsig。
②作用函數(shù)模型
作用函數(shù)是反映下層輸入對上層節(jié)點(diǎn)刺激脈沖強(qiáng)度的函數(shù)又稱刺激函數(shù),一般取為(0,1)內(nèi)連續(xù)取值Sigmoid函數(shù):
f(x)=1/(1+e-x)(3)
③誤差計算模型
誤差計算模型是反映神經(jīng)網(wǎng)絡(luò)期望輸出與計算輸出之間誤差大小的函數(shù):
Ep=1/2×∑(tpi-Opi)2
(4)
tpi-i節(jié)點(diǎn)的期望輸出值;Opi-i節(jié)點(diǎn)計算輸出值。通過誤差計算模型,可以把誤差限定在特定范圍,從而使計算結(jié)果更加精確。
④自學(xué)習(xí)模型
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,即連接下層節(jié)點(diǎn)和上層節(jié)點(diǎn)之間的權(quán)重拒陣Wij的設(shè)定和誤差修正過程。BP網(wǎng)絡(luò)有師學(xué)習(xí)方式-需要設(shè)定期望值和無師學(xué)習(xí)方式-只需輸入模式之分。自學(xué)習(xí)模型為:
Wij(n+1)=?×Фi×Oj+a×Wij(n)(5)
-學(xué)習(xí)因子;Фi-輸出節(jié)點(diǎn)i的計算誤差;Oj-輸出節(jié)點(diǎn)j的計算輸出;a-動量因子。
⑤模型的具體應(yīng)用
本文選取了20家商業(yè)銀行開展供應(yīng)鏈金融業(yè)務(wù)的中小企業(yè)作為樣本,樣本分為兩部分,一部分屬于按時還款的企業(yè),共有13家。另外一部分則是未按時還款的企業(yè),共有7家?,F(xiàn)在我們選取按時還款企業(yè)中的前10家和未按時還款企業(yè)中的前5家作為訓(xùn)練樣本。而剩下的3家按時還款企業(yè)和2家未按時還款企業(yè)作為后面用做仿真的樣本。這些企業(yè)數(shù)據(jù)是針對上文建立的信用評價指標(biāo)體系選取的,它有10個節(jié)點(diǎn)。經(jīng)過traingdm反復(fù)訓(xùn)練得到的最合適的參數(shù):
通過輸入仿真樣本,進(jìn)而對上面所構(gòu)建的網(wǎng)絡(luò)模型進(jìn)行檢驗(yàn)。輸入命令后,得到的仿真輸出值如下所示:
企業(yè)一:(仿真輸出值:0.9998目標(biāo)值:1.0000絕對誤差:0.0002相對誤差:0.02%)
企業(yè)二:(仿真輸出值:1.0000目標(biāo)值:1.0000絕對誤差:0.0181相對誤差:1.81%)
企業(yè)三:(仿真輸出值:0.9985目標(biāo)值:1.0000絕對誤差:0.0015相對誤差:0.15%)
企業(yè)四:(仿真輸出值:0.0008目標(biāo)值:0.0000絕對誤差:0.0008相對誤差:0.08%)
可見,網(wǎng)絡(luò)的輸出值和目標(biāo)值之間的絕對誤差都在0.025以下,誤差比較小,基本達(dá)到了預(yù)期效果。通過上面構(gòu)建的模型,我們可以通過具體的量化數(shù)值合理預(yù)測中小企業(yè)的信用授信水平,為商業(yè)銀行合理的授信于中小企業(yè)提供了科學(xué)合理的參考標(biāo)準(zhǔn)。
4結(jié)論
本文使用BP人工神經(jīng)網(wǎng)絡(luò)方法構(gòu)建了供應(yīng)鏈金融風(fēng)險預(yù)測模型,應(yīng)用計算機(jī)工具可以方便地完成算法設(shè)計和數(shù)據(jù)運(yùn)算,這不僅能為商業(yè)銀行在授信于中小企業(yè)時能提供科學(xué)的手段和可靠的依據(jù),而且還可以為中小企業(yè)衡量自身的融資能力提供依據(jù),對其改善企業(yè)經(jīng)營狀況,提高融資水平都有很好的借鑒作用,因而不失為供應(yīng)鏈金融信用風(fēng)險預(yù)測的較為有效的方法。
參考文獻(xiàn):
[1]于立勇.商業(yè)銀行信用風(fēng)險評估預(yù)測模型研究[J].管理科學(xué)學(xué)報,2003,(6):48-54,100.
[2]葉春明,馬慧民,李丹,等.神經(jīng)網(wǎng)絡(luò)在供應(yīng)鏈管理績效指標(biāo)評價中的應(yīng)用研究[J].工業(yè)工程與管理,2005,(5):39-42,47.
關(guān)鍵詞 BP神經(jīng)網(wǎng)絡(luò) 海西物流 經(jīng)濟(jì)預(yù)測
中圖分類號:F252 文獻(xiàn)標(biāo)識碼:A
1 BP神經(jīng)網(wǎng)絡(luò)理論
本文借助于MATLAB神經(jīng)網(wǎng)絡(luò)工具箱來實(shí)現(xiàn)多層前饋BP網(wǎng)絡(luò)的建模。神經(jīng)網(wǎng)絡(luò)的實(shí)際輸出值與輸入值以及各層權(quán)值和閾值有關(guān),為了使實(shí)際輸出值與網(wǎng)絡(luò)期望輸出值相吻合,可用含有一定數(shù)量學(xué)習(xí)樣本的樣本集和相應(yīng)期望輸出值的集合來訓(xùn)練網(wǎng)絡(luò)。
另外,目前尚未找到較好的網(wǎng)絡(luò)構(gòu)造方法來確定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和權(quán)系數(shù)來描述給定的映射或逼近一個未知的映射,只能通過學(xué)習(xí)方式得到滿足要求的網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)可以理解為:對確定的網(wǎng)絡(luò)結(jié)構(gòu),尋找一組滿足要求的權(quán)系數(shù),使給定的誤差函數(shù)最小。設(shè)計多層前饋網(wǎng)絡(luò)時,主要側(cè)重試驗(yàn)、探討多種模型方案,在實(shí)驗(yàn)中改進(jìn),直到選取一個滿意方案為止,可按下列步驟進(jìn)行:對任何實(shí)際問題先都只選用一個隱層;使用較少的隱層節(jié)點(diǎn)數(shù);不斷增加隱層節(jié)點(diǎn)數(shù),直到獲得滿意性能為止。訓(xùn)練過程實(shí)際上是根據(jù)目標(biāo)值與網(wǎng)絡(luò)輸出值之間誤差的大小反復(fù)調(diào)整權(quán)值和閾值,直到此誤差達(dá)到預(yù)定值為止。
確定了網(wǎng)絡(luò)層數(shù)、每層節(jié)點(diǎn)數(shù)、傳遞函數(shù)、初始權(quán)系數(shù)、學(xué)習(xí)算法等也就確定了BP網(wǎng)絡(luò)。確定這些選項時有一定的指導(dǎo)原則,但更多的是靠經(jīng)驗(yàn)和試湊。
2 數(shù)據(jù)建模分析
本文的原始數(shù)據(jù)來源于福建省統(tǒng)計局官方網(wǎng)站。按照對物流經(jīng)濟(jì)產(chǎn)生影響的因素分析,選取用于物流需求規(guī)模預(yù)測的經(jīng)濟(jì)指標(biāo)為: 區(qū)域國民生產(chǎn)總值X1 (億元)、第一產(chǎn)業(yè)產(chǎn)值X2(億元)、第二產(chǎn)業(yè)產(chǎn)值X3 (億元)、第三產(chǎn)業(yè)產(chǎn)值X4(億元)、社會消費(fèi)品總額X5(億元),第二產(chǎn)業(yè)增加值X6(億元)和進(jìn)出口總額X7 (萬元)。其中,三大產(chǎn)業(yè)產(chǎn)值不僅考慮了海峽西岸經(jīng)濟(jì)區(qū)的經(jīng)濟(jì)總量,還考慮了經(jīng)濟(jì)結(jié)構(gòu)對物流需求規(guī)模的影響:由于區(qū)域內(nèi)貿(mào)易和商業(yè)流通也是區(qū)域物流需求的重要組成部分,因此采用社會消費(fèi)品總額、進(jìn)出口總額和第二產(chǎn)業(yè)增加值的經(jīng)濟(jì)指標(biāo)。物流指標(biāo)包括公路建設(shè)里程X8(千米)、汽車數(shù)量X9(輛)、鐵路營業(yè)長度X10(千米),輸出指標(biāo)為貨運(yùn)量Y(萬噸)。
對獲取的原始樣本數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行歸一化,以提高神經(jīng)網(wǎng)絡(luò)收斂的速度。把1981――2006年25個年度的數(shù)據(jù)樣本作為學(xué)習(xí)樣本, 2007年的數(shù)據(jù)作為檢測樣本。最后建立的指標(biāo)體系包括10個輸入指標(biāo),1個輸出指標(biāo)來進(jìn)行貨物運(yùn)輸量的預(yù)測。
運(yùn)用BP網(wǎng)絡(luò)進(jìn)行貨運(yùn)量預(yù)測的思路是:挑選出認(rèn)為可能影響到貨運(yùn)量的因素變量,將它們作為神經(jīng)網(wǎng)絡(luò)的輸入,然后將待測的貨運(yùn)量作為網(wǎng)絡(luò)的輸出就可以了,利用神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、自適應(yīng)、自動逼近的能力完成預(yù)測。運(yùn)用BP網(wǎng)絡(luò)進(jìn)行貨運(yùn)量預(yù)測的數(shù)學(xué)模型可以用程序如下:
net=newff(minmax(P_train),[51 1],{'tansig''purelin'},'traingdx');
net=init(net);
net.trainParam.epochs=10000; net.trainParam.goal=0.01;
net.trainParam.lr=0.01;
net=train(net,P_train,T_train);
Y=sim(net,P_test)
TRAINGDX, Epoch 0/10000, MSE 1.95506/0.01, Gradient 9.82722/1e-006
TRAINGDX, Epoch 25/10000, MSE 0.182945/0.01, Gradient 1.12175/1e-006
TRAINGDX, Epoch 50/10000, MSE 0.042736/0.01, Gradient 0.321221/1e-006
TRAINGDX, Epoch 75/10000, MSE 0.0145811/0.01, Gradient 0.074689/1e-006
TRAINGDX, Epoch 82/10000, MSE 0.00992297/0.01, Gradient 0.0605203/1e-006
TRAINGDX, Performance goal met.
Y = 0.9004
與實(shí)際值0.9的實(shí)際誤差僅0.04%取得了良好的預(yù)測效果。
關(guān)鍵詞:電力;預(yù)測;極限學(xué)習(xí)機(jī)
中圖分類號: TP18 文獻(xiàn)標(biāo)識碼: A 文章編號: 1673-1069(2016)22-109-3
1 概述
在日常生活中,電力能源與老百姓的生活息息相關(guān),電力電價在各方利益關(guān)系中扮演著極其重要的角色。近些年來,各類企業(yè)和科研機(jī)構(gòu),都有大量的專業(yè)人員在對電價的預(yù)測做著各種科學(xué)研究。準(zhǔn)確的電價預(yù)測關(guān)系到社會各階層,包括普通的居民用電,大型重工業(yè)企業(yè)商業(yè)用電??梢哉f,當(dāng)前社會,電力的應(yīng)用無處不在,電價的準(zhǔn)確預(yù)測對全社會能源結(jié)構(gòu)變化都會產(chǎn)生深遠(yuǎn)的影響。另外,由于電力能源逐步走向多元化,除了傳統(tǒng)的火電、水電、風(fēng)電、核電,新興的生物發(fā)電、太陽能發(fā)電等技術(shù)快速發(fā)展,在許多國家應(yīng)用廣泛,并且不同的電能產(chǎn)生方式造就的成本差異非常大,上網(wǎng)電價差異必然不同,這就給電價的預(yù)測帶來了很多的困難。
傳統(tǒng)的電價預(yù)測有很多種,常見的如:模擬電力市場實(shí)時運(yùn)行來計算市場出清價格。在做建模之前,實(shí)施人員要去調(diào)研一些關(guān)鍵信息,諸如發(fā)電廠的分布、機(jī)組容量、發(fā)電負(fù)荷,輸配電系統(tǒng)的運(yùn)行狀態(tài),大型企業(yè)的發(fā)展規(guī)劃方向等,同時要根據(jù)電網(wǎng)運(yùn)行規(guī)律掌握電網(wǎng)潮流走向、輸配電趨勢以及電網(wǎng)升級改造等因素。該類方法在短時間內(nèi),能夠很好預(yù)測電價走向,與電力市場實(shí)際需求吻合度也很高,但是僅僅適用于大中型企業(yè),對于規(guī)模不大,又有這方面需求的用電單位和個人來講,運(yùn)用這種方式預(yù)測電價有很多不便。還有一種常用的預(yù)測方法,叫作統(tǒng)計學(xué)預(yù)測方法,就是通過搜集已發(fā)生電價和電費(fèi)統(tǒng)計單位的與電價相關(guān)的信息建立預(yù)測模型。這種方法與模擬電力市場實(shí)時運(yùn)行來計算市場價格相比,操作起來會簡單一些,不需要太多的信息量,就可以搭建模型。統(tǒng)計學(xué)預(yù)測方法中比較常見的方法有時間序列法、計量經(jīng)濟(jì)學(xué)方法和智能算法等。
本文討論的是一種新的預(yù)測方法,是基于多極限學(xué)習(xí)機(jī)的預(yù)測方法。同時,考慮對預(yù)測結(jié)果有較大影響的精度等級等問題,把多個極限學(xué)習(xí)機(jī)融合進(jìn)來,從而形成多神經(jīng)網(wǎng)絡(luò)建模方法,這種方法的融入,可以提高日前電價預(yù)測模型的預(yù)測精度。
2 多源信息的融合
廣義的多源信息融合技術(shù)有多種定義,本文簡單介紹一下狹義的多源信息融合技術(shù)。這種技術(shù)是利用計算機(jī)的自動獲取、分類、統(tǒng)計、分析所得數(shù)據(jù),通過這種方式得到獨(dú)立于個別信息源之外的其他信息,從而達(dá)到研究需要取得的成果和目標(biāo)的一項技術(shù)。多源信息融合有很多優(yōu)勢,諸如可以在一定程度上加強(qiáng)系統(tǒng)的可靠性,也可以對系統(tǒng)影響量較大的魯棒性有很大改觀。另外,多源信息融合在數(shù)據(jù)測量的廣度和立體空間上有很大的拓展。通過多源信息融合,還可以增強(qiáng)數(shù)據(jù)的可信任度和系統(tǒng)分辨能力。
信息融合技術(shù)最早應(yīng)用于發(fā)達(dá)國家的國防科技領(lǐng)域,經(jīng)過多年的發(fā)展,對應(yīng)用這項技術(shù)的國家軍事水平提升有很大的影響。后期的社會發(fā)展,對于高科技帶來的衍生品需求量日益加大,因此這項技術(shù)在民用智能化信息綜合處理技術(shù)研究上得到廣泛重視。尤其是多源信息融合技術(shù),逐步在眾多信息整合技術(shù)中脫穎而出,成為各相關(guān)領(lǐng)域角力的有力工具。另外,雖然很多公司、企業(yè)在廣泛使用信息融合技術(shù),但是由于這項技術(shù)的需求背景是信息處理技術(shù)發(fā)展需要,因此,到目前為止,信息融合技術(shù)尚無自己的理論體系。現(xiàn)在人們研究的信息融合技術(shù)多數(shù)還僅限于理論方法的建立。
人工神經(jīng)網(wǎng)絡(luò)在多個領(lǐng)域有應(yīng)用,本文所說的人工神經(jīng)網(wǎng)絡(luò)具有并行結(jié)構(gòu)和其特有的學(xué)習(xí)方式,信息的融合是在把人工神經(jīng)網(wǎng)絡(luò)作為信息融合中心而完成的。由大量互聯(lián)的處理單元連接而成的人工神經(jīng)網(wǎng)絡(luò),是基于已接受樣本的一致性去進(jìn)行分類標(biāo)準(zhǔn)劃分的,在這方面的學(xué)習(xí)能力具有很強(qiáng)的自適應(yīng)性。可以從網(wǎng)絡(luò)權(quán)值分布上看到這個特點(diǎn),知識的獲取是通過神經(jīng)網(wǎng)絡(luò)特定的學(xué)習(xí)算法來實(shí)現(xiàn)的。為了有效避開模式識別方法中建模和特征提取過程,必須對神經(jīng)網(wǎng)絡(luò)分布式信息存儲和并行處理的方式進(jìn)行充分地利用,這種做法對于模型不符和特征選擇不當(dāng)造成的負(fù)因子規(guī)避非常有效,可以大大提高識別系統(tǒng)的性能。
信息融合的過程如下:
第一步是建立拓?fù)浣Y(jié)構(gòu)??山Y(jié)合將要建立模型系統(tǒng)的主要特點(diǎn)建立。
第二步是處理已知信息,劃歸一個單個的輸入函數(shù)(映射函數(shù)),神經(jīng)網(wǎng)絡(luò)與環(huán)境進(jìn)行交互作用后,得到輸入函數(shù)的變化規(guī)律,再把規(guī)律結(jié)果反饋給神經(jīng)網(wǎng)絡(luò)。
第三步是輸入函數(shù)后經(jīng)過模型的信息整合得到預(yù)測結(jié)果的過程,是輸入函數(shù)通過神經(jīng)網(wǎng)絡(luò)融合系統(tǒng)經(jīng)過學(xué)習(xí)、確定權(quán)值的過程。
3 極限學(xué)習(xí)機(jī)算法
單隱含層前饋神經(jīng)網(wǎng)絡(luò)(SLFNs―single-hidden layer feedforward neural networks)算法――極限學(xué)習(xí)機(jī)(ELM-extreme learning machine)。極限學(xué)習(xí)機(jī)可以任意產(chǎn)生隱含層節(jié)點(diǎn)參數(shù)。經(jīng)過單隱含層前饋神經(jīng)網(wǎng)絡(luò)的輸出得到相應(yīng)權(quán)值。經(jīng)過任意選取的隱含層節(jié)點(diǎn)參數(shù),一個線性系統(tǒng)形成了,就是單隱含層前饋神經(jīng)網(wǎng)絡(luò)。從而得到的輸出權(quán)值,是通過逆操作隱含層的輸出矩陣而來的。通過各類科研單位的研究,我們發(fā)現(xiàn),極限學(xué)習(xí)機(jī)有兩大優(yōu)點(diǎn),一個是具有廣泛的全局搜索功能,另一個是操作起來非常簡便。在極限學(xué)習(xí)機(jī)中,運(yùn)用S型函數(shù)、正弦和復(fù)合函數(shù)等使用起來也很便利。一些不可微函數(shù)或者不連續(xù)函數(shù)一樣可以成為極限學(xué)習(xí)機(jī)的激活函數(shù)。這個方法和常用的BP學(xué)習(xí)算法和SVM算法比較,效率更高。常用的BP學(xué)習(xí)算法局部非常小,學(xué)習(xí)率不宜選擇。極限學(xué)習(xí)機(jī)算法則具有更好的泛化能力,參數(shù)確認(rèn)過程也比較簡單,從而省時且精度很高。ELM算法內(nèi)容如下:
3.1 標(biāo)準(zhǔn)SLFN的數(shù)學(xué)定義
隱含層節(jié)點(diǎn)數(shù)量為L,那么,單隱含層前饋神經(jīng)網(wǎng)絡(luò)輸出如下:
公式中的ai,bi為隱含層節(jié)點(diǎn)學(xué)習(xí)參數(shù),βi=[βi1,βi2,…βim]T為隱含層第i個節(jié)點(diǎn)到輸出層的連接權(quán)值,G(ai,bi,x)為第i個隱含層節(jié)點(diǎn)與輸入x的關(guān)系,激活函數(shù)g(x):RR(例如S型函數(shù)),則有
公式中的ai表示輸入層到第i個隱含層節(jié)點(diǎn)的連接權(quán)值向量,bi表示第i個隱含層節(jié)點(diǎn)的閾值。ai?x為向量ai和x的內(nèi)積。
3.2 極限學(xué)習(xí)機(jī)ELM(extreme learning machine)
隨機(jī)抽取N個樣本, 表位輸入,
表示目標(biāo)輸出。如果一個有L個隱含節(jié)點(diǎn)的SLFN能以0誤差來逼近這N個樣本,則存在βi,ai,bi,有
H表示為網(wǎng)絡(luò)的隱含層輸出矩陣,第i列是與輸入x1,x2,…,xN相關(guān)的第i個隱含層節(jié)點(diǎn)的輸出向量,第j行表示與輸入xi相關(guān)的隱含層輸出向量。
研究發(fā)現(xiàn),隱含層節(jié)點(diǎn)數(shù)L往往比訓(xùn)練樣本數(shù)N小,從而使訓(xùn)練誤差無限逼近一個非零的訓(xùn)練誤差ε。SLFNs的隱含層節(jié)點(diǎn)參數(shù)ai,bi(輸入權(quán)值和閾值)在訓(xùn)練過程中可以取隨機(jī)值。這樣式(4)輸出權(quán)值β:
這里H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
ELM算法可以歸納為下面三個步驟:給出一個訓(xùn)練集
,激活函數(shù)以及隱含層節(jié)點(diǎn)數(shù),則
①隨機(jī)產(chǎn)生隱含層節(jié)點(diǎn)參數(shù)(ai,bi),i=1,…,L。
②計算隱含層輸出矩陣H。
③計算輸出權(quán)值:β:β=H+T。
4 多極限學(xué)習(xí)機(jī)(ELM)融合建模
多極限學(xué)習(xí)機(jī)(ELM)融合建模,為了提高精度等級,為信息融合做準(zhǔn)備,把多個預(yù)測結(jié)果結(jié)合起來,一方面把有n個子數(shù)據(jù)集的訓(xùn)練數(shù)據(jù)進(jìn)行數(shù)據(jù)配準(zhǔn),對分別建立ELM神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)進(jìn)行訓(xùn)練,建立n個預(yù)測模型。另一方面,得到訓(xùn)練誤差權(quán)重,據(jù)此融合得到終極模型,圖1中,Y1,Y2,…Yn為n個子模型的輸出;W1,W2…Wn為每個子模型的權(quán)重(W1+W2+…+Wn=1。)權(quán)重的初始值為W1W2=…=Wn=,隨著訓(xùn)練的深入,觀測誤差,并調(diào)整子模型的權(quán)重,較大權(quán)重賦予好的模型。從而保證子模型性能最好的發(fā)揮各自的作用,Y為最終輸出,且為最優(yōu)。
5 仿真實(shí)驗(yàn)
下面用某電力公司轄下電網(wǎng)為研究對象。訓(xùn)練數(shù)據(jù)選擇2~5月電價數(shù)據(jù),建立日前電價預(yù)測模型;檢驗(yàn)數(shù)據(jù)為6月份。模型中子模型的數(shù)目根據(jù)實(shí)驗(yàn)結(jié)果確定為n,即n為7個。
比較單一ELM和單一BP神經(jīng)網(wǎng)絡(luò)兩種預(yù)測模型結(jié)果與多ELM日前電價預(yù)測模型預(yù)測結(jié)果如下表1。提取絕對百分比誤差:
和均方根誤差:
yi為實(shí)際值,i為預(yù)測值。經(jīng)研究發(fā)現(xiàn),上述三種研究結(jié)果有差到好的排列次序?yàn)椋夯贐P神經(jīng)網(wǎng)絡(luò)的預(yù)測模型〈基于ELM神經(jīng)網(wǎng)絡(luò)的預(yù)測模型〈多ELM融合預(yù)測模型,即多ELM融合預(yù)測模型最優(yōu)。
【關(guān)鍵詞】金融;P2P;網(wǎng)絡(luò)借貸
1 緒論
在P2P平臺風(fēng)險評估研究方面,國內(nèi)外已有較多相關(guān)資料。Byan Jankar,M Heikkil,J Mezei(2015)構(gòu)建神經(jīng)網(wǎng)絡(luò)信用評級體系,發(fā)現(xiàn)其準(zhǔn)確度比傳統(tǒng)的回歸模型更高。國內(nèi),劉峙廷(2013)結(jié)合德國IPC風(fēng)險評估,將風(fēng)險量化,建立適合我國P2P網(wǎng)貸平臺的信用評價模型。曹玲燕(2014)結(jié)合模糊數(shù)學(xué)與層次分析方法對評估平臺風(fēng)險進(jìn)行了評估。路晨(2015)借助風(fēng)險矩陣模型,對P2P平臺不同風(fēng)險進(jìn)行排序,提出了應(yīng)對不同風(fēng)險的措施。上述研究主要以一間機(jī)構(gòu)為研究對象,研究的風(fēng)險指標(biāo)體系有待完善,因此不存在廣泛性。在接下來的討論中,將在前人研究基礎(chǔ)上進(jìn)一步拓展和完善評估模型。
2 BP神經(jīng)網(wǎng)絡(luò)風(fēng)險評估模型
2.1BP神經(jīng)網(wǎng)絡(luò)模型簡介
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò),即方向傳播算法,在1986年由Rumelhart和McCelland提出,是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。它能夠?qū)W習(xí)和儲存大量的輸入與輸出映射關(guān)系,而無需揭示這種映射的數(shù)學(xué)方程,是一種仿真模擬運(yùn)算系統(tǒng),能夠?qū)崿F(xiàn)自主學(xué)習(xí),尤其擅長進(jìn)行數(shù)據(jù)預(yù)測。BP神經(jīng)網(wǎng)絡(luò)模型有三層結(jié)構(gòu),包括輸入層(input)、輸出層(output layer)、隱層(hidden layer)。其學(xué)習(xí)方式是通過處理大量的輸入變量和輸出變量,擬合出最貼近的映射關(guān)系,建立非線性模型。
2.2數(shù)據(jù)來源
樣本數(shù)據(jù)主要來自“網(wǎng)貸之家”與“佳璐數(shù)據(jù)”。選取160家網(wǎng)貸平臺(健康平臺及問題平臺各80個)14個指標(biāo),共獲得2240個數(shù)據(jù)。同時為了控制數(shù)據(jù)變動所帶來的誤差,我們選擇了2016年6月1日的各平臺的歷史數(shù)據(jù)作為我們的參考依據(jù)。
2.3指標(biāo)體系的建立
本文借鑒國際通行的駱駝評級法,并考慮到我國P2P網(wǎng)貸行業(yè)的實(shí)際發(fā)展情況,建立了如表1的雙重指標(biāo)體系。
2.3數(shù)據(jù)預(yù)處理
模型共有12個定量變量和2個定性變量,在對兩個定性變量的預(yù)處理中,股東背景為民營系時屬性編碼值為0,否則為1;而注冊省份按GDP排名進(jìn)行編碼。下表為數(shù)據(jù)的描述性統(tǒng)計分析:
通過上表我們得出以下結(jié)論:
(1)X1營業(yè)收入問題平臺標(biāo)準(zhǔn)差(19.88)遠(yuǎn)高于健康平臺(008),可見問題平臺的營業(yè)收入存在巨大差異。
(2)從X2前十大借款人待還金額占比:問題平臺均值(0.66)遠(yuǎn)高于健康平臺(0.29),說明問題平臺存在嚴(yán)重的信用風(fēng)險,與我們的預(yù)期相符。
(3)X3平均借款利率健康平臺(0.11)略高于問題平臺(009),這與我們預(yù)期有所出入;但問題平臺的標(biāo)準(zhǔn)差(0.33)遠(yuǎn)高于健康平臺(0.02),這反映了不同問題平臺利率差距較大,這與我們的預(yù)期相符。
(4)X4平均借款期限:問題平臺(0.07)遠(yuǎn)低于健康平臺(754),而標(biāo)準(zhǔn)差則相反,問題平臺僅僅為0.1,遠(yuǎn)低于健康平臺(8.34),這說明了問題平臺為了大量籌資發(fā)行了大量短標(biāo),Ю戳舜罅苛鞫性風(fēng)險。
(5)X5營業(yè)收入:健康平臺(3335.03)遠(yuǎn)高于問題平臺(5.01),與預(yù)期相符。
(6)X6前十大土豪待收金額占比:問題平臺(0.12)遠(yuǎn)高于健康平臺(0.44),說明問題平臺較大的流動性風(fēng)險。
(7)X7資金凈流入:問題平臺(2171786.44)遠(yuǎn)高于健康平臺(25765.63),X8人均借款金額(萬元)問題平臺(6637886)遠(yuǎn)高于健康平臺(1222.76),X9人均投資金額(萬元)問題平臺(26227.76)遠(yuǎn)高于健康平臺(14.39),這三者共同體現(xiàn)了問題平臺巨大的流動性風(fēng)險。
(8)X12運(yùn)營時間:健康平臺(33.99)約為問題平臺(14.25)的兩倍,與預(yù)期相符。
綜上,我們認(rèn)為所選取的14個指標(biāo)具有說服力,可納入風(fēng)險評估體系。
3 模型設(shè)計與實(shí)證檢驗(yàn)
3.1模型結(jié)構(gòu)設(shè)計
BP神經(jīng)網(wǎng)絡(luò)主要用于求解非線性連續(xù)函數(shù)的多層前饋神經(jīng)網(wǎng)絡(luò)權(quán)重調(diào)整問題。在解決問題的過程中,我們按誤差梯度下降的方式修正各層權(quán)值,使權(quán)值不斷調(diào)整,直到網(wǎng)絡(luò)輸出的誤差減少到可以接受的程度,或者預(yù)先設(shè)定的學(xué)習(xí)次數(shù)。具體可分為以下兩步。
步驟1:結(jié)構(gòu)參數(shù)的設(shè)置,包括網(wǎng)絡(luò)層數(shù)及各層節(jié)點(diǎn)數(shù)的設(shè)置。本文采用包括輸入層、單個隱含層和輸出層的三層BP神經(jīng)網(wǎng)絡(luò)作為評估模型。
(1)輸入層節(jié)點(diǎn)數(shù)量
在我們的對比模型中,駱駝評級法共采用了12個指標(biāo),因此輸入層神經(jīng)元數(shù)量為12,而我們的改進(jìn)模型中,增加了兩個綜合實(shí)力指標(biāo),因此改進(jìn)模型的輸入層節(jié)點(diǎn)數(shù)量為14。
(2)隱含層節(jié)點(diǎn)數(shù)量
在原模型和改進(jìn)模型中,我們默認(rèn)隱含層節(jié)點(diǎn)數(shù)量為10。
(3)輸出層節(jié)點(diǎn)數(shù)量
在兩個對比模型中,我們的目標(biāo)都輸出為健康平臺1和問題平臺0,因?yàn)槲覀兊妮敵龉?jié)點(diǎn)數(shù)量為1。
步驟2:訓(xùn)練參數(shù)的設(shè)置,主要選擇神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)函數(shù)和訓(xùn)練函數(shù)等。
在兩個對比模型中,我們的學(xué)習(xí)函數(shù)和訓(xùn)練函數(shù)分別設(shè)定為learngdmi函數(shù)和trainlm函數(shù)。顯示出來的誤差變化為均方誤差值mse,誤差精度均設(shè)置為le一10。設(shè)定的網(wǎng)絡(luò)精度為0.0001,訓(xùn)練次數(shù)為1000。
3.2結(jié)果分析及對比
首先我們對12個定量指標(biāo)(X1-X12)進(jìn)行實(shí)證分析結(jié)果如下:網(wǎng)絡(luò)為12-10-1-1結(jié)構(gòu),經(jīng)過42次迭代循環(huán)完成訓(xùn)練,達(dá)到設(shè)定的網(wǎng)絡(luò)精度0.0001時,誤差下降梯度為0.00976。BP算法在實(shí)際應(yīng)用中很可能會陷入到局部極小值中,可通過改變初始值的方式獲得全局最優(yōu)值。我們通過反復(fù)改變初始值,最終得到較為理想的訓(xùn)練結(jié)果:總判別準(zhǔn)確率為0.91429。
我們在駱駝評級法指標(biāo)的基礎(chǔ)上,在12個定量指標(biāo)的基礎(chǔ)上添加2個定性指標(biāo)(X13,X14)對模型進(jìn)行改進(jìn)。結(jié)果如下:網(wǎng)絡(luò)為14-10-1-1結(jié)構(gòu),經(jīng)過22次迭代循環(huán)完成訓(xùn)練,達(dá)到設(shè)定的網(wǎng)絡(luò)精度0.0001的時,誤差下降梯度為0.00900。經(jīng)測試,最終取得了較理想的識別正確率為:0.94286,與原模型采用駱駝評級法對比,準(zhǔn)確率由0.91429提升到0.94286。由此可知,該BP網(wǎng)絡(luò)具有較好的泛化能力和預(yù)測精度,可用于對P2P網(wǎng)貸市場信用風(fēng)險的評估。
3.3模型創(chuàng)新點(diǎn)和不足
3.3.1創(chuàng)新點(diǎn)
其一:數(shù)據(jù)的質(zhì)量較高。數(shù)據(jù)來源于權(quán)威行業(yè)統(tǒng)計網(wǎng)站,可信度較高。且樣本數(shù)量多(80家健康平_和80家問題平臺),在一定程度上降低了偶然性。
其二:風(fēng)險評估體系完善。我們使用國際通行的駱駝評級法進(jìn)行評測,準(zhǔn)確率高達(dá)0.91429。我們還通過分析整個經(jīng)濟(jì)模型中各因素間的內(nèi)在聯(lián)系以及P2P網(wǎng)絡(luò)借貸的特殊性,加入注冊省份和股東背景兩個定性指標(biāo),進(jìn)一步提升準(zhǔn)確率。
其三:BP神經(jīng)網(wǎng)絡(luò)模型的自身優(yōu)勢。BP神經(jīng)網(wǎng)絡(luò)擅長預(yù)測和處理非線性關(guān)系。即便在輸入變量的權(quán)重、內(nèi)在關(guān)系不明確的情況下,該模型仍能夠自主學(xué)習(xí)和模擬訓(xùn)練。由此推斷,我們可以對任意平臺的信用風(fēng)險進(jìn)行預(yù)測。
3.3.2不足
其一:參數(shù)設(shè)定較為困難。BP網(wǎng)絡(luò)的參數(shù)較多,設(shè)定缺乏簡單有效的方法,只能根據(jù)經(jīng)驗(yàn)設(shè)定其取值范圍,從而導(dǎo)致算法很不穩(wěn)定。
其二:容易陷入局部最優(yōu)。BP網(wǎng)絡(luò)在實(shí)際應(yīng)用中很可能陷入局部極小值,可以通過改變初始值,多次運(yùn)行的方式,獲得全局最優(yōu)值。
其三:結(jié)果不可重現(xiàn)。BP神經(jīng)網(wǎng)絡(luò)對初始權(quán)較為敏感。但是其初始權(quán)值是隨機(jī)的,又影響到訓(xùn)練結(jié)果,因此,結(jié)果具有不可重現(xiàn)性。
其四:數(shù)據(jù)不夠充足。BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)與訓(xùn)練都需要足夠的數(shù)據(jù)支持。160個平臺的數(shù)據(jù)只能避免一定的偶然性,并不能保證結(jié)果的確切性。
4 建議
4.1對P2P平臺的建議
(1)平臺應(yīng)做到信息公開透明,提供足夠而準(zhǔn)確的運(yùn)營指標(biāo)以供參考
平臺應(yīng)披露真實(shí)的企業(yè)信息,注冊省份,股東背景,企業(yè)背景以及其他運(yùn)營指標(biāo),從而提升可信度,吸引更多的投資者。
(2)定期對平臺的相關(guān)運(yùn)營指標(biāo)進(jìn)行監(jiān)測,確認(rèn)平臺運(yùn)行良好
平臺可以通過以上BP神經(jīng)模型,定期對運(yùn)營情況進(jìn)行監(jiān)測,對比同行業(yè)其他指標(biāo),確保運(yùn)行良好。
(3)依法運(yùn)營,防范相關(guān)法律風(fēng)險
目前我國P2P領(lǐng)域在存在很多法律漏洞和空白,平臺應(yīng)依法規(guī)范自身行為,能最大程度降低法律風(fēng)險。
(4)定期維護(hù)升級平臺,防范操作與技術(shù)風(fēng)險
平臺應(yīng)對網(wǎng)站進(jìn)行加密處理,定期維護(hù)升級平臺,填補(bǔ)相關(guān)漏洞,以降低平臺操作與技術(shù)風(fēng)險,保障資金運(yùn)行的安全性。
4.2對投資者的建議
(1)關(guān)注平臺的各項基本運(yùn)營指標(biāo)是否正常
根據(jù)駱駝評級法,我們應(yīng)該關(guān)注12個定量指標(biāo)的具體情況。資本充足率8%左右,越多平臺流動性越強(qiáng);前十大借款人待還金額占比29%左右,越小越好;資金凈流入(萬元),越大越好;人均借款金額(萬元)越小,平臺流動性越好;人均投資金額(萬元)越大,平臺資金越充足;借款集中度越低,流動性越好;運(yùn)營時間(月)越長越好。
(2)在關(guān)注定量指標(biāo)的基礎(chǔ)上,增加對定性指標(biāo)的關(guān)注
在研究中我們發(fā)現(xiàn)加入定性指標(biāo)可進(jìn)一步優(yōu)化模型。具體來說,定性指標(biāo)分為注冊省份和股東背景。要密切關(guān)注注冊省份的相關(guān)政策,經(jīng)濟(jì)發(fā)展情況等。例如從股東背景上看,民營系風(fēng)險程度要大于上市公司系大于國企系。
參考文獻(xiàn):
[1]薛飛.P2P網(wǎng)貸的風(fēng)險分析與風(fēng)控模式探究[J].時代金融,2015(1):226-229
[2]周慧.P2P網(wǎng)絡(luò)借貸:履約機(jī)制、運(yùn)作模式與風(fēng)險控制[J].西部金融,2014(12):19-24
關(guān)鍵詞:鐵路交通;信息預(yù)測;數(shù)據(jù)融合;神經(jīng)網(wǎng)絡(luò)
在城市地鐵交通中,各車站交通流量信息(如候乘數(shù)量、下車數(shù)量等)的準(zhǔn)確預(yù)測有利于地鐵運(yùn)行高效、及時地調(diào)度,從而既達(dá)到增加效益的經(jīng)濟(jì)目的,又可以更好地滿足人們的乘車需求。傳統(tǒng)的預(yù)測方法有回歸分析算法以及Kalman濾波等。這些方法假定過程是平穩(wěn)的,系統(tǒng)是線性的,系統(tǒng)的干擾是白噪聲,因此在線性系統(tǒng)平穩(wěn)的隨機(jī)時間序列預(yù)測中能夠獲得滿意的結(jié)果。然而,交通問題是有人參與的主動系統(tǒng),具有非線性和擾動性強(qiáng)的特征,前述方法難以奏效,表現(xiàn)為以下缺點(diǎn):①每次采樣的數(shù)據(jù)變化較小時適用,數(shù)據(jù)變化大誤差就大;②預(yù)測值的變化總是滯后于實(shí)測值的變化;③無法消除奇異信息的影響?;谛〔ǚ治龅膭討B(tài)數(shù)據(jù)預(yù)測方法以小波變換后的數(shù)據(jù)進(jìn)行預(yù)測,克服了傳統(tǒng)預(yù)測方法不能消除奇異信息的缺點(diǎn),有效地預(yù)測動態(tài)的流量信息[1]。但該方法只能對單個的數(shù)據(jù)序列進(jìn)行處理,而事實(shí)上能夠用于預(yù)測的數(shù)據(jù)可以是多方面的。
數(shù)據(jù)融合(Data2Fusion)技術(shù)起源并發(fā)展于軍事領(lǐng)域,主要用于目標(biāo)的航跡跟蹤、定位與身份識別以及態(tài)勢評估等[2]。傳統(tǒng)的數(shù)據(jù)融合技術(shù)大多采用概率理論(如Bayes決策理論)對多種信息的獲取與處理進(jìn)行研究,從而去掉信息的無用成分,保留有用成分[3]。在信息處理中,分別運(yùn)用各種體現(xiàn)數(shù)據(jù)不同屬性特征的方法處理(如預(yù)測)后進(jìn)行融合是一個有待深入研究的問題。為了充分利用各方面已有的數(shù)據(jù),獲得可靠的交通流量動態(tài)預(yù)測,本文借鑒數(shù)據(jù)融合的基本思想,提出了在數(shù)據(jù)處理方法上的融合預(yù)測方法。
1流量融合預(yù)測模型
1.1預(yù)測模型的結(jié)構(gòu)
由于預(yù)測對象的復(fù)雜性,為了表現(xiàn)與預(yù)測對象相關(guān)聯(lián)的其他對象或?qū)傩?每個關(guān)聯(lián)對象(屬性)用一個時間序列來表示,作為預(yù)測對象的相關(guān)序列。所有用于預(yù)測的相關(guān)序列構(gòu)成預(yù)測對象的相關(guān)序列集。由于在預(yù)測中具有不同的作用,各相關(guān)序列將使用不同的處理和預(yù)測方法。在相關(guān)序列集上的地鐵客流量融合預(yù)測模型結(jié)構(gòu),如圖1所示。
下面針對城市地鐵車站客流量的預(yù)測進(jìn)行論述。
1.2構(gòu)造相關(guān)序列集
為了預(yù)測車站(序號為0)在第i天t時刻的流量^F0i(t)(實(shí)測值為F0i(t)),設(shè)t時刻^F0i(t)的相關(guān)時間序列集為f(t)={fj(t),1≤j≤n}(1)式中,fj(t)為t時刻^F0i(t)的相關(guān)時間序列;n為相關(guān)時間序列數(shù)。
為了獲得精確的預(yù)測,可以根據(jù)關(guān)聯(lián)特性構(gòu)造任意多個相關(guān)時間序列。本文意在闡明本算法的基本思想,將流量數(shù)據(jù)僅僅構(gòu)造為3類相關(guān)序列:當(dāng)前序列、歷史序列和鄰站序列。
當(dāng)前序列預(yù)測時刻t之前本站最近k次流量按時間先后記錄下來的數(shù)據(jù)構(gòu)成的時間序列為當(dāng)前序列,即
f1(t)={F0i(t-l),1≤l≤k}(2)
該序列數(shù)據(jù)的主要影響因素是時刻,同時還受人為、氣溫、天氣等其他擾動因素的影響,數(shù)據(jù)分布的非線性特性較大,頻帶較寬。第l班列車的流量如圖2所示。
歷史序列同為工作日或同為節(jié)假日的相鄰數(shù)天,其流量曲線形狀相對類似,流量曲線相似的日期在預(yù)測中具有較大的參考意義。本站最近m天在時刻t的流量按日期先后記錄下來的數(shù)據(jù)構(gòu)成的時間序列為歷史序列,即f2(t)={F0i-p(t),1≤p≤m}(3)工作日和節(jié)假日流量差別較大,可將它們分類處理。該序列整體分布較平穩(wěn),有震蕩,但頻帶較窄。第p個工作日在時刻t的流量如圖3所示。
鄰站序列圖4為本站與鄰近2個車站24h的流量曲線經(jīng)DB2小波3層變換后的近似分量,可見各分量關(guān)聯(lián)性較大。如果根據(jù)以前的數(shù)據(jù)將各鄰近車站相互關(guān)系解算出來,就可以利用這種函數(shù)關(guān)系預(yù)測時刻t在本站的流量。最近m天在時刻t的流量按日期先后記錄下來的各鄰站歷史序列為本站的鄰站序列,即
qf2+q(t)={Fi-p(t),1≤p≤m,1≤q≤s}(4)
q式中,Fi-p(t)表示第q個鄰近站的第(i-p)天的流量;s表示鄰近站數(shù)。
1.3相關(guān)序列的預(yù)測
由于各相關(guān)序列在預(yù)測中具有不同的影響,且分布規(guī)律和特點(diǎn)差異較大,因而各序列使用不同的預(yù)測方法。本文對當(dāng)前序列進(jìn)行小波分解后用Kalman預(yù)測,對歷史序列直接進(jìn)行Kalman預(yù)測,對鄰站序列用冪級數(shù)多項式進(jìn)行擬合。
1.3.1小波分析
根據(jù)設(shè)置的分解指數(shù)η對序列進(jìn)行小波N尺度分解,得到一組低頻信號和N組高頻信號,對這N+1組信號分別用Mallat塔式算法重構(gòu)到原尺度上,得到N+1組在原始尺度上的經(jīng)過分解重構(gòu)處理的信號。分別對信號用Kalman濾波進(jìn)行預(yù)測,得到N+1個預(yù)測值,再將這N+1個預(yù)測值用權(quán)系數(shù)合成最終的預(yù)測值。具體算法請參見文獻(xiàn)[1]。
1.3.2Kalman濾波離散線性Kalman濾波方程為
F(t)=Φ(t-1)F(t-1)+W(t-1)(5)式中,Φ(t)為系統(tǒng)狀態(tài)轉(zhuǎn)移量;W(t)為系統(tǒng)誤差。Kalman濾波通過t-1時刻的狀態(tài)F(t-1)估計t時刻的狀態(tài)F(t)。具體算法請參見文獻(xiàn)[1]。
1.3.3多項式擬合
分別對各鄰站序列用冪級數(shù)多項式擬合本站數(shù)據(jù),擬合模型如下
n
i
p
^Fp(t)=αp,i(t)F(t)(6)
i=0
i
6式中,Fp(t)為對第p個鄰站在時刻t的流量的i次i冪;αp,i(t)為Fp(t)的系數(shù)。當(dāng)n=2時,上述擬合算法簡化為線性回歸模型。
1.4流量的融合預(yù)測設(shè)預(yù)測對象共有n個相關(guān)的時間序列fi(t),經(jīng)過預(yù)處理分別為fi(t),融合預(yù)測模型可表示^F(t)在f(t)上的映射,即^F(t)=ζ(f(t))=ζ(f1(t),f2(t),fn(t))(7)式中,ζ(·)表示映射關(guān)系。特別地,式(7)可簡化為如下的線性映射組合^F(t)=αi(t)ξ(fi(t))(8)i=16
式中,αi(t)為t時刻的序列fi(t)的權(quán)系數(shù);ξ(fi(t))為以fi(t)為依據(jù)的局部預(yù)測值。為了確定上述算法中映射關(guān)系ζ(·),本文采用神經(jīng)網(wǎng)絡(luò)進(jìn)行解算。
2模型的神經(jīng)網(wǎng)絡(luò)解算
神經(jīng)網(wǎng)絡(luò)是由大量簡單的神經(jīng)元以某種拓?fù)浣Y(jié)構(gòu)廣泛地相互連接而成的非線性動力學(xué)系統(tǒng)[4]。神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)融合技術(shù)中具有無法替代的作用,通過神經(jīng)網(wǎng)絡(luò)對各相關(guān)序列的局部預(yù)測進(jìn)行最終融合,具體過程如下。
2.1數(shù)據(jù)的局部處理
廣州市地鐵某站一個方向的流量數(shù)據(jù)是以每班列車到站上車的人數(shù)記錄的(流量單位:人/班)。根據(jù)2002年5月1日2003年3月2日的流量數(shù)據(jù),運(yùn)用本文算法進(jìn)行預(yù)測。按照1.2節(jié)的方法構(gòu)造了4個相關(guān)序列:當(dāng)前序列f1(t)、歷史序列f2(t)以及相鄰2個車站的鄰站序列f3(t)和f4(t)。
2.2神經(jīng)網(wǎng)絡(luò)的設(shè)計
因?yàn)?層神經(jīng)網(wǎng)絡(luò)可以一致逼近任何非線性函數(shù)[5]。采用具有單隱層的3層神經(jīng)網(wǎng)絡(luò)作為模型,即輸入層、隱層和輸出層。
以各相關(guān)序列的局部預(yù)測值作為輸入向量,實(shí)測值F(t)為期望輸出,有4個輸入節(jié)點(diǎn),1個輸出節(jié)點(diǎn)。隱層神經(jīng)元數(shù)量關(guān)系到網(wǎng)絡(luò)的訓(xùn)練速度和精度問題。對于一定數(shù)量的樣本,需要一定數(shù)量的隱層神經(jīng)元數(shù),神經(jīng)元少了,不能反映樣本的規(guī)律;多了,則神經(jīng)網(wǎng)絡(luò)以過于復(fù)雜的非線性關(guān)系來擬合輸入輸出之間的關(guān)系,使得模型的學(xué)習(xí)時間大大增加。本例中,8個隱層神經(jīng)元數(shù)是最好的。以誤差平方和SSE(Sum2SquaredError)作為訓(xùn)練評價標(biāo)準(zhǔn),SSE=pj(Ypj-Opj)2,其中Ypj和Opj分別為輸出層第j個神經(jīng)元的第p個樣本的期望輸出和實(shí)際輸出(本例中j=1,p=60)。
用MATLAB的ANN工具箱構(gòu)造神經(jīng)網(wǎng)絡(luò)。隱層神經(jīng)元的激勵函數(shù)為tansig函數(shù)(正切S型傳遞函數(shù)),輸出層神經(jīng)元的激勵函數(shù)為purelin函數(shù)(線性傳遞函數(shù)),這樣整個網(wǎng)絡(luò)的輸出可以取任意值。采取批處理學(xué)習(xí)方式和快速BP算法訓(xùn)練。
2.3神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
將網(wǎng)絡(luò)的訓(xùn)練標(biāo)準(zhǔn)SSE設(shè)為64(60組訓(xùn)練樣本),利用上述樣本對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練6000次時網(wǎng)絡(luò)的權(quán)值和閾值將達(dá)到最佳值,即達(dá)到了訓(xùn)練目標(biāo)。神經(jīng)網(wǎng)絡(luò)訓(xùn)練目標(biāo)接近過程,如圖5所示。
從圖5中可以看出,訓(xùn)練開始時,網(wǎng)絡(luò)收斂速度較快,接近目標(biāo)時收斂速度會減慢??梢?訓(xùn)練次數(shù)越多,得到的結(jié)果越好。當(dāng)然,這是以訓(xùn)練時間的增長作為代價的。
3實(shí)驗(yàn)對比分析
采用本文算法和傳統(tǒng)的Kalman算法分別對2003年3月2日的各整點(diǎn)時刻的流量進(jìn)行預(yù)測。算法各時刻均通過訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)預(yù)測,預(yù)測與實(shí)測結(jié)果的比較,如圖6所示。
傳統(tǒng)的Kalman濾波是直接在當(dāng)前序列的基礎(chǔ)上進(jìn)行預(yù)測的,預(yù)測與實(shí)測結(jié)果的比較如圖7所示。2種預(yù)測方法的誤差指標(biāo)對比見表1。
表1實(shí)驗(yàn)結(jié)果對比
比較可得,由于傳統(tǒng)的Kalman預(yù)測方法只能以某一類序列的數(shù)據(jù)作為預(yù)測基礎(chǔ),無法利用其他序列信息,且對變化大的數(shù)據(jù)采樣要求較高,因而具有較大的誤差,而本文所述方法有效地克服了這些缺點(diǎn)。
4結(jié)論
通過分析城市地鐵站客流量的相互關(guān)系和特點(diǎn),在對流量信息進(jìn)行以預(yù)測為目的相關(guān)序列集構(gòu)造的基礎(chǔ)上,提出了一種基于數(shù)據(jù)融合的預(yù)測模型。該預(yù)測模型不僅是一個多信息接收和處理的融合模型,而且還是一個動力學(xué)系統(tǒng),網(wǎng)絡(luò)的訓(xùn)練樣本也是動態(tài)的,如果訓(xùn)練的次數(shù)適當(dāng),預(yù)測的精度也可以隨之變化調(diào)整。實(shí)驗(yàn)結(jié)果表明,基于數(shù)據(jù)融合的預(yù)測與傳統(tǒng)的預(yù)測方法相比,由于充分利用了所有預(yù)測信息,在預(yù)測的準(zhǔn)確程度上有較大提高。
參考文獻(xiàn):
[1]李存軍,等.基于小波分析的交通流量預(yù)測方法[J].計算機(jī)應(yīng)用,2003,23(12):7—8.
[2]權(quán)太范.信息融合:神經(jīng)網(wǎng)絡(luò)模糊推理理論與應(yīng)用[M].北京:國防工業(yè)出版社,2002.
[3].信息融合技術(shù)[M].北京:國防工業(yè)出版社,1996.
信用卡起源于美國。192019年,美國的一些百貨商店、飲食娛樂業(yè)、汽油公司向特定顧客發(fā)放一種金屬徽章作為信用籌碼,顧客可憑徽章在商店及其分號賒購商品,約期付款,這就是信用卡的雛形。上述籌碼在1950年演變?yōu)榫哂凶C明身份和支付功能的卡片,這是世界上第一張塑料卡。1951年,美國紐約弗蘭克林國民銀行發(fā)行了允許持卡人在規(guī)定的信用額度內(nèi)在指定商戶消費(fèi)的卡片,開始了銀行發(fā)行信用卡的歷史。20世紀(jì)70年代,美國的一些銀行發(fā)行了直接從客戶活期賬戶扣款、專供ATM取款使用的借記卡,開始了銀行發(fā)行借記卡的歷史。
與國外相比,我國的信用卡業(yè)務(wù)起步較晚。信用卡在我國流通領(lǐng)域中出現(xiàn)始于八十年代初期。隨著改革開放,大批外國人士來華旅游或公干,傳統(tǒng)的現(xiàn)金結(jié)算方式無法滿足國外來賓的需要,中國銀行先后與國外七家信用卡公司簽訂了辦理這七家公司發(fā)行的七種國際主要信用卡的取現(xiàn)和直接購貨。1986年中國銀行又率先發(fā)行了中國第一張信用卡——人民幣長城卡。1988年又推出了中國第一張長城萬事達(dá)卡,1990年中國工商銀行和中國建設(shè)銀行也開始發(fā)行萬事達(dá)卡。1995年廣東發(fā)展銀行發(fā)行了我國第一張具有循環(huán)信用功能的信用卡。信用卡在中國從到發(fā)行,經(jīng)歷了大約2019年時間,從無到有,并逐漸成為一種重要的支付方式。
近年來,由于我國信用環(huán)境建設(shè)不完善,銀行與持卡人之間的信息不對稱、持卡人違約等問題日益突出,加之法律法規(guī)不健全,發(fā)卡機(jī)構(gòu)在經(jīng)營和管理過程中風(fēng)險控制乏力及銀行間的無序競爭,致使該業(yè)務(wù)存在的問題和風(fēng)險逐步顯現(xiàn),突出表現(xiàn)在信用卡持卡人違約和欺詐行為出現(xiàn)攀升的勢頭。因此,商業(yè)銀行在大力拓展信用卡發(fā)卡過程中,必須對信用卡業(yè)務(wù)風(fēng)險進(jìn)行認(rèn)真分析和研究,以便采取措施,這對于商業(yè)銀行防范和化解信用卡風(fēng)險從而增加經(jīng)濟(jì)效益具有重要意義。
二、國內(nèi)外研究現(xiàn)狀
信用風(fēng)險分析是一個世界性問題,從60年代開始,美國、歐洲一些國家的學(xué)者已經(jīng)開始信用風(fēng)險評價模型的研究,并逐步應(yīng)用到銀行業(yè)的客戶信用評分與風(fēng)險管理之中。這期間統(tǒng)計學(xué)和運(yùn)籌學(xué)等定量分析工具被運(yùn)用到信用評分領(lǐng)域,主要采用傳統(tǒng)的多元參數(shù)統(tǒng)計方法,包括多元判別分析法(MDA)、Logit模型(Martin 1997,Ohlson 1980)以及運(yùn)籌學(xué)的線性規(guī)劃分析方法等。20世紀(jì)90年代興起以神經(jīng)網(wǎng)絡(luò)為代表的非參數(shù)統(tǒng)計方法,并逐步應(yīng)用到信用評分模型。包括多層感知器(MLP)、BP算法網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)(PNN)(Eric andLong 1995)、自組織映射神經(jīng)網(wǎng)絡(luò)(SOM)(Kiviluoto and Bergius 1997)、玻爾茲曼機(jī)神經(jīng)網(wǎng)絡(luò)(Boltzman Machine)(Kryzanowsk,Galler,Wright1993)、遺傳算法以及多智能體系統(tǒng)等。
2019年1月,人民銀行的個人征信系統(tǒng)在全國正式運(yùn)行,可以查詢到個人在商業(yè)銀行的借還款、信用卡、擔(dān)保等信用信息,以及相關(guān)的身份識別信息。我國絕大部分商業(yè)銀行已將查詢個人征信系統(tǒng)納入信貸管理流程。根據(jù)信用報告上的個人信息,在信貸審批和貸后管理時能夠甄別出高風(fēng)險客戶群體,然后采取相應(yīng)措施,降低風(fēng)險損失。
目前,個人信用報告已成為商業(yè)銀行風(fēng)險管理過程中的重要依據(jù)。但是,由于信用報告上的信息量大,審批人員做決策時需要一定的時間綜合考慮各類信息,同時審批工作難免存在一定的主觀性和片面性。為此,有必要根據(jù)個人信用報告開發(fā)征信局信用評分,為商業(yè)銀行提供決策支持,幫助其有效防范風(fēng)險。
在美國,征信局信用評分主要由三大個人征信公司提供,分別是益百利(Experian)、艾可飛(Equifax)和美國環(huán)聯(lián)公司(Trans Union)。他們從各個銀行和信用卡公司獲取消費(fèi)者的數(shù)據(jù),并對數(shù)據(jù)進(jìn)行匯總,按照規(guī)定的格式向外界提供個人信用報告,報告中有一項是個人信用評分,同時還提供信用等級并給出比例。這三家公司的評分都由評分科技公司Fair Isaac提供,稱作FICO系列信用評分。
在國內(nèi),目前還沒有類似的全國性的征信局信用評分,只有地方性資信公司的信用評分。比如上海資信公司推出的個人信用評分體系設(shè)立了7個評分等級,從-600分到1700分將個人信用狀況詳細(xì)量化,從而評出G~A 7個等級。深圳鵬元也于2019年推出了個人綜合信用風(fēng)險評分——鵬元800。該信用評分體系共設(shè)6個等級,從320分~800分,每80分一級,每個分?jǐn)?shù)對應(yīng)一個違約概率,分?jǐn)?shù)越高表示違約風(fēng)險越低。
伴隨著脈診儀關(guān)鍵技術(shù)——傳感器研究的不斷進(jìn)步,信息采集的精度和速度日益提高。信息量的豐富對相應(yīng)分析技術(shù)的要求也逐步提高。除幾種傳統(tǒng)的分析技術(shù)外,其他學(xué)科新興的分析技術(shù)不斷被引入脈診現(xiàn)代研究中,使有價值脈動信息的獲取空間空前擴(kuò)大。目前,脈診現(xiàn)代研究中,常用的分析和識別方法有時域分析、頻域分析、時頻分析、人工神經(jīng)網(wǎng)絡(luò)、可視化分析以及一些其他分析方法。
1 時域分析
時域分析是對脈搏波動圖形進(jìn)行分析的主要方法,是目前研究時間最長,也是最成熟的方法。最初的脈圖分析方法主要局限于從脈圖的時間、振幅、角度、形態(tài)等方面分析上升支、下降支、重搏波的高度及各種高度的比值或它們夾角的大小及面積大小時值等。
脈搏信號從時域上看,是一個周期性較強(qiáng)的準(zhǔn)周期信號。脈搏波動頻率為60~100次/min。時域分析法主要分析脈波波幅的高度和脈動時相的關(guān)系。通過對脈圖幅值和時值的分析,可以了解脈動的頻率和節(jié)律,脈力的強(qiáng)弱,脈勢的虛實(shí)和脈象形態(tài)特征等。
崔玉田、趙恩儉等是較早對古代脈學(xué)理論和現(xiàn)代實(shí)研進(jìn)展進(jìn)行系統(tǒng)梳理的研究者,其專著《中醫(yī)脈學(xué)研究》、《中醫(yī)脈診學(xué)》中涉及到一些脈圖時域特征分析的內(nèi)容。其后,傅驄遠(yuǎn)、費(fèi)兆馥、黃世林、楊天權(quán)、徐迪華等研究者對脈圖的時域特征進(jìn)行了系統(tǒng)論述。
傅氏等[1]較早開展采用現(xiàn)代技術(shù)的中醫(yī)脈診研究,其在《中醫(yī)脈象今釋》中集中論述了18種常見脈象脈圖分析和判別的方法,并對脈象形成的機(jī)制,從血流動力學(xué)、血液流變學(xué)以及影像學(xué)等方面進(jìn)行了探討。費(fèi)氏等[2]較早并較全面的對脈圖的時域分析方法進(jìn)行了研究,在其《現(xiàn)代中醫(yī)脈診學(xué)》一書中,詳細(xì)闡述了臨床常見17種脈象的脈圖及其時域特征參數(shù)。黃氏等[3]在《中醫(yī)脈象研究》中對10種常見脈象的脈圖進(jìn)行了細(xì)致分析,開創(chuàng)性地記錄了中醫(yī)學(xué)中的“十怪脈”的脈圖,并論述了其現(xiàn)代醫(yī)學(xué)基礎(chǔ)。較晚的研究者對脈圖研究的種類更加全面,在各自的專著中均有詳細(xì)論述[4-5]。
時域分析方法通過提取脈搏圖曲線中一些有明確生理意義的特征點(diǎn)(如主波、重搏波和重搏前波的高度等)或角度(如升支斜率等)作為評價脈搏波的特征參數(shù),將特征參數(shù)和對應(yīng)的生理因素結(jié)合起來就可能得到許多有臨床醫(yī)學(xué)價值的結(jié)果,故時域分析法成了最直觀和應(yīng)用最廣泛的一種方法。它可直接通過脈圖的形態(tài)分析及對各項指標(biāo)的分析來確定圖與脈之間的差別,鑒別出各種脈象。這方面的關(guān)鍵在于篩選判別各種脈搏波波形的特征參數(shù),其主要工作在于分析脈波特征參數(shù)與時相的關(guān)系。這種方法的優(yōu)點(diǎn)是直觀,臨床醫(yī)生容易接受,但在實(shí)際應(yīng)用上卻遇到一些難以解決的困難,如有些特征點(diǎn)難于準(zhǔn)確得出,要憑經(jīng)驗(yàn)估計,隨機(jī)誤差很大。另外,缺乏各種脈象的脈圖時域參數(shù)特征較統(tǒng)一的標(biāo)準(zhǔn)。大量研究表明,脈象圖所反映的信息是多方面的、綜合的,單靠直觀形態(tài)分析法會將許多重要的信息掩蓋,因而促進(jìn)了分析方法向更加全面與多樣化發(fā)展。
2 頻域分析
頻譜分析是近代工程力學(xué)中常用的一種處理波動信息的方法,主要采用傅立葉頻譜分析方法。它把一個很復(fù)雜的由許多重疊波構(gòu)成的脈搏波分解成不同的諧波,這樣就能把其中所包含的信息和能量提取出來,因此,較時域分析法更能清楚地反映、分析脈象的各種變化。但其只能刻畫整個時間域上信號的頻譜特征,不能反映局部時間區(qū)間上的信息。近年來,頻譜分析也大量用于脈搏信號和中醫(yī)脈象的研究。頻譜分析可能會揭示出許多生理病理信息,而這些信息通常從時域分析中較難獲得。
重慶大學(xué)的研究者基于脈象信號的頻域分析,從不同角度,采用不同方法對吸毒者與正常人的脈象進(jìn)行了辨識。他們根據(jù)脈象信號的非高斯隨機(jī)特性,發(fā)現(xiàn)非參數(shù)化雙譜估計、參數(shù)化雙譜估計以及倒雙譜估計的方法均是分析脈象信號的有效且可行的方法,吸毒者脈象信號在特定頻率區(qū)域內(nèi)的平均相位值、雙譜相位主值特征等參數(shù)明顯區(qū)別于正常人,分別給出了吸毒者和正常人脈象信號的判別依據(jù)[6-8]。
西北工業(yè)大學(xué)王炳和等[9-10]研究人員長期進(jìn)行脈搏波頻域分析的研究。其利用高性能的電子檢測儀器和計算機(jī)提取人體橈動脈脈搏信號,并獲得了脈搏功率譜圖(PSG)。譜能比(SER)被定義為脈搏功率譜上10 Hz以下的譜能量與10 Hz以上譜能量的比值。結(jié)果發(fā)現(xiàn),健康人兩手“寸、關(guān)”部位的SER值均大于100,而患者“寸、關(guān)”的某些特定部位的SER值均小于100,這些給出低SER值的特定部位與人體的病變器官相對應(yīng),符合中醫(yī)理論。同時發(fā)現(xiàn)正常人平脈脈搏系統(tǒng)通常具有3個共振峰,滑脈脈搏系統(tǒng)有2個共振峰,弦脈脈搏系統(tǒng)出現(xiàn)4個共振峰,而細(xì)脈僅存在1個共振峰。倒譜分析顯示,滑脈與弦、細(xì)脈的特征差異要比在時域內(nèi)的差異大得多。脈象倒譜上τ=τz處的峰值大小可表征脈象的“流利”程度,τz1恰好反映了脈象的周期大小,而hc0值正好反映了脈搏強(qiáng)度的信息特征。
厲氏等[11]研究了遲脈、常脈、數(shù)脈、疾脈4種脈象的頻域特征。研究發(fā)現(xiàn),對于脈率異常的脈象信號,在頻域具有與時域相似的特性,即隨著脈率的增大,頻域中幅度的最大值以及在低、中、高3個頻段的幅度值也相應(yīng)增大。相對于正常脈象,脈率失常的脈象在頻域中表現(xiàn)出幅度更不平穩(wěn)的特點(diǎn)。另外,浮脈患者脈象的能量最高,其次為常脈,沉脈患者脈象的能量最低。從SER看,3種脈象的低頻分量都占據(jù)了信號的主要能量,但沉脈患者SER最高,浮脈最小,常脈居中;與常脈相比,說明沉脈能量更加集中于信號的低頻段,浮脈卻向信號的高頻段擴(kuò)散[12]。另外,其他研究者也報道了脈診信息頻域分析的成果[13-18]。
3 時頻分析
時頻分析的主要任務(wù)是描述信號的頻譜含量是怎樣隨時間變化的,研究并了解時變頻譜在數(shù)學(xué)和物理上的概念和含義。時頻分析的最終目的是要建立一種分布,以便能在時間和頻率上同時表示信號的能量和強(qiáng)度。得到這種分布后,我們可以對各種信號進(jìn)行分析、處理,提取信號中包含的特征信息,或者綜合得到具有期望時頻分布特征的信號。時頻分析結(jié)果可以通過不同的方式直觀地表示,如三維立體圖、等高線圖等,具有揭示許多新現(xiàn)象即改變我們觀察思考醫(yī)學(xué)信號方式的潛力。目前,在脈診研究中應(yīng)用的是短時傅立葉變換和Gabor展開以及小波變換。
3.1 短時傅立葉變換
由于人體生理、病理和自然環(huán)境的影響,生物醫(yī)學(xué)信號通常呈現(xiàn)非平穩(wěn)與時變特性。傳統(tǒng)的傅立葉變換不能描述信號的時頻局域特性,僅反映信號的靜態(tài)頻譜特性。短時傅立葉變換克服了傅立葉變換的缺陷,并具有容易實(shí)現(xiàn)、計算簡潔有效等優(yōu)點(diǎn),為最早和最常用的一種時頻分析方法。其主要缺陷是時間和頻率分辨率在整個時頻平面上固定不變。另外的限制是對一個特殊的信號,需要一個特殊的窗才能得到最佳分辨率。
有學(xué)者應(yīng)用全極點(diǎn)滑動窗遞歸算法,以平均功率與總平均功率的比值為特征參數(shù)和通過奇異值分解有效地提取特征矢量,提出了用于劃分正常人和吸毒者的臨界參數(shù),據(jù)此15例吸毒者全被檢測出來[19-20]?;诙虝r傅立葉變換的方法是一種穩(wěn)定、有效的特征提取方法。
3.2 小波變換分析
由于小波變換在時域和頻域同時具有良好的局部化性質(zhì),小波變換的數(shù)學(xué)理論和分析方法在各個領(lǐng)域都受到普遍關(guān)注。小波變換是一種信號的時間-尺度(時間-頻率)分析方法,它具有多分辨率分析的特點(diǎn),而且在時頻兩域都具有表征信號局部特征的能力,是一種窗口大小固定不變,但形狀可改變,時間窗和頻率窗都可改變的時頻局部化分析方法。即在低頻部分具有較高的頻率分辨率和較低的時間分辨率,在高頻部分具有較高的時間分辨率和較低的頻率分辨率,很適合于非平穩(wěn)信號的處理。小波變換在1-D生物醫(yī)學(xué)信號處理(生物聲學(xué)、ECG和EEG)和生物圖像處理中都得到了應(yīng)用。
白氏等[21]根據(jù)小波變換過零點(diǎn)和信號突變點(diǎn)之問的關(guān)系,分別運(yùn)用小波變換過零點(diǎn)表征檢測脈象時域特征點(diǎn)和各特征點(diǎn)脈搏信號變化的快慢。對20例健康人和20例孕婦脈象時域特征點(diǎn)過零點(diǎn)位置的統(tǒng)計及其變化快慢的計算,其分析結(jié)果正好與實(shí)際相吻合。
張氏等[22]利用小波變換奇異性檢測功能與多尺度分辨特性,提出了2種提取脈象信號特征的方法:連續(xù)小波變換法和二進(jìn)小波變換法。在此基礎(chǔ)上,構(gòu)造了兩種特征向量:小波變換系數(shù)的尺度——主波峰值和小波變換的尺度——能量值。經(jīng)過對臨床采集的235例脈象信號的處理與分析統(tǒng)計,所得數(shù)據(jù)具有較好的重復(fù)性與穩(wěn)定性,可以作為脈象信號區(qū)分正常人與心臟病患者的特征向量。
4 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是反映人腦結(jié)構(gòu)及功能的一種抽象數(shù)學(xué)模型,一個人工神經(jīng)網(wǎng)絡(luò)是由大量神經(jīng)元節(jié)點(diǎn)互連而成的復(fù)雜網(wǎng)絡(luò),用以模擬人類進(jìn)行知識的表示與存儲以及利用知識進(jìn)行推理的行為。一個基于人工神經(jīng)網(wǎng)絡(luò)的智能系統(tǒng)是通過學(xué)習(xí)獲取知識后建立的。從本質(zhì)上講,人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)是一種歸納學(xué)習(xí)方式,它通過對大量樣本的反復(fù)學(xué)習(xí),由內(nèi)部自適應(yīng)過程不斷修改各神經(jīng)元之間互連的權(quán)值,最終使神經(jīng)網(wǎng)絡(luò)的權(quán)值分布收斂于一個穩(wěn)定的范圍。一個已建立的神經(jīng)網(wǎng)絡(luò)可用于相關(guān)問題的求解,對于特定的輸入模式,神經(jīng)網(wǎng)絡(luò)通過前向計算可得出一個輸出模式,從而得到輸入模式的一個特定解。人工神經(jīng)網(wǎng)絡(luò)是由大量簡單的神經(jīng)元以一定的方式連接而成的,單個神經(jīng)元的作用是實(shí)現(xiàn)輸入到輸出的一個非線性或線性函數(shù)關(guān)系,它們之間廣泛的連接組合就使得整個神經(jīng)網(wǎng)絡(luò)具有了復(fù)雜的非線性特性。神經(jīng)網(wǎng)絡(luò)將大量的信息隱含在其連接權(quán)值及閾值上,根據(jù)一定的學(xué)習(xí)算法調(diào)節(jié)權(quán)值和閥值,使神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)從m維空間到n維空間復(fù)雜的非線性映射。神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的模式識別能力,可以對任意復(fù)雜狀態(tài)或過程進(jìn)行分類和識別。但是,必須首先用反映輸入特征量的大量樣本對網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練后,才具有這種功能。神經(jīng)網(wǎng)絡(luò)有兩個與用傳統(tǒng)方法進(jìn)行信息處理完全不同的性質(zhì):第一,神經(jīng)網(wǎng)絡(luò)是自適應(yīng)和可以被訓(xùn)練的,它有自學(xué)習(xí)能力。如果它的輸出不滿足期望的結(jié)果,網(wǎng)絡(luò)可以自動調(diào)整每個輸入值的權(quán)重,產(chǎn)生一個新的結(jié)果,整個修正過程可以通過訓(xùn)練算法來實(shí)現(xiàn)。第二,神經(jīng)網(wǎng)絡(luò)本身就決定了它的大規(guī)模并行機(jī)制,也就是說,神經(jīng)網(wǎng)絡(luò)從原理上看比傳統(tǒng)方法要快得多,它擅長通過大量復(fù)雜的數(shù)據(jù)進(jìn)行分類和發(fā)現(xiàn)模式或規(guī)律。
岳氏[23]基于BP神經(jīng)網(wǎng)絡(luò),選擇1456例患者作臨床脈象檢測,總體準(zhǔn)確率>92%,不僅對平、浮、沉、遲、數(shù)、虛、實(shí)、滑、澀、洪、弦、促、結(jié)、代等基本脈有較高的識別率,對于由上述基本脈構(gòu)成的臨床常見的相兼脈也有相當(dāng)高的識別能力(>82%)。研究過程中,解決了構(gòu)建合理的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、各層神經(jīng)元數(shù)量的確定、選擇合理的學(xué)習(xí)速率、脈象信號特征值的選取、神經(jīng)網(wǎng)絡(luò)的訓(xùn)練等關(guān)鍵問題。
胡氏等[24]以人工神經(jīng)網(wǎng)絡(luò)為手段,以提取脈象信息為目的,由臨床采樣數(shù)據(jù)形成了網(wǎng)絡(luò)訓(xùn)練輸入特征向量庫,不以單一脈本身為分類對象,而考慮它是否是某些可識別特征的組合,建立了浮沉、弦滑、遲數(shù)等一組脈象特征網(wǎng)絡(luò)。證實(shí)了人工神經(jīng)網(wǎng)絡(luò)用于具有模糊性的脈象特征的識別和分類是可行的,帶智能處理的特色,其分辨準(zhǔn)確率可達(dá)90%。
5 模糊屬性識別方法
20世紀(jì)80年代出現(xiàn)的用句法分析指導(dǎo)的脈象模糊屬性識別方法,從根本上拋開了人工測定脈圖指標(biāo)的模式,它是從檢測到的脈搏波上進(jìn)行采樣、基元抽取及基元屬性提取等,然后作分類,這就使得計算機(jī)識別有可能突破醫(yī)生的水平。模糊聚類法用于人體脈象的識別研究也獲得了較高的正確率。
王氏等[25]對脈搏聲信號進(jìn)行AR模型擬合來完成特征提取,并通過K-L(Karhunen-Loeve)變換實(shí)現(xiàn)特征壓縮,然后討論了一種新的FUZZY聚類方法——F-PFSR聚類法,最后給出了對臨床實(shí)測脈象信號聚類的實(shí)驗(yàn)結(jié)果。但研究結(jié)果顯示這種聚類的正確率還有待于提高。
6 可視化分析
牛氏等[26]利用彩色Doppler超聲成像技術(shù)檢測到寸口橈動脈等處血管的徑向張縮、軸向收縮和軸心位移組合成的三維運(yùn)動,提出與脈管三維運(yùn)動有關(guān)的脈象變化規(guī)律;同時應(yīng)用該技術(shù)還可以在活體上直接觀察到中醫(yī)所謂的“斜飛脈”、“反關(guān)脈”及在寸口處并行的“雙管脈”。
張氏等[27-28]運(yùn)用具有B超和壓力復(fù)合傳感器的可視化脈動信息采集和分析裝置,對橈動脈三維運(yùn)動和脈診“位、數(shù)、形、勢”屬性的關(guān)系進(jìn)行了探索性研究,發(fā)現(xiàn)了二者之間的對應(yīng)關(guān)系,為解決“脈形”、“脈勢”等研究難點(diǎn)提供了新的思路和方法。
張氏等[29]自主研制了一種圖像化脈搏傳感器。通過對沿血管橫截面方向的14個網(wǎng)格點(diǎn)軌跡的檢測,提取得到了脈搏波形,并計算得出脈搏頻率,同時給出脈搏振幅、脈寬信息測量的定性說明。研究表明,本系統(tǒng)能夠有效提取多維脈搏特征信息,為中醫(yī)診斷客觀化和科學(xué)化提供了一種新的手段和方法。
7 其他方法
7.1 混沌分析方法
李氏等[30]借助動態(tài)心電圖記錄獲取心電RR間期的變化信息的混沌分析方法手段——Lorenz圖,觀察脈象速率、節(jié)律的改變,將醫(yī)生靠個體感覺的判斷變?yōu)榫哂锌梢曅?、直觀性和連續(xù)性的圖形表達(dá),可客觀地量度脈象的改變程度和性質(zhì)。認(rèn)為雖然Lorenz圖無法量度脈搏形態(tài)的變化,但有時脈搏的形態(tài)與速率相關(guān),如沉遲、洪數(shù)等特異性的復(fù)合脈象,這也許是繼續(xù)研究的切入點(diǎn)。
7.2 整體動態(tài)方法
劉氏等[31]在自行研制的具有新型點(diǎn)陣式傳感器的脈象儀的基礎(chǔ)上,建立了一種新的分析方法。該方法通過繪制整體脈搏-脈體時空綜合圖,以反映脈體、脈力、脈長;整體脈搏-脈勢時空綜合圖,以反映脈寬、脈體、脈流、脈力;整體脈搏-脈流時空綜合圖,以反映脈流、脈長、脈寬等,從而準(zhǔn)確反映脈搏整體動態(tài)變化,使脈象的“位、數(shù)、形、勢”在整體上得到動態(tài)體現(xiàn)。
7.3 金氏脈學(xué)方法
魏氏等[32]根據(jù)金氏脈學(xué)的基本思想:三對基本概念、二個基本規(guī)律和一個基本原理,設(shè)計了獨(dú)特的脈搏分層測量系統(tǒng),克服了原有脈象儀的單點(diǎn)單面采樣,實(shí)現(xiàn)了自動多層面信息采集。對脈搏波進(jìn)行“多層分析”,實(shí)現(xiàn)對疾病“定性、定位、定量”的診斷。
7.4 分形方法
楊氏等[33]探索了分形理論在脈象特征提取中的應(yīng)用。研究結(jié)果表明,不同類別的脈象信號具有不同的分形維,這為采用分形理論進(jìn)行目標(biāo)特征提取提供了基礎(chǔ)。與頻域分析方法比較,利用分形提取維數(shù)特征的方法更簡單易行。
8 展望
8.1 分析方法的發(fā)展
傳感器技術(shù)的進(jìn)步使脈動信息獲取空間擴(kuò)大。信息來源的豐富要求新的分析方法來適應(yīng)這種變革。目前,分析方法體現(xiàn)出兩種獲取新特征信息的趨勢:一是在原有信息來源的基礎(chǔ)上,引進(jìn)新的分析技術(shù),發(fā)現(xiàn)新的特征參數(shù);二是開發(fā)除脈動壓力信息以外的新的信息來源,并應(yīng)用新的分析技術(shù)。
時頻分析屬于前一種趨勢。時頻分析的目的是在時間和頻率上同時表示信號的能量和強(qiáng)度,最終建立一種能量和強(qiáng)度的時相分布,具有動態(tài)分析的特征。其與原有的時域和頻域分析不同,但又兼有二者的一些優(yōu)點(diǎn),所以,部分研究者熱衷于脈動信息時頻特征參數(shù)的獲取。小波變換是時頻分析的另一種重要手段,也是脈診研究的熱點(diǎn)之一,其在信息學(xué)、工程學(xué)中的應(yīng)用則更為廣泛和深入。小波變換方法在時域和頻域同時具有良好的局部化性質(zhì),即可以在兩個領(lǐng)域中對同一信號進(jìn)行可調(diào)控地、更細(xì)微地觀察,具有放大效應(yīng),故被稱為“數(shù)學(xué)放大鏡”。可以看出,時頻分析與常規(guī)時域、頻域分析的關(guān)鍵區(qū)別在于對同一信號進(jìn)行分析的角度和尺度,而信號的來源是同一的,并沒有新的信息引入。
可視化分析(或圖像分析)屬于后一種趨勢??梢暬夹g(shù)的應(yīng)用突破了長期以來一維脈動壓力信號的采集模式。所采用的圖像分析方法,將主要研究對象轉(zhuǎn)移到橈動脈三維運(yùn)動相關(guān)的圖形圖像變化上。如對橈動脈B超圖像的分析,由于視覺是人類獲取外界信息的最主要途徑,可視化的動態(tài)圖像所攜帶的信息遠(yuǎn)遠(yuǎn)大于壓力信號;同時采用與壓力信號分析截然不同的分析方法,將三維運(yùn)動的空間測量作為參數(shù)獲得的主要手段,用一些直觀、簡單的參數(shù)即可完成脈診屬性的分析,對一些壓力信號無法反映的特征,如“脈長”、“脈寬”、“脈勢”等實(shí)現(xiàn)了參數(shù)定量分析。
8.2 識別方法的發(fā)展
脈象本身的復(fù)雜性和多元體現(xiàn)形式使原有的有限參數(shù)與某種脈象的整體特征一一高度對應(yīng)的研究設(shè)想難以實(shí)現(xiàn)?;趶?fù)雜性思想的辨識方法是近幾年脈診現(xiàn)代研究的新方向。目前脈象辨識模式的兩種主要趨勢是:具有復(fù)雜性研究性質(zhì)的識別方法和基于“位、數(shù)、形、勢”脈診屬性的“復(fù)雜-簡單-復(fù)雜”模式。
8.2.1 具有復(fù)雜性研究性質(zhì)的識別方法 聚類技術(shù)的根本問題是對兩個對象間距離和相異度度量的選擇,針對兩兩對象之間的“相似度”或“相異度”劃分不同類別,并不能從多維和多層次角度來全面分析數(shù)據(jù)并解釋數(shù)據(jù)中真正復(fù)雜結(jié)構(gòu)。另一方面,信息與脈象之間的關(guān)聯(lián)性是非常復(fù)雜的,具有多維和多層次的復(fù)雜聯(lián)系。目前脈動信息所常用的時域或頻域分析所獲得參數(shù),僅僅是對一維壓力信號的多角度觀測。信號本身信息量的單薄,加之分析方法的局限,使上述復(fù)雜關(guān)系難以體現(xiàn)。所以,目前聚類方法在脈診識別研究中始終是一種輔助的手段,其相關(guān)報道較少。
人工神經(jīng)網(wǎng)絡(luò)不需要精確的數(shù)學(xué)模型,而是通過模擬人的聯(lián)想推理和抽象思維能力,來解決傳統(tǒng)自動化技術(shù)無法解決的許多復(fù)雜的、不確定性的、非線性的自動化問題。由于人工神經(jīng)網(wǎng)絡(luò)在構(gòu)建結(jié)構(gòu)上模擬了人的中樞神經(jīng)結(jié)構(gòu),通過多個循環(huán)的訓(xùn)練來達(dá)到最終目標(biāo),自身具有很強(qiáng)的自組織性和容錯性,與人的思維有一定的相似性,所以是目前研究較為熱門的方向之一。脈診辨識的相關(guān)研究顯示其應(yīng)用結(jié)果是令人滿意的。
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),尤其是輸入層和隱含層的數(shù)目,嚴(yán)重影響網(wǎng)絡(luò)的訓(xùn)練速度和擬合程度。為了實(shí)現(xiàn)較快的識別,優(yōu)化和統(tǒng)一結(jié)構(gòu)將是未來研究的方向之一。另外,目前脈診現(xiàn)代研究的目標(biāo)要求盡可能的減少主觀因素在脈象辨識中的影響,形成較為一致和公認(rèn)的客觀識別方法,而訓(xùn)練樣本的不同會導(dǎo)致不同的人工智能的認(rèn)知模式,即使神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相同,亦是如此。這與客觀研究的目標(biāo)背道而馳。所以,如何統(tǒng)一有限的訓(xùn)練樣本,將是未來研究人員面臨的新問題。
8.2.2 基于脈診屬性的“復(fù)雜簡單復(fù)雜”模式 “位、數(shù)、形、勢”是周學(xué)海提出的分類脈象的綱領(lǐng)。目前單脈有28種之多,相兼脈則更多。但不論脈象種類有多少,均可被分解到“位、數(shù)、形、勢”的不同程度中去,所以,“位、數(shù)、形、勢”可以看作脈診的四個基本屬性?;诿}診“位、數(shù)、形、勢”屬性的分析研究,將復(fù)雜多樣的脈象分解簡化為四種有量化可能性的參數(shù)分類,實(shí)現(xiàn)了“復(fù)雜簡單”的過程;通過客觀參數(shù)反映的“位、數(shù)、形、勢”屬性,在“組合關(guān)系”論的指導(dǎo)下可進(jìn)一步合成為具體的單一脈象,實(shí)現(xiàn)“簡單復(fù)雜”的過程。
參考文獻(xiàn)
[1] 傅驄遠(yuǎn),牛 欣.中醫(yī)脈象今釋——現(xiàn)代實(shí)驗(yàn)研究[M].北京:華夏出版社,1993.341-345.
[2] 費(fèi)兆馥.現(xiàn)代中醫(yī)脈診學(xué)[M].北京:人民衛(wèi)生出版社,2003.147-222.
[3] 黃世林,孫明異.中醫(yī)脈象研究[M].北京:人民衛(wèi)生出版社,1986.45-196.
[4] 楊天權(quán).中醫(yī)脈學(xué)應(yīng)用新進(jìn)展——附60例脈案分析[M].上海:上海交通大學(xué)出版社,1994.187-321.
[5] 徐迪華,徐劍秋,徐麗敏.中華脈診的奧秘——200幅脈圖解析[M].南京:江蘇科學(xué)技術(shù)出版社,2005.189-265.
[6] 李玉韓,蔡坤寶,張繼紅.雙譜估計在中醫(yī)脈象信號分析中的應(yīng)用[J].重慶大學(xué)學(xué)報(自然科學(xué)版),2006,29(5):44-47,61.
[7] 張繼紅,蔡坤寶,李玉韓.中醫(yī)脈象信號的參數(shù)化雙譜估計及其切片分析[J].重慶大學(xué)學(xué)報(自然科學(xué)版),2006,29(6):47-50,74.
[8] 黃 鐳,劉宗行,蔡坤寶.倒雙譜估計在海洛因吸毒者脈象信號檢測中的應(yīng)用[J].重慶工學(xué)院學(xué)報(自然科學(xué)版),2007,21(7):98-102.
[9] 王炳和,羅 建,相敬林,等.人體脈搏功率譜分析與中醫(yī)脈診機(jī)理研究[J].西北大學(xué)學(xué)報(自然科學(xué)版),2001,31(1):21-25.
[10] 王炳和,相敬林,楊 颙,等.基于信號檢測的人體脈搏系統(tǒng)傳遞函數(shù)的估計[J].科學(xué)通報,1999,44(10):1069-1073.
[11] 厲樹忠,張 媛,劉 進(jìn).中醫(yī)脈率波形的頻譜分析[J].甘肅科技,2006, 22(9):120-121.
[12] 王全來,厲樹忠,楊金龍,等.中醫(yī)浮脈與沉脈的頻譜分析[J].甘肅科技,2007,23(6):77-79.
[13] 張鏡人,鄭秀春,楊天權(quán),等.正常人脈象圖頻域指標(biāo)分析[J].遼寧中醫(yī)雜志,1995,22(10):435-436.
[14] 孟兆輝,白 凈,王蘇中,等.高血壓病人的光電容積脈搏波的頻域分析[J].北京生物醫(yī)學(xué)工程,2002,21(1):1-4.
[15] 車新生,范威陽,劉明林.基于傅立葉級數(shù)的中醫(yī)脈象三維顯示[J].遼寧中醫(yī)雜志,2007,34(11):1505-1507.
[16] 姜 斌,宋蜇存.脈象信號的頻譜分析[J].通訊與信息處理,2007,26(8):38-39.
[17] 周 越,許 晴,孔 薇.脈象特性分析和識別方法的研究[J].生物醫(yī)學(xué)工程學(xué)雜志,2006,23(3):505-508.
[18] 曾小青,李 玲,歐陽俊.指端脈搏波檢測與頻域分析實(shí)驗(yàn)設(shè)計[J].實(shí)用預(yù)防醫(yī)學(xué),2004,11(2):362-363.
[19] 周 霞,蔡坤寶.中醫(yī)脈象信號的短時傅立葉分析[J].重慶大學(xué)學(xué)報, 2003,26(10):47-51.
[20] 周 丹,蔡坤寶.基于短時傅立葉變換的脈象信號的模式識別方法[J].重慶科技學(xué)院學(xué)報(自然科學(xué)版),2007,9(3):49-52.
[21] 白金星,趙子嬰,王艷蘋.基于小波變換過零點(diǎn)表征的脈搏信號分析[J].航天醫(yī)學(xué)與醫(yī)學(xué)工程,2006,19(3):204-207.
[22] 張麗瓊,王炳和.基于小波變換的脈象信號特征提取方法[J].數(shù)據(jù)采集與處理,2004,19(3):323-328.
[23] 岳沛平.BP神經(jīng)網(wǎng)絡(luò)識別在中醫(yī)脈象信號辨識系統(tǒng)中的運(yùn)用[J].江蘇中醫(yī)藥,2005,26(11):4-6.
[24] 胡家寧,閻述池,王秀章,等.脈象特征人工神經(jīng)網(wǎng)絡(luò)分類器[J].中國醫(yī)科大學(xué)學(xué)報,1996,25(6):571-574,578.
[25] 王炳和,相敬林.基于AR模型的人體脈象信號模糊聚類研究[J].應(yīng)用聲學(xué),2001,20(5):21-25.
[26] 牛 欣,楊學(xué)智,傅驄遠(yuǎn),等.橈動脈的三維運(yùn)動與脈診位數(shù)形勢[J].中國中西醫(yī)結(jié)合雜志,1994,14(7):435-437.
[27] 張治國,牛 欣,楊學(xué)智,等.脈形和脈勢檢測方法新探[J].中西醫(yī)結(jié)合學(xué)報,2008,6(3):243-248.
[28] 張治國,牛 欣,楊學(xué)智,等.脈長的數(shù)字化、可視化探索[J].中醫(yī)雜志,2008,49(9):830-832.
[29] 張愛華,李向群.基于圖像傳感器的脈搏三維運(yùn)動分析[J].微計算機(jī)信息(測控自動化),2007,23(5):176-177,270.
[30] 李方潔,劉國正.混沌方法Lorenz圖對脈象的表達(dá)[J].中國中醫(yī)藥信息雜志,2003,10(6):10-11.
[31] 劉 峰,陳家旭.脈象信號分析新方法與實(shí)施方案[J].中醫(yī)藥學(xué)刊, 2006,24(12):2217-2218.
級別:部級期刊
榮譽(yù):中國期刊全文數(shù)據(jù)庫(CJFD)
級別:北大期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級別:統(tǒng)計源期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎期刊
級別:北大期刊
榮譽(yù):百種重點(diǎn)期刊