前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)隱含層數(shù)的確定主題范文,僅供參考,歡迎閱讀并收藏。
根據(jù)對(duì)江蘇地區(qū)農(nóng)村住宅建筑節(jié)能的分析,并通過(guò)統(tǒng)計(jì)大量文獻(xiàn)中對(duì)農(nóng)村住宅建筑節(jié)能指標(biāo)的描述,可將江蘇地區(qū)農(nóng)村住宅建筑節(jié)能評(píng)價(jià)指標(biāo)歸納為建筑外形設(shè)計(jì)、圍護(hù)結(jié)構(gòu)、設(shè)備節(jié)能、新能源的利用這四個(gè)主要方面進(jìn)行評(píng)價(jià)。對(duì)這四個(gè)指標(biāo)做進(jìn)一步分解,可以得出19個(gè)子指標(biāo),
2江蘇地區(qū)農(nóng)村住宅建筑節(jié)能的綜合評(píng)價(jià)方法
2.1信息熵方法對(duì)建筑節(jié)能評(píng)價(jià)指標(biāo)的篩選
為了從已經(jīng)構(gòu)建的初始評(píng)價(jià)指標(biāo)中提取主要評(píng)價(jià)指標(biāo),可以采用信息熵法剔除其中對(duì)評(píng)價(jià)影響不大的指標(biāo)。具體操作步驟及方法如下:第一步:將初始的指標(biāo)矩陣進(jìn)行標(biāo)準(zhǔn)化處理。假定所選的評(píng)估對(duì)象有N個(gè),初始的指標(biāo)有M個(gè),則可以構(gòu)建N×M階的矩陣,定義為矩陣A。按照式(1)進(jìn)行標(biāo)準(zhǔn)化后的矩陣為A′。a′ij=(1)第二步:熵值的求取。令pj表示熵值,則,Πij=pj=-ΠijlnΠij(2)第三步:熵權(quán)的確定。Wj表示求出的熵權(quán)的大小,則,Wj=(3)第四步:確定某個(gè)評(píng)價(jià)指標(biāo)的具體權(quán)重。權(quán)重值用Qj表示,則,Qj=(4)第五步:將第三步求出的熵權(quán)與第四步求出的具體權(quán)重進(jìn)行結(jié)合,剔除冗余指標(biāo),確保評(píng)價(jià)的穩(wěn)定性。
2.2BP神經(jīng)網(wǎng)絡(luò)方法對(duì)農(nóng)村住宅建筑節(jié)能的綜合評(píng)價(jià)
BP神經(jīng)網(wǎng)絡(luò)可以用于逼近任意的一個(gè)非線性的函數(shù),同時(shí)具有超強(qiáng)的自適應(yīng)以及存儲(chǔ)能力。采用BP神經(jīng)進(jìn)行評(píng)價(jià)時(shí),其運(yùn)行的主要思想就是將搜集到數(shù)據(jù)輸入到該系統(tǒng)中,然后系統(tǒng)進(jìn)行自我訓(xùn)練,擬合各指標(biāo)間的最優(yōu)關(guān)系,并自動(dòng)記憶、存儲(chǔ)所選指標(biāo)對(duì)綜合評(píng)價(jià)對(duì)象的影響權(quán)值,繼而對(duì)類似對(duì)象做出客觀的評(píng)價(jià)。在進(jìn)行BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練之前需要構(gòu)建BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),主要需要以下參數(shù)。
(1)BP神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)與層數(shù)的確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的確定需先確定輸入、輸出層節(jié)點(diǎn)數(shù)、隱含層的層數(shù)以及隱含層節(jié)點(diǎn)。輸入層節(jié)點(diǎn)數(shù)為指標(biāo)個(gè)數(shù),輸出層節(jié)點(diǎn)數(shù)為建筑節(jié)能綜合評(píng)價(jià)指標(biāo)。在規(guī)模不大的情況下,常采用一個(gè)隱含層。隱含層節(jié)點(diǎn)數(shù)可根據(jù)式(5)確定。Ny=(5)其中,Ny表示隱含層節(jié)點(diǎn)數(shù);Ni表示輸入層節(jié)點(diǎn)數(shù);No表示輸出層節(jié)點(diǎn)數(shù);NP表示訓(xùn)練樣本個(gè)數(shù)。
(2)BP神經(jīng)網(wǎng)絡(luò)相關(guān)參數(shù)的確定確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)后,需要確定網(wǎng)絡(luò)函數(shù)的選取、初始權(quán)重的確定、期望誤差、學(xué)習(xí)速率、訓(xùn)練次數(shù)等相關(guān)參數(shù)。
3江蘇農(nóng)村住宅建筑節(jié)能的綜合評(píng)價(jià)
首先對(duì)初始建立的評(píng)價(jià)指標(biāo)進(jìn)行篩選,剔除其中可能對(duì)評(píng)價(jià)結(jié)果有干擾的影響因素。聘請(qǐng)10位專家對(duì)初始的評(píng)價(jià)指標(biāo)進(jìn)行打分,然后依據(jù)信息熵方法進(jìn)行處理,最終得出的綜合評(píng)價(jià)指標(biāo)包括b11、b12、b13、b14、b21、b22、b23、b24、b25、b31、b32、b33、b41、b45、b46這15個(gè)評(píng)價(jià)指標(biāo)。采用三層BP神經(jīng)網(wǎng)絡(luò)模型,即輸入層、隱含層、輸出層各一層,輸入節(jié)點(diǎn)數(shù)為選定的評(píng)價(jià)指標(biāo)數(shù)15,根據(jù)式(5)確定隱含層的節(jié)點(diǎn)數(shù)為7,輸出節(jié)點(diǎn)數(shù)為1。函數(shù)采用Sigmoid函數(shù),初始權(quán)值為[0,1]區(qū)間的較小的數(shù),誤差期望為0.01,學(xué)習(xí)速率為0.001,訓(xùn)練次數(shù)為10000次。筆者選取了江蘇省某地區(qū)的6個(gè)農(nóng)村住宅建筑作為評(píng)價(jià)對(duì)象,以其中的5個(gè)作為訓(xùn)練樣本。數(shù)據(jù)主要是通過(guò)調(diào)查得到并做歸一化處理,聘請(qǐng)相關(guān)專家對(duì)這幾個(gè)樣本進(jìn)行綜合評(píng)分,用t表示。經(jīng)過(guò)訓(xùn)練,將第六個(gè)樣本作為評(píng)價(jià)對(duì)象,采用該模型進(jìn)行綜合評(píng)價(jià),各指標(biāo)的初始值見表3。采用經(jīng)訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行綜合評(píng)價(jià),得出的最終評(píng)價(jià)結(jié)果為0.932,這與通過(guò)專家打分法得出的評(píng)價(jià)值0.927相比,誤差為0.005,相對(duì)誤差為0.5%。這充分說(shuō)明采用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行綜合評(píng)價(jià)是可行的,且其評(píng)價(jià)的精度比較高。
4結(jié)語(yǔ)
[關(guān)鍵詞]人工神經(jīng)網(wǎng)絡(luò);旅游物流;需求預(yù)測(cè)
[DOI]1013939/jcnkizgsc201538051
1引言
旅游物流對(duì)廣西地區(qū)經(jīng)濟(jì)的發(fā)展至關(guān)重要,準(zhǔn)確把握、預(yù)測(cè)旅游物流需求有助于有關(guān)部門制定合理的旅游物流規(guī)劃、促進(jìn)國(guó)民經(jīng)濟(jì)可持續(xù)發(fā)展、提高居民生活水平。國(guó)內(nèi)學(xué)者通過(guò)一定的方法和模型確定了影響旅游物流能力的關(guān)鍵要素,為旅游物流需求的預(yù)測(cè)提供了一定的理論基礎(chǔ),而在物流需求預(yù)測(cè)方面也提出了很多如時(shí)間序列模型、灰色預(yù)測(cè)、回歸分析等具有創(chuàng)新性和實(shí)踐意義的方法。由于旅游物流具有的獨(dú)特性和負(fù)責(zé)性使得這些模型及分析方法在前提條件、適用范圍和側(cè)重點(diǎn)的選取方面具有一定的困難,因此在實(shí)際應(yīng)用中各有利弊。人工神經(jīng)網(wǎng)絡(luò)可以將定量或定性的信息等勢(shì)的分布貯存于網(wǎng)絡(luò)內(nèi)的各神經(jīng)元,有很強(qiáng)的魯棒性和容錯(cuò)性,通過(guò)建立基于人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,利用Braincell軟件進(jìn)行計(jì)算以期達(dá)到精確預(yù)測(cè)旅游物流需求的目的。
2旅游物流的需求界定
經(jīng)過(guò)多年的發(fā)展,關(guān)于旅游物流需求的定義至今仍沒(méi)有一個(gè)令各方滿意的結(jié)論。物流服務(wù)貫穿了整個(gè)旅游活動(dòng)過(guò)程中,旅游物流可以看作為了使旅游消費(fèi)者獲得更好地滿足感和旅游體驗(yàn),與旅游相關(guān)的主體提供讓旅游消費(fèi)者更為暢通流動(dòng)的旅游服務(wù),與此相應(yīng)的旅游物流的能力指提供的旅游服務(wù)內(nèi)容以及相關(guān)主體使用物流設(shè)施對(duì)旅游物流活動(dòng)進(jìn)行計(jì)劃、組織、協(xié)調(diào)和控制的能力,到旅游物流的具體環(huán)節(jié),可以從涉及旅游者的吃、住、行、購(gòu)、游、娛等方面界定旅游相關(guān)主體運(yùn)用物流設(shè)施為游客提供旅游服務(wù)的能力。文中對(duì)旅游物流需求的預(yù)測(cè)可以從往年的旅游物流能力方面進(jìn)行預(yù)測(cè),通過(guò)準(zhǔn)確的預(yù)測(cè)旅游物流需求可以較好地規(guī)劃未來(lái)年份旅游業(yè)發(fā)展方向,對(duì)物流設(shè)施和設(shè)備進(jìn)行準(zhǔn)確的投入,減少資源的浪費(fèi)及設(shè)施投入不足的狀況。
旅游物流能力是指旅游服務(wù)主體向旅游消費(fèi)者從“吃、住、行、購(gòu)、游、娛”6個(gè)方面提供服務(wù)的能力,旅游物流需求可根據(jù)這6方面來(lái)選取指標(biāo),但是旅游物流需求預(yù)測(cè)的準(zhǔn)確性不僅受到旅游物流的獨(dú)特性的制約,還受到一些客觀性條件的影響。如物流統(tǒng)計(jì)制度不健全,目前,我國(guó)仍沒(méi)有建立系統(tǒng)全面的物流統(tǒng)計(jì)制度,更沒(méi)有涉及旅游物流領(lǐng)域;物流統(tǒng)計(jì)沒(méi)有涉及物流活動(dòng)的全過(guò)程;物流統(tǒng)計(jì)指標(biāo)過(guò)于單一。此外,國(guó)內(nèi)只有基本的貨物運(yùn)輸量和貨物周轉(zhuǎn)量統(tǒng)計(jì),其他與物流相關(guān)的指標(biāo)沒(méi)有公開的統(tǒng)計(jì)資料,也沒(méi)有權(quán)威的統(tǒng)計(jì)方法和基礎(chǔ)數(shù)據(jù),致使物流需求預(yù)測(cè)不能通過(guò)直接指標(biāo)來(lái)衡量需求規(guī)模的大小。
3基于神經(jīng)網(wǎng)絡(luò)的旅游物流需求預(yù)測(cè)模型的建立
神經(jīng)網(wǎng)絡(luò)具有非線性、曲線擬合能力、學(xué)習(xí)能力和抗干擾能力,是一種通用的非線性函數(shù)逼近工具。通過(guò)對(duì)BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,特別適用于構(gòu)造非線性預(yù)測(cè)函數(shù),而且精度可達(dá)到預(yù)定的要求。
31預(yù)測(cè)領(lǐng)域中的BP神經(jīng)網(wǎng)絡(luò)模型簡(jiǎn)介
BP神經(jīng)網(wǎng)絡(luò)通過(guò)正向輸入,反向傳播誤差不斷迭代的學(xué)習(xí)過(guò)程,直到誤差減到可以接受的程度。一般包括輸入層、隱含層和輸出層的單隱含層網(wǎng)絡(luò)就能以任意精度表示并揭示任何連續(xù)函數(shù)所蘊(yùn)含的非線性關(guān)系。其中:
(1)工作信號(hào)正向傳播。輸入信號(hào)從輸入層經(jīng)過(guò)隱含層,傳向輸出層,在輸出端產(chǎn)生輸出信號(hào),這是工作信號(hào)的正向傳播。在信號(hào)的正向傳播過(guò)程中網(wǎng)絡(luò)的權(quán)值是固定不變的,上一層神經(jīng)元的只影響下一層神經(jīng)元的狀態(tài),即正向影響。如果在輸出層不能得到期望的輸出,則轉(zhuǎn)入誤差信號(hào)反向傳播。
(2)誤差信號(hào)反向傳播。網(wǎng)絡(luò)的實(shí)際的輸出與所期望的輸出之間差值即為誤差信號(hào),誤差信號(hào)由輸出端開始逐層向前傳播,即誤差信號(hào)的反向傳播。在誤差信號(hào)反向傳播中,神經(jīng)網(wǎng)絡(luò)的權(quán)值根據(jù)誤差的反饋進(jìn)行調(diào)節(jié)。通過(guò)不斷地對(duì)權(quán)值的修正,使實(shí)際輸出更加接近期望輸出。
(3)預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)流程。通過(guò)了解工作信號(hào)與誤差信號(hào)的傳播方向,可以清楚地了解預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)的工作流程。預(yù)測(cè)開始時(shí)神經(jīng)網(wǎng)絡(luò)讀入樣本、權(quán)值,通過(guò)計(jì)算輸入層的輸入得出結(jié)果傳遞到輸出層,在輸出層進(jìn)行計(jì)算,最后在計(jì)算輸出值與期望值的誤差。若誤差小于確定值則計(jì)算結(jié)束,若誤差大于確定值則繼續(xù)回到前兩層進(jìn)行權(quán)值調(diào)整,把調(diào)整后的權(quán)值重新輸入到模型中,直到誤差小于設(shè)定的確定值。
本文應(yīng)用Braincell神經(jīng)網(wǎng)絡(luò)軟件來(lái)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的計(jì)算與分析。
32BrainCell軟件及實(shí)現(xiàn)
321BrainCell 神經(jīng)網(wǎng)絡(luò)基本原理
BrainCell 神經(jīng)網(wǎng)絡(luò)采用誤差反向傳播學(xué)習(xí)算法,算法從兩個(gè)方面(信號(hào)的前向傳播和誤差的反向傳播)反復(fù)進(jìn)行迭代學(xué)習(xí),與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模式基本原理相同。
322BrainCell 神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)步驟
(1)數(shù)據(jù)的預(yù)處理和后處理。為方便的計(jì)算減少誤差,保證數(shù)據(jù)同一量綱,需要將數(shù)據(jù)歸一化為區(qū)域[0,1]之間數(shù)據(jù)。在實(shí)際的預(yù)測(cè)模型中當(dāng)數(shù)據(jù)接近0或1的時(shí)候訓(xùn)練效果會(huì)明顯下降。因此,為了避免數(shù)據(jù)落入最大飽和區(qū),保持?jǐn)?shù)據(jù)的原有特征,根據(jù)經(jīng)驗(yàn)將數(shù)據(jù)規(guī)范到[015,085]來(lái)進(jìn)行修正。模型中采用反歸一化處理輸出數(shù)據(jù)。
(2)網(wǎng)絡(luò)層數(shù)目的確定。由Kolmogorov定理可知,含有一個(gè)神經(jīng)元隱含層的三層神經(jīng)網(wǎng)絡(luò)可以從任意精度逼近一個(gè)從輸入到輸出的映射關(guān)系,因此在Braincell神經(jīng)網(wǎng)絡(luò)中采用含有單隱層的三層神經(jīng)網(wǎng)絡(luò)[2]。
(3)網(wǎng)絡(luò)節(jié)點(diǎn)的確定。輸入層節(jié)點(diǎn)的多少與評(píng)價(jià)指標(biāo)個(gè)數(shù)是相對(duì)應(yīng)的。
(4)網(wǎng)絡(luò)訓(xùn)練。假設(shè)訓(xùn)練樣例是形式(x,y),其中x為輸入向量,y為輸出值。N為輸入節(jié)點(diǎn)數(shù),M為輸出層節(jié)點(diǎn)數(shù)。從單位i到單位j的輸入表示xij,單位i 到單位j的權(quán)值表示W(wǎng)ij。一是創(chuàng)建具有N 個(gè)輸入單位,M 個(gè)輸出單位的BrainCell 神經(jīng)網(wǎng)絡(luò);二是用隨機(jī)數(shù)(0 或1)初始化某些數(shù)字變量網(wǎng)絡(luò)權(quán)值Wij;三是對(duì)于第k個(gè)訓(xùn)練樣例(a,b),把入跟著網(wǎng)絡(luò)前向傳播,并計(jì)算網(wǎng)絡(luò)中每個(gè)單元x的輸出Qx,使誤差沿著反向傳播;四是對(duì)于每個(gè)輸出單元u,計(jì)算它的誤差項(xiàng);五是對(duì)于每個(gè)隱含單元h,計(jì)算它的誤差項(xiàng);六是利用誤差項(xiàng)更新調(diào)整每個(gè)網(wǎng)絡(luò)權(quán)值;七是重復(fù)三到六點(diǎn),直到完成指定的迭代次數(shù)或者是其誤差值達(dá)到可接受的范圍。
33神經(jīng)網(wǎng)絡(luò)的旅游物流需求預(yù)測(cè)模型的建立
331模型中數(shù)據(jù)指標(biāo)確定
目前我國(guó)仍沒(méi)有健全的物流統(tǒng)計(jì)制度,因此實(shí)際工作中收集旅游物流需求數(shù)據(jù)十分困難。這里采用間接指標(biāo)法――利用與旅游物流需求相關(guān)的經(jīng)濟(jì)指標(biāo)來(lái)建立旅游物流需求的經(jīng)濟(jì)指標(biāo)體系,通過(guò)數(shù)學(xué)的方法進(jìn)行總結(jié)與推導(dǎo),確定旅游物流需求模型。
旅游物流需求是一種派生需求,這種需求的大小與其本身發(fā)展有著密切的關(guān)系。從宏觀層面上考慮主要有內(nèi)外兩部分因素:旅游業(yè)自身發(fā)展的狀況及外部環(huán)境的影響。從微觀層面來(lái)說(shuō),旅游業(yè)自身發(fā)展的狀況是旅游物流需求的關(guān)鍵因素。旅游業(yè)產(chǎn)值越高,旅游物流需求增長(zhǎng)隨之增加,反之亦然。由此,本文選取旅游總收入和接待人數(shù)作為預(yù)測(cè)旅游物流需求的指標(biāo)。其次,影響旅游物流的其他關(guān)鍵因素就是旅游行業(yè)本身所投入的設(shè)施、人員、公路鐵路旅客周轉(zhuǎn)量等因素。根據(jù)旅游物流能力的理解從“吃、住、行、購(gòu)、游、娛”等方面進(jìn)行指標(biāo)的選取,如“吃、住”方面使用餐飲住宿從業(yè)人數(shù)、星級(jí)飯店數(shù)目衡量;“行”使用公路、鐵路旅客的周轉(zhuǎn)量來(lái)衡量等;“游”則使用旅行社從業(yè)人數(shù)等方面來(lái)衡量。這些因素都對(duì)行業(yè)的產(chǎn)值有較大的影響。因此,在模型中可將這些相關(guān)經(jīng)濟(jì)指標(biāo)作為旅游物流需求規(guī)模的影響因素。由此可選擇如下輸入層指標(biāo):星級(jí)飯店數(shù)X1、接待入境旅游者平均每人消費(fèi)額X2、餐飲住宿業(yè)從業(yè)人數(shù)X3、旅行社從業(yè)人數(shù)X4、鐵路旅客周轉(zhuǎn)量X5、公路旅客周轉(zhuǎn)量X6、旅游部門游船年末實(shí)有船數(shù)X7,旅游部門旅游客車年末實(shí)有數(shù)X8,共有8個(gè)。而把旅游業(yè)的年收入Y1與年接待入境旅游者人數(shù)Y2作為物流需求預(yù)測(cè)的目標(biāo)。
332數(shù)據(jù)來(lái)源
本文選取的數(shù)據(jù)資料來(lái)源于廣西壯族自治區(qū)歷年統(tǒng)計(jì)年鑒、中國(guó)統(tǒng)計(jì)年鑒、中國(guó)旅游年鑒,如表1所示。根據(jù)樣本數(shù)據(jù)選取原則,將2005年和2012年的數(shù)據(jù)作為網(wǎng)絡(luò)測(cè)試樣本,最后用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)2014―2016年的物流需求規(guī)模。
333廣西旅游物流需求的BP人工神經(jīng)網(wǎng)絡(luò)模型
(1)樣本數(shù)據(jù)的歸一化處理。選取X1,X2,X3,X4,X5,X6,X7,X8作為廣西旅游物流需求預(yù)測(cè)BP人工神經(jīng)網(wǎng)絡(luò)模型的輸入,Y1,Y2為BP網(wǎng)絡(luò)的輸出。根據(jù)BP 的本身特點(diǎn),對(duì)輸入層數(shù)據(jù)進(jìn)行歸一化時(shí),采用如下公式:y=log[JB((]x[JB))]/10。對(duì)輸出層數(shù)據(jù)則使用歸反一化處理,公式如下:P=log[JB((]tT[JB))]/10。
(2)網(wǎng)絡(luò)節(jié)點(diǎn)的確定。根據(jù)構(gòu)建好的評(píng)價(jià)指標(biāo)體系,可以確定輸入層的節(jié)點(diǎn)數(shù)為8,輸出層的指標(biāo)數(shù)為2。
(3)網(wǎng)絡(luò)訓(xùn)練。以traindx作為訓(xùn)練函數(shù),利用matlab計(jì)算??芍谧畲笥?xùn)練次數(shù)為200次,目標(biāo)誤差為001,學(xué)習(xí)率設(shè)置為003,誤差曲線收斂于目標(biāo)001,進(jìn)過(guò)45次迭代后,網(wǎng)絡(luò)達(dá)到目標(biāo)要求,訓(xùn)練誤差圖見下圖。
訓(xùn)練誤差圖
通過(guò)設(shè)置的數(shù)據(jù),使用Braincell軟件對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,選取全部數(shù)據(jù)作為樣本數(shù)據(jù)組,2010―2013年的樣本作為將預(yù)測(cè)樣本,輸入模型可得2010―2013年的預(yù)測(cè)值見表2。
據(jù)表3可以看出,預(yù)測(cè)效果較好,一般來(lái)說(shuō),對(duì)于經(jīng)濟(jì)指標(biāo)的預(yù)測(cè),誤差能夠控制在3%以內(nèi)就算比較準(zhǔn)確。因此,基于與旅游物流相關(guān)的其他經(jīng)濟(jì)數(shù)據(jù)來(lái)建立BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)旅游物流需求有一定的實(shí)用價(jià)值。
4結(jié)論
根據(jù)人工神經(jīng)網(wǎng)絡(luò)理論建立的旅游物流需求預(yù)測(cè)模型,通過(guò)Braincell神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)特征,運(yùn)用traindx函數(shù)進(jìn)行訓(xùn)練,在訓(xùn)練過(guò)程中對(duì)權(quán)值進(jìn)行不斷修正,誤差比率控制合適的在范圍內(nèi),使網(wǎng)絡(luò)的實(shí)際輸出向量逐漸地接近期望的輸出值。最后把仿真的預(yù)測(cè)結(jié)果與真實(shí)量進(jìn)行初步比較分析,得出的結(jié)果能夠證明使用神經(jīng)網(wǎng)絡(luò)模型對(duì)旅游物流的預(yù)測(cè)精度較高。因此可以得出以下的結(jié)論:用BP神經(jīng)網(wǎng)絡(luò)建立模型,可以準(zhǔn)確地把與旅游物流相關(guān)的經(jīng)濟(jì)數(shù)據(jù)與目標(biāo)本身的需求量進(jìn)行結(jié)合,可得到較為精準(zhǔn)的旅游物流需求預(yù)測(cè)值。由此可以推斷,人工神經(jīng)網(wǎng)絡(luò)作為高度的非線性體系,能夠?qū)?jīng)濟(jì)系統(tǒng)中個(gè)變量之間的非線性關(guān)系進(jìn)行高精度的預(yù)測(cè),將其運(yùn)用在物流領(lǐng)域中的應(yīng)用具有更加廣闊的發(fā)展?jié)摿Α?/p>
參考文獻(xiàn):
[1]王新利,趙琨基于神經(jīng)網(wǎng)絡(luò)的農(nóng)產(chǎn)品物流需求預(yù)測(cè)研究[J].農(nóng)業(yè)技術(shù)經(jīng)濟(jì),2010(2):64-66
[2]秦立公,韋金榮等基于BrainCell 的B2B 電子商務(wù)供應(yīng)鏈協(xié)同績(jī)效評(píng)價(jià)體系[J].中國(guó)集體經(jīng)濟(jì),2014(15):112-113
[3]張圣楠,郭文義,等基于MATLAB的BP神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)與訓(xùn)練[J].內(nèi)蒙古科技與經(jīng)濟(jì),2005(17):96-98
[4]熊勛人工神經(jīng)網(wǎng)絡(luò)在環(huán)境質(zhì)量評(píng)價(jià)和預(yù)測(cè)中的應(yīng)用研究[D].武漢:華中科技大學(xué),2009
[5]白平,陳菊紅基于旅游物流能力的西部旅游發(fā)展研究[J].新疆大學(xué)學(xué)報(bào),2013(41):16-17
[6]秦立公,王東,等旅游景區(qū)物流能力優(yōu)化研究[J].現(xiàn)代商業(yè),2010(24):47
1模型介紹
1.1BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型神經(jīng)網(wǎng)絡(luò)是由大量簡(jiǎn)單的神經(jīng)元相互連接構(gòu)成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),其對(duì)非線性系統(tǒng)具有很強(qiáng)的模擬能力。BP神經(jīng)網(wǎng)絡(luò)即誤差反向傳播網(wǎng)絡(luò)是目前應(yīng)用最為廣泛的網(wǎng)絡(luò)算法,學(xué)習(xí)過(guò)程由信息的正向傳遞與誤差的反向傳播2個(gè)過(guò)程組成,3層(輸入層、隱含層、輸出層)的前向BP神經(jīng)網(wǎng)絡(luò)可以任意精度逼近任意非線性函數(shù),且運(yùn)用神經(jīng)網(wǎng)絡(luò)只需建立輸入和輸出之間的網(wǎng)絡(luò)關(guān)系就可對(duì)目標(biāo)值進(jìn)行模擬預(yù)測(cè),所以用BP神經(jīng)網(wǎng)絡(luò)對(duì)大型機(jī)電設(shè)備備件需求進(jìn)行預(yù)測(cè)是十分有效的。研究采用3層網(wǎng)絡(luò)模式對(duì)大型機(jī)電設(shè)備備件需求進(jìn)行模擬預(yù)測(cè),這里選擇為n個(gè)樣本的輸入點(diǎn),對(duì)應(yīng)1個(gè)輸出值。其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型參數(shù)(如隱含層數(shù),最大訓(xùn)練次數(shù),學(xué)習(xí)精度,隱節(jié)點(diǎn)數(shù),初始權(quán)值、閾值等)的確定要靠網(wǎng)絡(luò)訓(xùn)練來(lái)實(shí)現(xiàn)。實(shí)現(xiàn)算法的軟件載體為MAT2LAB6.5.1。訓(xùn)練步驟可表述如下:1)樣本數(shù)據(jù)和測(cè)試數(shù)據(jù)進(jìn)行歸一化。使用歸一化函數(shù)PREMNMX;2)取-1~1間的隨機(jī)數(shù)作為初始的權(quán)值和閥值并給定精度ε,有ε>0;3)對(duì)n個(gè)訓(xùn)練樣本順序輸入神經(jīng)網(wǎng)絡(luò),計(jì)算;4)計(jì)算E(n)的值,并與給定精度ε比較,若E(n)<ε則停止訓(xùn)練,否則繼續(xù);5)比較連續(xù)兩次的誤差值,調(diào)整學(xué)習(xí)率δ。輸入層與隱含層、隱含層與輸出層的權(quán)數(shù)與閥值分別調(diào)整為:已知輸出層的神經(jīng)元Y,對(duì)Y反歸一化(反歸一化函數(shù)POSTMNMX),即得到預(yù)測(cè)的需求數(shù)據(jù)。
1.2馬爾科夫鏈預(yù)測(cè)模型馬爾科夫鏈?zhǔn)且环N特殊的隨機(jī)過(guò)程(馬爾科夫過(guò)程),其可以根據(jù)系統(tǒng)當(dāng)前時(shí)刻的狀態(tài)推求下一時(shí)刻的狀態(tài)概率分布,進(jìn)而得到下一時(shí)刻的狀態(tài)。其基本原理是:按照某個(gè)系統(tǒng)的發(fā)展,時(shí)間可離散為n=0,1,2,3,對(duì)每個(gè)系統(tǒng)的狀態(tài)可用隨機(jī)變量表示,并且對(duì)應(yīng)一定的概率,稱為狀態(tài)概率。當(dāng)馬爾科夫過(guò)程由某一時(shí)刻狀態(tài)轉(zhuǎn)移到另一時(shí)刻狀態(tài)時(shí),在這個(gè)轉(zhuǎn)移過(guò)程中存在著概率的轉(zhuǎn)移,稱為轉(zhuǎn)移概率。馬爾科夫鏈預(yù)測(cè)的理論基礎(chǔ)是馬爾科夫過(guò)程。對(duì)其運(yùn)動(dòng)變化的分析,主要是通過(guò)研究鏈內(nèi)有限個(gè)馬爾科夫過(guò)程的狀態(tài)及其相互關(guān)系,進(jìn)而預(yù)測(cè)鏈的未來(lái)發(fā)展?fàn)顩r。馬爾科夫鏈預(yù)測(cè)的結(jié)果為一取值范圍,適合于對(duì)隨機(jī)波動(dòng)性較大的預(yù)測(cè)問(wèn)題進(jìn)行修正描述。馬爾科夫鏈預(yù)測(cè)模型可表示為。
1.3基于馬爾科夫鏈修正的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型BP神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于短期預(yù)測(cè),缺點(diǎn)在于其對(duì)長(zhǎng)期預(yù)測(cè)和波動(dòng)較大數(shù)據(jù)序列的擬合較差。神經(jīng)網(wǎng)絡(luò)模型具有局部逼近的特性和較強(qiáng)的非線性映射能力,能夠很好地模擬具有較強(qiáng)非線性變化特點(diǎn)的大型機(jī)電設(shè)備備件需求預(yù)測(cè)問(wèn)題,其缺點(diǎn)在于收斂速度慢、訓(xùn)練時(shí)間長(zhǎng)且易陷入局部極小問(wèn)題。馬爾科夫鏈預(yù)測(cè)的對(duì)象是一個(gè)隨機(jī)變化的動(dòng)態(tài)系統(tǒng),且能夠縮小預(yù)測(cè)區(qū)間,對(duì)長(zhǎng)期預(yù)測(cè)和隨機(jī)波動(dòng)較大數(shù)據(jù)序列的預(yù)測(cè)效果較好。但是采用馬爾科夫鏈預(yù)測(cè)時(shí),要求預(yù)測(cè)對(duì)象具有平移過(guò)程。因此,采用馬爾科夫鏈修正BP神經(jīng)網(wǎng)絡(luò),形成基于馬爾科夫鏈修正的組合BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,不僅能揭示數(shù)據(jù)序列的發(fā)展變化總趨勢(shì),又能得到預(yù)測(cè)區(qū)間的狀態(tài)變化規(guī)律,提高模型的預(yù)測(cè)精度。根據(jù)BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果,選取適當(dāng)?shù)臉?biāo)準(zhǔn)(這里采用預(yù)測(cè)結(jié)果的相對(duì)誤差)將預(yù)測(cè)數(shù)據(jù)序列劃分為若干個(gè)狀態(tài)區(qū)間;計(jì)算其一步轉(zhuǎn)移矩陣,求得一步轉(zhuǎn)移概率矩陣;確定預(yù)測(cè)的狀態(tài)向量,代入(5)即可求得基于馬爾科夫鏈修正的預(yù)測(cè)值。馬爾科夫鏈修正的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型流程如圖2所示。將所提及的預(yù)測(cè)方法應(yīng)用于某風(fēng)力發(fā)電設(shè)備的供應(yīng)商。選擇該供應(yīng)商在2011年5月至2012年12月某型號(hào)風(fēng)力發(fā)電設(shè)備相關(guān)的備件需求的時(shí)間序列數(shù)據(jù)作為研究對(duì)象。
2實(shí)例驗(yàn)證
2.1BP神經(jīng)網(wǎng)絡(luò)備件需求預(yù)測(cè)在對(duì)樣本試驗(yàn)前,首先將樣本分成獨(dú)立的兩部分訓(xùn)練集和測(cè)試集。其中訓(xùn)練集用來(lái)估計(jì)模型,確定神經(jīng)網(wǎng)絡(luò)的大概層次和節(jié)點(diǎn)數(shù)的大致范圍,以2011年5月至2012年5月的需求數(shù)據(jù)作為分析對(duì)象。測(cè)試集則檢驗(yàn)最終選擇的組合模型的性能,以2012年6月至2012年12月的需求數(shù)據(jù)為驗(yàn)證對(duì)象。BP神經(jīng)網(wǎng)絡(luò)中相關(guān)參數(shù)設(shè)置為:輸入層為5個(gè)結(jié)點(diǎn)、隱含層為1層(包含10個(gè)結(jié)點(diǎn))、輸出層為1個(gè)結(jié)點(diǎn),即表示在滾動(dòng)預(yù)測(cè)中n=5,k=1;最大訓(xùn)練次數(shù)為1000次,最大循環(huán)間隔數(shù)為50次;訓(xùn)練收斂誤差為0.001。經(jīng)計(jì)算,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值見表1。
2.2馬爾科夫鏈修正誤差殘值根據(jù)實(shí)際值與BP網(wǎng)絡(luò)預(yù)測(cè)值之間相對(duì)誤差的大小和分布密度,將其劃分為4個(gè)狀態(tài),見表2。根據(jù)表2可以確定訓(xùn)練樣本相對(duì)誤差所處的狀態(tài),結(jié)果見表2。根據(jù)表1和表2,由式(5)和式(6)可以計(jì)算出一步狀態(tài)轉(zhuǎn)移矩陣為:根據(jù)表1和表2,由式(5)和式(6)可以計(jì)算出一步狀態(tài)轉(zhuǎn)移矩陣為。由表1中各年的狀態(tài)劃分結(jié)果確定對(duì)應(yīng)的狀態(tài)向量,結(jié)合P(1)代入式(5),得基于馬爾科夫鏈修正的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果表3所示。從修正結(jié)果可以看出,馬爾科夫修正BP神經(jīng)網(wǎng)絡(luò)模型可以提高預(yù)測(cè)精度,使得修正值更接近于實(shí)際值。
3結(jié)論
關(guān)鍵詞:Elman神經(jīng)網(wǎng)絡(luò);松散回潮;出口含水率;預(yù)測(cè)
中圖分類號(hào) S572 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1007-7731(2016)08-118-03
1 引言
在卷煙制造過(guò)程中,制葉絲的過(guò)程含水率控制是制絲生產(chǎn)中的關(guān)鍵參數(shù),在烘絲前的含水率控制主要通過(guò)松散回潮工序中加水比例調(diào)節(jié)。不同的加水比例下松散回潮機(jī)的出口片煙含水率不同,最終將導(dǎo)致烘絲入口葉絲含水率的差異。因此,調(diào)節(jié)松散回潮加水比例控制松散回潮出口含水率在制絲過(guò)程中具有重要意義。董偉等[1]采用PID反饋控制修正加水量,曹正良[2]將反饋控制改進(jìn)為前饋控制方式,二者均從控制的角度出發(fā),優(yōu)化控制算法,調(diào)節(jié)加水比例。李秀芳等[3-5]則采用過(guò)程參數(shù)優(yōu)化的方式,通過(guò)過(guò)程參數(shù)優(yōu)化,調(diào)節(jié)加水比例。以上2種方法均對(duì)松散回潮機(jī)出口片煙含水率的調(diào)節(jié)作出了一定優(yōu)化,但2種方法均從內(nèi)部角度考慮,而忽略了環(huán)境溫濕度等外部條件對(duì)出口片煙含水率的影響。
為此,本研究通過(guò)對(duì)歷史生產(chǎn)數(shù)據(jù)的分析,采用基于雙隱含層的Elman神經(jīng)網(wǎng)絡(luò)建立松散回潮機(jī)加水比例預(yù)測(cè)模型,然后再獲取當(dāng)前環(huán)境溫濕度下,通過(guò)大量模擬加水比例輸入,找出相應(yīng)輸出中與設(shè)定出口含水率設(shè)定值最接近的加水比例作為生產(chǎn)過(guò)程參考加水比例,利用該加水比例進(jìn)行生產(chǎn),保障出口片煙含水率與設(shè)定值的誤差得到改善。
2 Elman神經(jīng)網(wǎng)絡(luò)算法
Elman神經(jīng)網(wǎng)絡(luò)是J.L. Elman于1990年首先提出來(lái)一種典型的局部回歸網(wǎng)絡(luò)[6]。Elman網(wǎng)絡(luò)是一個(gè)具有局部記憶單元和局部反饋連接的前向神經(jīng)網(wǎng)絡(luò)。Elman神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,由輸入層、中間層(隱含層)、承接層和輸出層構(gòu)成,其中輸入層、中間層和輸出層和傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)相同,但Elman神經(jīng)網(wǎng)絡(luò)多了一個(gè)承接層,用于保存上次輸入后中間層的狀態(tài)連同輸出數(shù)據(jù)[7-9]。增加承接層后,Elman網(wǎng)絡(luò)比傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)具有更復(fù)雜的動(dòng)力學(xué)特性,因而具有更強(qiáng)的計(jì)算能力,穩(wěn)定性也優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。隱層的傳遞函數(shù)仍為某種非線性函數(shù),一般為Sigmoid函數(shù),輸出層為線性函數(shù),承接層也為線性函數(shù)[10]。
3 基于雙隱含層Elman神經(jīng)網(wǎng)絡(luò)的松散回潮出口含水率控制預(yù)測(cè)模型
3.1 網(wǎng)絡(luò)參數(shù)選擇 以松散回潮加水比例、相應(yīng)環(huán)境溫濕度為輸入,出口煙葉含水率為輸出,設(shè)定訓(xùn)練目標(biāo)0.05,訓(xùn)練速度0.01,最大訓(xùn)練步數(shù)100,以Sigmoid函數(shù)為傳遞函數(shù),進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。對(duì)于Elman神經(jīng)網(wǎng)絡(luò)的神經(jīng)元個(gè)數(shù)及隱含層個(gè)數(shù)的確定,首先通過(guò)對(duì)不同神經(jīng)元個(gè)數(shù)分別進(jìn)行10次運(yùn)行,結(jié)果如表1,選取10次運(yùn)行對(duì)應(yīng)的決定系數(shù)平均值作為評(píng)價(jià)標(biāo)準(zhǔn),從結(jié)果可知選取8個(gè)隱含節(jié)點(diǎn)的測(cè)試集決定系數(shù)平均值最大。再對(duì)不同層數(shù)的隱含層各進(jìn)行10次運(yùn)行,結(jié)果如表2,同樣采用10次運(yùn)行對(duì)應(yīng)的決定系數(shù)平均值作為評(píng)價(jià)標(biāo)準(zhǔn),從結(jié)果可知選取2個(gè)隱含層的測(cè)試集決定系數(shù)平均值最大。
3.2 模型預(yù)測(cè)效果檢驗(yàn) 采用該神經(jīng)網(wǎng)絡(luò)對(duì)松散回潮機(jī)出口煙葉含水率進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖3。由圖3可知,采用該神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)120個(gè)樣本的松散回潮機(jī)出口煙葉含水率預(yù)測(cè)曲線和實(shí)際數(shù)據(jù)曲線吻合度較高。且從誤差數(shù)據(jù)計(jì)算可知,預(yù)測(cè)誤差為0.149%。所有預(yù)測(cè)結(jié)果誤差均控制在0.5%以內(nèi),準(zhǔn)確預(yù)測(cè)(誤差在±0.3%)比例為89.171%,能滿足松散回潮工序出口含水率為(設(shè)定值±0.5)%的允差要求。
3.3 與多元回歸分析擬合模型相比較 圖4為采用多元回歸分析方法建立的松散回潮機(jī)出口片煙含水率線性模型,用于預(yù)測(cè)的效果。預(yù)測(cè)誤差為0.268%,大于本文方法的0.149%,存在個(gè)別預(yù)測(cè)誤差大于0.5%,且準(zhǔn)確預(yù)測(cè)比例為77.5%低于本方法的89.171%。
3.4 松散回潮加水比例預(yù)估方法 建立松散回潮出口含水率預(yù)測(cè)模型后,由于神經(jīng)網(wǎng)絡(luò)模型為非顯性模型,因此可以考慮采用逼近法,不斷嘗試不同加水比例輸入,比較輸出與設(shè)定值的誤差,取滿足要求的加水比例作為加水比例預(yù)測(cè)結(jié)果即可,方法如圖5。
4 結(jié)論
采用基于Elman神經(jīng)網(wǎng)絡(luò)模型建立松散回潮機(jī)出口片煙含水率預(yù)測(cè)模型,該方法建立的預(yù)測(cè)模型預(yù)測(cè)效果優(yōu)于傳統(tǒng)多元回歸分析建立線性模型的預(yù)測(cè)效果。再通過(guò)逼近法給出了當(dāng)前環(huán)境溫濕度下,指定松散回潮機(jī)出口含水率所對(duì)應(yīng)的加水比例預(yù)測(cè)值。采用該方法所確定的松散回潮加水比例生產(chǎn),提高了松散回潮機(jī)片煙出口含水率的控制效果。
參考文獻(xiàn)
[1]董偉,李坤,王健,等.HAUNI松散回潮滾筒含水率控制系統(tǒng)的改進(jìn)[J].煙草科技,2012(11):20-22.
[2]曹正良.片煙松散回潮含水率控制方式的改進(jìn)[C]//2010年中國(guó)煙草學(xué)會(huì)工業(yè)專業(yè)委員會(huì)煙草工藝學(xué)術(shù)研討會(huì)論文集,2010.
[3]李秀芳.煙片松散回潮關(guān)鍵工藝參數(shù)過(guò)程控制系統(tǒng)的優(yōu)化設(shè)計(jì)[J].中國(guó)煙草學(xué)報(bào),2015(3):34-41.
[4]俞仁皓,宋家海,王建,等.松散回潮工序回風(fēng)溫度PID控制參數(shù)的優(yōu)化[J].煙草科技,2010(7):8-10.
[5]趙國(guó)慶,米強(qiáng),鐘青,等.因素篩選試驗(yàn)在松散回潮和篩分加料工序質(zhì)量評(píng)價(jià)中的應(yīng)用[J].煙草科技,2007(11):24-27.
[6]王俊松.基于Elman神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量建模及預(yù)測(cè)[J].計(jì)算機(jī)工程,2009,35(9):190-191.
[7]錢家忠,呂純,趙衛(wèi)東,等.Elman與BP神經(jīng)網(wǎng)絡(luò)在礦井水源判別中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2010,30(1):145-150.
[8]周云龍,陳飛,劉川,等.基于圖像處理和Elman神經(jīng)網(wǎng)絡(luò)的氣液兩相流流型識(shí)別[J].中國(guó)電機(jī)工程學(xué)報(bào),2007,27(29):108-112.
[9]王宏偉,楊先一,金文標(biāo),等.基于Elman網(wǎng)絡(luò)的時(shí)延預(yù)測(cè)及其改進(jìn)[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(6):136-138.
[10]范燕,申?yáng)|日,陳義俊,等.基于改進(jìn)Elman神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)控制[J].河南科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,28(1):41-45.
【關(guān)鍵詞】數(shù)據(jù)挖掘 異常數(shù)據(jù)挖掘 人工智能
1 引言
人工智能用于異常數(shù)據(jù)檢測(cè)的方法很多,傳統(tǒng)的如基于統(tǒng)計(jì)(statistical-based)的方法、基于距離(distance-based)的方法 [1]、基于密度(density-based)的方法[2],基于聚類的方法[3]等。但這么傳統(tǒng)的異常數(shù)據(jù)檢測(cè)方法仍然存在著一些缺陷與不足?;诮y(tǒng)計(jì)的數(shù)據(jù)檢測(cè)方法要求預(yù)先知道被檢測(cè)數(shù)據(jù)的分布情況,基于距離的方法中距離函數(shù)與參數(shù)的選擇存在較大的困難,基于密度的數(shù)據(jù)檢測(cè)方法方法時(shí)間復(fù)雜度較高,這些問(wèn)題極大地限制了異常數(shù)據(jù)挖掘算法在現(xiàn)實(shí)中的應(yīng)用。本文重點(diǎn)論述人工智能方法用于異常數(shù)據(jù)挖掘的發(fā)展史,分析和比較各自的優(yōu)缺點(diǎn)。
2 常用于異常數(shù)據(jù)挖掘的幾種人工智能方法的分析
2.1 神經(jīng)網(wǎng)絡(luò)方法
神經(jīng)網(wǎng)絡(luò)模型主要由三層結(jié)構(gòu)組成,主要包括輸入層、隱含層和輸出層。第一層為輸入層,輸入層的節(jié)點(diǎn)代表多個(gè)預(yù)測(cè)變量,輸出層的節(jié)點(diǎn)代表多個(gè)目標(biāo)變量,位于輸入層和輸出層之間的是隱含層,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度取決于隱含層的層數(shù)和節(jié)點(diǎn)數(shù)。每一層的節(jié)點(diǎn)都允許有多個(gè)。神經(jīng)網(wǎng)絡(luò)模型主要用于解決回歸和分類兩類問(wèn)題,其結(jié)構(gòu)圖如下圖所示。
從上圖可得,節(jié)點(diǎn)X1,X2,X3作為神經(jīng)元的輸入,代表多個(gè)預(yù)測(cè)變量,它可以是來(lái)自神經(jīng)網(wǎng)絡(luò)的信息,也可以是另一個(gè)神經(jīng)元的輸出;W1,W2,……,Wn是神經(jīng)元的權(quán)值,表示各個(gè)神經(jīng)元的連接強(qiáng)度。通過(guò)神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)圖可知,該方法的實(shí)現(xiàn)過(guò)程:首先將每個(gè)訓(xùn)練樣本的各屬性取值同時(shí)賦給第1層即輸入層;各屬性值再結(jié)合各自的權(quán)重賦給第2層(隱含層的第1層),第1層隱含層再結(jié)合各自的權(quán)重輸出又作為下一隱含層的輸入,最后一層的隱含層節(jié)點(diǎn)帶權(quán)輸出賦給輸出層單元,輸出層最終給出各個(gè)訓(xùn)練樣本的預(yù)測(cè)輸出。
2.2 蟻群聚類算法
在數(shù)據(jù)挖掘中,聚類是一個(gè)活躍的研究領(lǐng)域,涉及的范圍較廣。許多計(jì)算機(jī)學(xué)者們通過(guò)模仿生物行為提出一系列解決問(wèn)題的新穎方法。螞蟻搜索模式樣本所歸屬的聚類中心的概率計(jì)算公式如式(1)。
(1)
其中,α,β為參數(shù),初始聚類中心為隨機(jī)選取的k個(gè)模式樣本點(diǎn)。τ(i,j)為樣本Xj到聚類中心mj之問(wèn)的信息素i=1,2, …,n,j=1,2, …,k ;η(i,j)為啟發(fā)函數(shù),其表達(dá)式如式(2)所示。
(2)
其中,dj為模式樣本Xj到聚類中心mj的歐氏距離為(i=1,2, …,n,j=1,2, …,k)。
螞蟻搜索整個(gè)模式樣本空間,形成一個(gè)聚類結(jié)果后,聚類中心mj各分量的值為該類Cj中模式樣本各屬性的均值,計(jì)算公式如(3)。
(3)
2.3 基于知識(shí)粒度的異常數(shù)據(jù)挖掘算法
粒計(jì)算是人工智能領(lǐng)域新發(fā)展起來(lái)的一個(gè)研究方向,該方法針對(duì)不確定性信息進(jìn)行處理。它主要包括三種模型,分別是粗糙集模型、模糊集模型與商空間模型。該方法的基本思想是利用不同粒度上的信息進(jìn)行問(wèn)題求解。該理論在多個(gè)領(lǐng)域得到了廣泛的應(yīng)用,如數(shù)據(jù)挖掘、決策支持與分析和機(jī)器學(xué)習(xí)等。知識(shí)粒度為異常數(shù)據(jù)挖掘處理不確定性數(shù)據(jù)提供一種新的解決方法?;谥R(shí)粒度的異常數(shù)據(jù)挖掘算法,該算法不需要預(yù)先知道數(shù)據(jù)的分布情況,并且采用知識(shí)粒度度量各個(gè)對(duì)象間的距離與異常度時(shí),能有效挖掘出異常數(shù)據(jù)。
3 各方法的比較
通過(guò)以上各種方法的分析,各種方法具有各自的優(yōu)點(diǎn)以及不足之處。基于聚類的數(shù)據(jù)挖掘方法側(cè)重與于聚類的問(wèn)題,該問(wèn)題極大地限制了該算法在實(shí)際生活中的應(yīng)用。神經(jīng)網(wǎng)絡(luò)方法用于數(shù)據(jù)挖掘,是人工智能中較早應(yīng)用于數(shù)據(jù)挖掘領(lǐng)域的方法之一,能夠較好的進(jìn)行異常數(shù)據(jù)的挖掘,但是該方法的層數(shù)的確定比較困難,同時(shí)該方法的時(shí)間復(fù)雜度比較高;蟻群聚類算法是在聚類算法的基礎(chǔ)上改進(jìn)推廣而得,能夠達(dá)到異常數(shù)據(jù)檢測(cè)的目的,但該算法的收斂速度慢,而且算法存在隨機(jī)移動(dòng)而延長(zhǎng)聚類時(shí)間。
4 結(jié)束語(yǔ)
異常數(shù)據(jù)挖掘研究是一個(gè)有價(jià)值的研究問(wèn)題,近年來(lái)引起越來(lái)越多的學(xué)者關(guān)注和研究,從而使得異常數(shù)據(jù)挖掘算法取得了新的進(jìn)展,在生態(tài)系統(tǒng)分析、公共衛(wèi)生、氣象預(yù)報(bào)、金融領(lǐng)域、客戶分類、網(wǎng)絡(luò)入侵檢測(cè)、藥物研究等方面得到了廣泛的應(yīng)用。希望本論文中的方法可以給讀者提供更多異常數(shù)據(jù)挖掘方面的思路,并且能夠很好的將人工智能中的方法運(yùn)用異常數(shù)據(jù)挖掘中,克服各種方法不足,讓人們能夠更好的應(yīng)用。
參考文獻(xiàn)
[1]Knorr E. Alothms for Mining Distance based Outliers in Large Datasets[C] //Very Large Databases(VLDB’98). New York: Proc of Int Conf, 1998: 392-403.
[2]Breunig M M, Kriegel H P. Sander, LOF: Identifying Density-Based Local Outliers[C]// ACM SIGMODC onference Proceedings. [S.I]:[s.n.],2000.
[3]王鑫等.數(shù)據(jù)挖掘中聚類方法比較研材[D].濟(jì)南:山東師范大學(xué)管理學(xué)院,2006.
[4]魏海坤,徐嗣鑫,宋文忠.神經(jīng)網(wǎng)絡(luò)的泛華理論和泛化方法[J].自動(dòng)化學(xué)報(bào), 2001,27(6):806-814.
[5]龐勝利,吳瑰麗.人工神經(jīng)網(wǎng)絡(luò)在大型橋梁健康監(jiān)測(cè)系統(tǒng)中應(yīng)用研究[J].石家莊鐵道學(xué)院學(xué)報(bào),2002,15(2):63-65.
[6]金微. 蟻群聚類算法分析[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2011,(13):199, 202.
[7]陳玉明,吳克壽,孫金華.基于知識(shí)粒度的異常數(shù)據(jù)挖掘算法[J].計(jì)算機(jī)工程與應(yīng)用,2012, 48(4):118-121.
[8]苗奪謙,王國(guó)胤,劉清等.粒計(jì)算:過(guò)去、現(xiàn)在與展望[M].北京:科學(xué)出版社, 2007.
[9]苗奪謙,范世棟.知識(shí)的粒度計(jì)算及其應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2002, 22(1):48-56.
【關(guān)鍵詞】 數(shù)據(jù)挖掘 信用風(fēng)險(xiǎn) 決策樹 支持向量機(jī)
一、引言
我國(guó)上市公司是整個(gè)國(guó)民經(jīng)濟(jì)整體的一個(gè)有機(jī)組成部分,甚至可以說(shuō)是整個(gè)國(guó)民經(jīng)濟(jì)的核心所在。至2008年底,滬深兩市的股票總市值在縮水62.9%的情況下仍達(dá)到12.13萬(wàn)億,占GDP的48.6%。從這些數(shù)據(jù)可以看出,上市公司在我國(guó)經(jīng)濟(jì)中占有主體地位,因此,上市公司的優(yōu)劣存亡將關(guān)系到整個(gè)國(guó)民經(jīng)濟(jì)的發(fā)展。然而,我國(guó)上市公司所積累的信用風(fēng)險(xiǎn)已經(jīng)非常巨大,在深交所的誠(chéng)信檔案里僅主板市場(chǎng)就列出了20頁(yè)的違規(guī)通報(bào)批評(píng)和處分決定。就國(guó)有企業(yè)而言,信用危機(jī)依然存在,突出的表現(xiàn)就是惡意拖欠逃債現(xiàn)象。企業(yè)信用風(fēng)險(xiǎn)狀況直接關(guān)系到我國(guó)金融市場(chǎng)的健康發(fā)展和國(guó)民經(jīng)濟(jì)的持續(xù)穩(wěn)定。可見,對(duì)上市公司信用風(fēng)險(xiǎn)的管理是非常必要和迫在眉睫的,而上市公司信用風(fēng)險(xiǎn)評(píng)估模型的建立是防范信用風(fēng)險(xiǎn)的重要手段。因此,研究上市公司信用風(fēng)險(xiǎn)評(píng)估這一課題,已經(jīng)成為我國(guó)目前經(jīng)濟(jì)生活中亟待解決的一個(gè)重要問(wèn)題。
目前許多定量技術(shù)和支持工具、軟件已付諸商業(yè)應(yīng)用,繼傳統(tǒng)的比例分析之后,統(tǒng)計(jì)方法得到了廣泛的應(yīng)用,如判別分析和Logistic回歸等。信用等級(jí)評(píng)估是通過(guò)對(duì)企業(yè)或個(gè)人的某些單一財(cái)務(wù)指標(biāo)進(jìn)行加權(quán)平均確定的,該方法最大的缺陷在于指標(biāo)和加權(quán)值的確定帶有很大的主觀性,使得評(píng)估結(jié)果和實(shí)際狀況有很大的出入。因此,需要引入科學(xué)方法來(lái)確定有效評(píng)估指標(biāo),并建立準(zhǔn)確的定量模型來(lái)解決信用等級(jí)評(píng)估的問(wèn)題。近年來(lái),信息技術(shù)得到了迅速發(fā)展,如數(shù)據(jù)挖掘技術(shù)等能從海量數(shù)據(jù)中智能發(fā)現(xiàn)有用的規(guī)則和知識(shí),再加上我國(guó)上市公司信息披露制度的不斷完善,使得我們的研究能夠得到的數(shù)據(jù)資料也不斷的增多,這些有利條件的出現(xiàn)使得我們對(duì)基于數(shù)據(jù)挖掘的上市公司信用風(fēng)險(xiǎn)評(píng)估模型的研究有了數(shù)據(jù)基礎(chǔ)和技術(shù)基礎(chǔ)。
二、基于數(shù)據(jù)挖掘的信用風(fēng)險(xiǎn)評(píng)估模型比較綜述
1、決策樹
決策樹方法于20世紀(jì)60年代起源于對(duì)概念學(xué)習(xí)建模;20世紀(jì)70年代后期Quinlan發(fā)明用信息增益作為啟發(fā)策略的ID3算法,從樣本中學(xué)習(xí)構(gòu)造專家系統(tǒng);1993年Quinlan在ID3算法基礎(chǔ)上研究出了改進(jìn)的決策樹歸納包(C4.5),這是目前被普遍采用的數(shù)據(jù)分類方法。其思想是一個(gè)類似于流程圖的樹結(jié)構(gòu),其中每個(gè)內(nèi)部結(jié)點(diǎn)表示在一個(gè)屬性熵的測(cè)試,每個(gè)分支代表一個(gè)測(cè)試輸出,而每個(gè)樹葉節(jié)點(diǎn)代表類或類分布。決策樹通過(guò)把實(shí)例從根節(jié)點(diǎn)排列到某個(gè)葉子節(jié)點(diǎn)來(lái)分類實(shí)例,葉子節(jié)點(diǎn)即為實(shí)例所屬的分類,樹上每個(gè)節(jié)點(diǎn)說(shuō)明了對(duì)實(shí)例的某個(gè)屬性的測(cè)試,節(jié)點(diǎn)的每個(gè)后繼分支對(duì)應(yīng)于該屬性的一個(gè)可能值。決策樹分類模型之所以被廣泛應(yīng)用于信用風(fēng)險(xiǎn)評(píng)估,主要是因?yàn)闆Q策樹具有以下優(yōu)點(diǎn):(1)與神經(jīng)網(wǎng)絡(luò)或貝葉斯分類等其他分類模型相比,決策樹的分類原理簡(jiǎn)單易懂,很容易被使用人員理解和接受。在決策樹分類過(guò)程中,一般不需要人為設(shè)定參數(shù),更適合于知識(shí)發(fā)現(xiàn)的要求;(2)決策樹的學(xué)習(xí)算法具有建立速度快、計(jì)算量相對(duì)不是很大、可以處理連續(xù)值和離散值屬性;(3)決策樹能使用信息原理對(duì)大量樣本的屬性進(jìn)行信息量分析,計(jì)算各屬性的信息量,找出反映類別的重要屬性(可以清晰的顯示哪些屬性對(duì)分類比較重要);(4)決策樹分類方法與其他分類模型相比,易于生成可理解的規(guī)則。決策樹方法對(duì)記錄數(shù)越大的數(shù)據(jù)庫(kù),它的效果越明顯,這就是它顯著的優(yōu)點(diǎn)。
研究表明,一般情況下,樹越小則樹的預(yù)測(cè)能力越強(qiáng)。要構(gòu)造盡可能小的決策樹,關(guān)鍵在于選擇恰當(dāng)屬性。而屬性選擇依賴于各種對(duì)例子子集的不純度度量方法。其中,基于數(shù)據(jù)挖掘中決策樹C4.5算法的分析框架建立的上市公司信用風(fēng)險(xiǎn)評(píng)估模型,對(duì)數(shù)據(jù)分布無(wú)任何要求,應(yīng)用于上市公司信用風(fēng)險(xiǎn)評(píng)估的效果比較好,因此具有良好的發(fā)展前景,值得我們深入研究。
2、神經(jīng)網(wǎng)絡(luò)
BP網(wǎng)是面向映射變換的神經(jīng)網(wǎng)絡(luò)中應(yīng)用最廣泛的一種,其結(jié)構(gòu)如圖1所示。典型的BP網(wǎng)有三個(gè)層次:輸入層、隱含層和輸出層,相鄰層次神經(jīng)元間采用全互連形式,同層神經(jīng)元間則不相連。其思路是:當(dāng)給網(wǎng)絡(luò)提供一個(gè)輸入模式時(shí),該模式由輸入層傳到隱含,經(jīng)隱含層神經(jīng)元作用函數(shù)處理后傳送到輸出層,再經(jīng)由輸出層神經(jīng)元作用函數(shù)處理后產(chǎn)生一個(gè)輸出模式。如果輸出模式與期望的輸出模式有誤差,就從輸出層反向?qū)⒄`差逐層傳送到輸入層,把誤差“分?jǐn)偂苯o各神經(jīng)元并修改連接權(quán),使網(wǎng)絡(luò)實(shí)現(xiàn)從輸入模式到輸出模式的正確映射。對(duì)于一組訓(xùn)練模式,可以逐個(gè)用訓(xùn)練模式作為輸入,反復(fù)進(jìn)行誤差檢測(cè)和反向傳播過(guò)程,直到不出現(xiàn)誤差為止。這時(shí),BP網(wǎng)完成了學(xué)習(xí)階段,具備所需的模式分類(識(shí)別)能力。
20世紀(jì)80年代末,西方發(fā)達(dá)國(guó)家將人工智能引入銀行業(yè),協(xié)助銀行進(jìn)行貸款決策,這其中,尤其以人工神經(jīng)網(wǎng)絡(luò)最為突出,其在企業(yè)財(cái)務(wù)分析中顯示了巨大的優(yōu)勢(shì)和潛力。而在我國(guó),無(wú)論是用統(tǒng)計(jì)方法還是用神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)研究信用風(fēng)險(xiǎn),目前都尚處于起步階段。王春峰等(1999)用神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估;郝麗萍等(2001)研究了商業(yè)銀行信貸風(fēng)險(xiǎn)分析的人工神經(jīng)網(wǎng)絡(luò)模型;柳炳祥、盛昭翰(2003)利用粗神經(jīng)網(wǎng)絡(luò)對(duì)企業(yè)財(cái)務(wù)危機(jī)進(jìn)行了分析;龐素琳等(2003)利用BP算法對(duì)我國(guó)某商業(yè)銀行2001年120家貸款企業(yè)進(jìn)行3類模式(“信用好”、“信用一般”、“信用差”)分類,分類準(zhǔn)確率達(dá)到83.34%;張德棟、張強(qiáng)(2004)建立了基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)信用3層神經(jīng)網(wǎng)絡(luò)評(píng)估模型,實(shí)驗(yàn)結(jié)果證明,該模型用于企業(yè)信用評(píng)估,減少了企業(yè)信用評(píng)估傳統(tǒng)的定性方法中權(quán)重確定的人為因素,評(píng)估正確率達(dá)到了92.12%;王凱、黃世祥(2007)建立起基于BP神經(jīng)網(wǎng)絡(luò)的行業(yè)間信用評(píng)估模型,并代入2003年度全國(guó)農(nóng)業(yè)和工業(yè)的部分行業(yè)數(shù)據(jù)進(jìn)行實(shí)證。
神經(jīng)網(wǎng)絡(luò)由于其自身優(yōu)勢(shì)已經(jīng)在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用,近幾年來(lái),經(jīng)濟(jì)學(xué)和管理學(xué)方面的學(xué)者將其運(yùn)用到經(jīng)濟(jì)領(lǐng)域,特別是在信用風(fēng)險(xiǎn)評(píng)估方面取得了很好的成效。尤其BP神經(jīng)網(wǎng)絡(luò)在商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估上應(yīng)用的可行性,其優(yōu)點(diǎn)主要體現(xiàn)在:(1)BP神經(jīng)網(wǎng)絡(luò)模型具有高速信息處理能力。信用風(fēng)險(xiǎn)評(píng)價(jià)是一個(gè)非常復(fù)雜的系統(tǒng),簡(jiǎn)單的信用風(fēng)險(xiǎn)打分模型不能很好地表述這種關(guān)系,同時(shí)結(jié)果與實(shí)際也有較大的差別。而神經(jīng)網(wǎng)絡(luò)是由大量的神經(jīng)元廣泛互連而成的系統(tǒng),并行處理能力很強(qiáng),得到的模型能對(duì)實(shí)際作出很好的預(yù)測(cè)。(2)BP神經(jīng)網(wǎng)絡(luò)模型具有很強(qiáng)的不確定性信息處理能力。由于神經(jīng)網(wǎng)絡(luò)中神經(jīng)元個(gè)數(shù)眾多以及整個(gè)網(wǎng)絡(luò)存儲(chǔ)信息容量巨大,使得它具有很強(qiáng)的對(duì)不確定性信息的處理能力。而信用風(fēng)險(xiǎn)本身就有一種不確定性,信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系涉及指標(biāo)眾多,這些變量本身就具有一種動(dòng)態(tài)性和不穩(wěn)定性。運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)可以很好地解決這種不確定性。(3)BP神經(jīng)網(wǎng)絡(luò)模型是一個(gè)具有高度非線性的系統(tǒng)。神經(jīng)網(wǎng)絡(luò)同現(xiàn)行的計(jì)算機(jī)不同,它是一種非線性的處理單元,因此神經(jīng)網(wǎng)絡(luò)是一種具有高度非線性的系統(tǒng)。在信用風(fēng)險(xiǎn)評(píng)估運(yùn)用上,它突破了傳統(tǒng)信用風(fēng)險(xiǎn)評(píng)估方法以線性處理為基礎(chǔ)的局限性,能更有效、更精確地處理復(fù)雜信息。但是,神經(jīng)網(wǎng)絡(luò)也存在明顯的不足。首先,當(dāng)神經(jīng)網(wǎng)絡(luò)的輸入維數(shù)高時(shí),隱含規(guī)則呈幾何級(jí)數(shù)增加,致使網(wǎng)絡(luò)結(jié)構(gòu)龐大,同時(shí)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率固定,存在局部最小點(diǎn)問(wèn)題,因此網(wǎng)絡(luò)收斂速度慢,需要很長(zhǎng)的訓(xùn)練時(shí)間,甚至可能發(fā)生網(wǎng)絡(luò)癱瘓;其次,網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,導(dǎo)致網(wǎng)絡(luò)的輸入節(jié)點(diǎn)單元數(shù)、隱含層數(shù)的確定缺乏理論依據(jù)。盡管存在一些遺憾,神經(jīng)網(wǎng)絡(luò)方法作為一門嶄新的信息處理科學(xué)方法仍然吸引著眾多領(lǐng)域的研究者。
3、支持向量機(jī)
支持向量機(jī)(Support Vector Machine,SVM)是根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論得出的一種新的機(jī)器學(xué)習(xí)算法,它用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則替代經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,較好地解決了小樣本學(xué)習(xí)問(wèn)題,是一種通用的前饋網(wǎng)絡(luò)類型。支持向量機(jī)的實(shí)現(xiàn)是通過(guò)某種事先選擇的非線性映射(核函數(shù))將輸入向量映射到一個(gè)高維特征空間,在這個(gè)空間中構(gòu)造最優(yōu)分類超平面。使用SVM進(jìn)行數(shù)據(jù)集分類工作的過(guò)程首先是通過(guò)預(yù)先選定的一些非線性映射將輸入空間映射到高維特征空間,它使得在高維屬性空間中有可能對(duì)訓(xùn)練數(shù)據(jù)實(shí)現(xiàn)超平面的分割,避免了在原輸入空間中進(jìn)行非線性曲面分割計(jì)算。SVM數(shù)據(jù)集形成的分類函數(shù)具有這樣的性質(zhì):它是一組以支持向量為參數(shù)的非線性函數(shù)的線性組合,因此分類函數(shù)的表達(dá)式僅和支持向量的數(shù)量有關(guān),而獨(dú)立于空間的維度。
隨著機(jī)器學(xué)習(xí)理論的不斷發(fā)展,支持向量機(jī)作為一種專門針對(duì)小樣本學(xué)習(xí)的算法被引入到了信用風(fēng)險(xiǎn)評(píng)估中。在我國(guó),張秋水、羅林開等(2006)通過(guò)SVM與傳統(tǒng)的多元線性回歸(Multi Linear Regression,MLR)和Logit分析(Logit Analysis,LA)的實(shí)證對(duì)比和模型分析,得出SVM在20組測(cè)試樣本集上的平均誤判率是最低的,顯著優(yōu)于MLR,也優(yōu)于LA。吳沖等(2009)建立了基于模糊積分的支持向量機(jī)集成方法,該方法綜合考慮了子支持向量機(jī)的輸出重要性并與單個(gè)支持向量機(jī)和最多投票原則的支持向量機(jī)集成進(jìn)行比較,實(shí)證結(jié)果表明,該方法具有更高的分類精度。與BP神經(jīng)網(wǎng)絡(luò)相比,SVM方法的優(yōu)缺點(diǎn)是:(1)模型的準(zhǔn)確率。SVM是通過(guò)解一個(gè)凸二次規(guī)劃來(lái)得出結(jié)果的,因此找到的解是全局最優(yōu)解,且精度高,利用支持向量機(jī)進(jìn)行上市公司信用風(fēng)險(xiǎn)評(píng)估,根據(jù)有限的訓(xùn)練樣本,建立了非線性映射關(guān)系,解決了維數(shù)問(wèn)題,這種算法具有簡(jiǎn)單、準(zhǔn)確率高的優(yōu)點(diǎn),很適合推廣。(2)泛化能力。SVM通過(guò)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則實(shí)現(xiàn)了經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的良好折衷,避免了過(guò)擬合現(xiàn)象,而人工神經(jīng)網(wǎng)絡(luò)是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原理。(3)模型的適用性。SVM方法通過(guò)對(duì)不同的核函數(shù)和參數(shù)的選擇,可以優(yōu)化評(píng)估結(jié)果,不同的核函數(shù)可以滿足不同的需求,模型的適用范圍更廣。(4)對(duì)數(shù)據(jù)要求。SVM可以避免小樣本和“維數(shù)災(zāi)難”問(wèn)題,對(duì)有限數(shù)量和維數(shù)較高的樣本評(píng)估精度較高;而BP神經(jīng)網(wǎng)絡(luò)模型由于數(shù)據(jù)較少,易產(chǎn)生過(guò)擬合現(xiàn)象,因而使用范圍受限制。(5)核函數(shù)也需要人為的確定,尚未有理論證明決定應(yīng)選擇的核函數(shù)。
三、結(jié)束語(yǔ)
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘方法被廣泛應(yīng)用于金融、經(jīng)濟(jì)領(lǐng)域,在信用風(fēng)險(xiǎn)方面也受到越來(lái)越多的重視。在我國(guó),對(duì)上市企業(yè)的信用風(fēng)險(xiǎn)評(píng)估還是一個(gè)很具有挑戰(zhàn)性的領(lǐng)域,不僅體現(xiàn)在其信用風(fēng)險(xiǎn)變化的復(fù)雜性,還在于評(píng)估所面臨的巨大工作量。上市企業(yè)的信用狀況是構(gòu)成整個(gè)社會(huì)體系不可缺少的重要部分,因此,解決其信用風(fēng)險(xiǎn)評(píng)估問(wèn)題的首要任務(wù)是要建立簡(jiǎn)單可操作的模型,并充分發(fā)揮計(jì)算機(jī)處理信息等的優(yōu)勢(shì)作用。
(注:本文系華東交通大學(xué)校立科研基金資助課題《基于數(shù)據(jù)挖掘的上市公司信用風(fēng)險(xiǎn)評(píng)估模型研究》的部分研究成果,課題編號(hào):09GD02。)
【參考文獻(xiàn)】
[1] Qualian JR,C4.5: Programs for Machine Learning [J],San Mateo, CA:Morgan Kaufmann Publishers,1993.
[2] Virongrong Tesprasit,Paisarn Charoenpornsawat ,Virach Sornlertlamvanich,A Context-Sensitive Homograph Disambiguation in Thai Text-to-Speech Synthesis,Proceedings ofHuman Language Technology Conference,2003.
[3] 周松林、吳銘:滬深兩市總市值全年縮水62.9%[J].金融界,2009(1).
[4] 王春峰、萬(wàn)海暉、張維:基于神經(jīng)網(wǎng)絡(luò)技術(shù)的商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估[J].系統(tǒng)工程理論與實(shí)踐,1999(9).
[5] 郝麗萍、胡欣悅、李麗:商業(yè)銀行信貸風(fēng)險(xiǎn)分析的人工神經(jīng)網(wǎng)絡(luò)模型研究[J].系統(tǒng)工程理論與實(shí)踐,2001(5).
[6] 柳炳祥、盛昭翰:基于粗神經(jīng)網(wǎng)絡(luò)的企業(yè)危機(jī)預(yù)警系統(tǒng)設(shè)計(jì)[J].信息與控制,2003(1).
[7] 龐素琳、王燕鳴、黎榮舟:基于BP算法的信用風(fēng)險(xiǎn)評(píng)價(jià)模型研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2003(8).
[8] 張德棟、張強(qiáng),基于神經(jīng)網(wǎng)絡(luò)的企業(yè)信用評(píng)估模型[J].北京理工大學(xué)學(xué)報(bào),2004(11).
[9] 王凱、黃世祥:基于BP神經(jīng)網(wǎng)絡(luò)的行業(yè)間中小企業(yè)信用評(píng)估模型及應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2007(24).
關(guān)鍵詞 基本藥物 采購(gòu)行為 BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):F713.54 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-1533(2013)05-0047-05
2009年國(guó)家基本藥物制度實(shí)施后,國(guó)家將執(zhí)行基本藥物集中采購(gòu)作為實(shí)施基本藥物制度的評(píng)價(jià)標(biāo)準(zhǔn)之一,于是各省將原有的藥品集中采購(gòu)分為基本藥物和非基本藥物兩類。2010年11月,國(guó)務(wù)院《建立和規(guī)范政府辦基層醫(yī)療衛(wèi)生機(jī)構(gòu)基本藥物采購(gòu)機(jī)制的指導(dǎo)意見》,旨在對(duì)現(xiàn)階段較為無(wú)序的藥品采購(gòu)行為進(jìn)行規(guī)范,推行科學(xué)合理的采購(gòu)模式,對(duì)基本藥物采購(gòu)方面的研究開始得到關(guān)注。
現(xiàn)行采購(gòu)模式是省集中采購(gòu)平臺(tái)通過(guò)統(tǒng)計(jì)各基層醫(yī)院上報(bào)的用藥需求之后,再統(tǒng)籌面向中標(biāo)企業(yè)進(jìn)行集中采購(gòu)。但是,作為基本藥物集中招標(biāo)采購(gòu)體系中繼招標(biāo)過(guò)程之后的重要環(huán)節(jié),采購(gòu)過(guò)程并未得到足夠的重視,基于基本藥物采購(gòu)行為的微觀研究的理論和文獻(xiàn)更是少之又少。在缺乏科學(xué)理論和方法支持下的采購(gòu)決策,容易受主觀如采購(gòu)主體尋租以及客觀如廠商合謀等因素干擾而不穩(wěn)定,這種不穩(wěn)定帶來(lái)的滯后效應(yīng)會(huì)掣肘社區(qū)衛(wèi)生服務(wù)中心對(duì)基本藥物的需求預(yù)測(cè),繼而帶來(lái)后續(xù)基本藥物的供需矛盾。除此之外,采購(gòu)量錯(cuò)誤統(tǒng)計(jì)或填寫不夠準(zhǔn)確的偶然誤差將會(huì)進(jìn)一步加劇這個(gè)矛盾。基本藥物集中招標(biāo)采購(gòu)體系下的基本藥物采購(gòu)在執(zhí)行過(guò)程中有必要加強(qiáng)監(jiān)督管理和調(diào)控。因此,尋找合理與靈活的理論和方法來(lái)保證基本藥物的采購(gòu)決策行為的穩(wěn)定性就成為關(guān)注點(diǎn)。
由于BP (Back Propagation)神經(jīng)網(wǎng)絡(luò)模型尚未在基本藥物招標(biāo)采購(gòu)體系中進(jìn)行相關(guān)的理論研究和應(yīng)用探索,未能發(fā)揮其在其他領(lǐng)域中發(fā)揮出的功效。本文針對(duì)這一環(huán)節(jié)進(jìn)行探索,擬在建立BP 神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,統(tǒng)計(jì)分析社區(qū)衛(wèi)生服務(wù)機(jī)構(gòu)的藥品使用等特征后,將BP神經(jīng)網(wǎng)絡(luò)模型運(yùn)用到社區(qū)醫(yī)療機(jī)構(gòu)的需求預(yù)測(cè)中來(lái),使采購(gòu)主體在決策時(shí)能有更多的支持信息,實(shí)現(xiàn)采購(gòu)數(shù)量科學(xué)化,從而保證社區(qū)醫(yī)療機(jī)構(gòu)對(duì)基本藥物的供應(yīng)充足,以期從這一環(huán)節(jié)上減輕民眾對(duì)基本藥物的獲取負(fù)擔(dān),使整個(gè)基本藥物的供應(yīng)實(shí)現(xiàn)資源優(yōu)化配置,也可為基本藥物集中采購(gòu)的理論和方法提供借鑒和參考。
1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)功能的研究
由于人工神經(jīng)網(wǎng)絡(luò)是非線性、非局域性和非定常性的復(fù)雜網(wǎng)絡(luò)系統(tǒng),具有并行分布的信息處理結(jié)構(gòu)和自適應(yīng)的腦模式的信息處理的本質(zhì)與能力,它可以通過(guò)“自學(xué)習(xí)”或“訓(xùn)練”掌握大量的知識(shí),完成特定的工作。人工神經(jīng)網(wǎng)絡(luò)對(duì)建立預(yù)測(cè)模型十分有效,它能從數(shù)據(jù)樣本中自動(dòng)學(xué)習(xí)以前的經(jīng)驗(yàn)而無(wú)需復(fù)雜的查詢和表述過(guò)程,并自動(dòng)地逼近那些最佳的數(shù)據(jù)蘊(yùn)含的規(guī)律,它在時(shí)間序列預(yù)測(cè)方面,尤其是高復(fù)雜度的非線性時(shí)間序列方面明顯優(yōu)于傳統(tǒng)的預(yù)測(cè)方法。在預(yù)測(cè)方面,目前應(yīng)用最廣泛且較為成功的是前向神經(jīng)網(wǎng)絡(luò)。
1.1 BP神經(jīng)網(wǎng)絡(luò)基本理論
BP神經(jīng)網(wǎng)絡(luò)也稱誤差反向傳播神經(jīng)網(wǎng)絡(luò),為有監(jiān)督的學(xué)習(xí),是梯度下降法在多層前饋網(wǎng)絡(luò)中的應(yīng)用。它有一個(gè)輸入層、一個(gè)輸出層、一個(gè)或多個(gè)隱含層。每一層上包含若干個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表一個(gè)神經(jīng)元。同一層上的各節(jié)點(diǎn)之間無(wú)連接關(guān)系,相鄰層采取全互連。信息從輸入層開始在各層之間單向傳播,依次經(jīng)過(guò)各隱含層,最后到達(dá)輸出層。
BP算法的學(xué)習(xí)過(guò)程是一個(gè)反復(fù)迭代的過(guò)程,由正向傳播和反向傳播組成。其算法的基本思想是根據(jù)網(wǎng)絡(luò)輸出層的誤差,從輸出層開始反過(guò)來(lái)調(diào)整網(wǎng)絡(luò)的權(quán)值和閥值,最后使得輸出的均方誤差最小。經(jīng)過(guò)對(duì)一定數(shù)量樣本進(jìn)行反饋學(xué)習(xí)后,網(wǎng)絡(luò)所持的權(quán)值便是網(wǎng)絡(luò)通過(guò)自適應(yīng)學(xué)習(xí)得到的正確的內(nèi)部表示。這時(shí)將待識(shí)別樣本的特征數(shù)據(jù)輸入訓(xùn)練好的網(wǎng)絡(luò),則網(wǎng)絡(luò)就可以對(duì)樣本的屬性進(jìn)行自動(dòng)推理和識(shí)別。在非線性建模方法中,神經(jīng)網(wǎng)絡(luò)理論證明了在選擇適當(dāng)?shù)碾[層數(shù)及相應(yīng)的神經(jīng)元數(shù)目下,前饋神經(jīng)網(wǎng)絡(luò)能以任意精度逼近任意非線性函數(shù)[1]。
1.2 BP神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)領(lǐng)域的實(shí)現(xiàn)
由于BP學(xué)習(xí)算法本質(zhì)上是一個(gè)非線性優(yōu)化問(wèn)題,網(wǎng)絡(luò)模型的確立分為兩個(gè)階段:學(xué)習(xí)階段和檢驗(yàn)階段。學(xué)習(xí)階段是通過(guò)對(duì)歷史資料的學(xué)習(xí),使己有的模式以權(quán)系數(shù)的方式存儲(chǔ)于網(wǎng)絡(luò)之中,這實(shí)質(zhì)上是一個(gè)擬合的過(guò)程;檢驗(yàn)階段是將已有歷史數(shù)據(jù)輸入網(wǎng)絡(luò)之中,檢驗(yàn)網(wǎng)絡(luò)輸出與實(shí)測(cè)值的誤差是否達(dá)到一定的精度要求,如果滿足要求,則BP網(wǎng)絡(luò)可以被用于預(yù)測(cè)。采用BP網(wǎng)絡(luò)學(xué)習(xí)方法進(jìn)行模擬分析,構(gòu)造BP網(wǎng)絡(luò)的基本步驟是:
1) 確定BP網(wǎng)絡(luò)的輸入向量、輸出向量的維數(shù)和隱含層數(shù)及節(jié)點(diǎn)數(shù);
2) 確定隱含層傳遞函數(shù)和輸出層傳遞函數(shù)關(guān)系;
3) 將網(wǎng)絡(luò)學(xué)習(xí)樣本劃分為學(xué)習(xí)段和檢驗(yàn)段;
4) 訓(xùn)練網(wǎng)絡(luò),擬合學(xué)習(xí)段時(shí)間序列,使其誤差平方和達(dá)到最?。?/p>
5) 用檢驗(yàn)段數(shù)據(jù)檢驗(yàn)訓(xùn)練好的網(wǎng)絡(luò)模型,利用該模型對(duì)未來(lái)進(jìn)行預(yù)測(cè)。
1.3 BP神經(jīng)網(wǎng)絡(luò)在醫(yī)藥行業(yè)的應(yīng)用
BP神經(jīng)網(wǎng)絡(luò)在醫(yī)藥行業(yè)的應(yīng)用包括藥品采購(gòu)資金管理、醫(yī)療器材需求和藥品銷售預(yù)測(cè)3個(gè)方面。據(jù)文獻(xiàn)報(bào)道[2-3],出于降低庫(kù)存,提高管理有效性和運(yùn)作靈活性的目的,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對(duì)研究對(duì)象的歷史數(shù)據(jù)進(jìn)行分析,得出預(yù)測(cè)值,并與經(jīng)驗(yàn)性的實(shí)際值進(jìn)行對(duì)比,發(fā)現(xiàn)基于BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),可以有效節(jié)約采購(gòu)和生產(chǎn)安排的不穩(wěn)定性,降低庫(kù)存,從而節(jié)約成本,提高效益。
2 BP神經(jīng)網(wǎng)絡(luò)在湖北省基本藥物采購(gòu)量預(yù)測(cè)中的應(yīng)用
2011年3月13日,湖北省政府辦公廳印發(fā)《湖北省基層醫(yī)療衛(wèi)生機(jī)構(gòu)基本藥物集中采購(gòu)管理辦法(試行)》,標(biāo)志著該省建立和規(guī)范基本藥物統(tǒng)一招標(biāo)采購(gòu)新機(jī)制的出臺(tái)[4]。在該辦法中,實(shí)行以省為單位集中采購(gòu)、統(tǒng)一配送,與藥品生產(chǎn)企業(yè)簽訂購(gòu)銷合同,一次完成采購(gòu)全過(guò)程,最大限度地降低采購(gòu)成本,促進(jìn)基本藥物生產(chǎn)和供應(yīng)。
2.1 湖北省基本藥物采購(gòu)量預(yù)測(cè)模型的建立
2.1.1 研究對(duì)象及數(shù)據(jù)準(zhǔn)備
湖北省每月采購(gòu)的基本藥物品種有1 000種之多,從理論上來(lái)說(shuō),為了更好地估計(jì)湖北省的基本藥物采購(gòu)量的預(yù)測(cè)值,需要將每種藥物根據(jù)其歷史采購(gòu)量來(lái)建立預(yù)測(cè)模型,如此一來(lái)會(huì)帶來(lái)巨大的工作量。因此,應(yīng)選擇使用頻率比較高、采購(gòu)比較頻繁、使用特點(diǎn)具有相似性的一大類藥物品種來(lái)進(jìn)行研究。綜合對(duì)湖北省每月采購(gòu)?fù)▓?bào)的分析,選定藥物大類為抗生素類。樣本納入標(biāo)準(zhǔn)為統(tǒng)計(jì)期內(nèi)的采購(gòu)時(shí)間是連續(xù)的,并且屬于同一大類的不同規(guī)格。
本文建模對(duì)象及數(shù)據(jù)見表1。
2.1.2 基本藥物采購(gòu)量神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的實(shí)現(xiàn)
在進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)之前,為避免原始數(shù)據(jù)過(guò)大造成網(wǎng)絡(luò)麻痹,要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,對(duì)于預(yù)測(cè)值,由于變化幅度較大,也不宜直接作為神經(jīng)網(wǎng)絡(luò)的輸出。對(duì)于單極型Sigmoid函數(shù)來(lái)說(shuō),應(yīng)用如下歸一化處理公式對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理:
2.2 實(shí)證檢驗(yàn)
湖北省基本藥物采購(gòu)量神經(jīng)網(wǎng)絡(luò)模型就是利用神經(jīng)網(wǎng)絡(luò)的非線性特性去逼近一個(gè)時(shí)間序列或一個(gè)時(shí)間序列的變形,通過(guò)神經(jīng)網(wǎng)絡(luò)清晰的邏輯關(guān)系,利用過(guò)去時(shí)刻的值去表達(dá)未來(lái)時(shí)刻的值。本文以湖北省部分基本藥物品種采購(gòu)量為數(shù)據(jù),以月度基本藥物采購(gòu)量為預(yù)測(cè)目標(biāo),用上述的建模方法建立月度基本藥物采購(gòu)量預(yù)測(cè)模型。
第一步,建立預(yù)測(cè)模型,對(duì)歸一化的數(shù)據(jù)用MATLAB中提供的函數(shù)進(jìn)行學(xué)習(xí)(圖1),學(xué)習(xí)程序如下:
net=newff(minmax(P), [8 1], {'tansig', 'purelin'}, 'traingdx', 'learngdm');
net.trainparam.epochs=10 000;
net.trainparam.goal=0.005;
net.trainparam.show=500;
[net, tr]=train(net, P, T);
首先,我們?cè)O(shè)定的隱層節(jié)點(diǎn)數(shù)為8,目標(biāo)誤差為0.005,學(xué)習(xí)率設(shè)置為0.01,網(wǎng)絡(luò)經(jīng)過(guò)222次迭代之后達(dá)到了指定精度,誤差為0.004 966 8。再分別設(shè)定隱層節(jié)點(diǎn)數(shù)為:6,8,12,15,20;目標(biāo)誤差不變,仍為0.005,學(xué)習(xí)結(jié)果如表2所示。
結(jié)合學(xué)習(xí)次數(shù)和誤差的比較,可以得出在隱層節(jié)點(diǎn)數(shù)設(shè)為15時(shí),學(xué)習(xí)效果較好。
由17個(gè)月樣本藥品的采購(gòu)量數(shù)據(jù)P為訓(xùn)練值,以第17個(gè)月的采購(gòu)量為目標(biāo)值,進(jìn)行訓(xùn)練。由于2012年12月的采購(gòu)量未知,如果要預(yù)測(cè)第18個(gè)月采購(gòu)量則無(wú)法用實(shí)際的數(shù)據(jù)進(jìn)行檢驗(yàn)。因此在預(yù)測(cè)值調(diào)整為第17個(gè)月的采購(gòu)量數(shù)據(jù)。測(cè)試程序如下:B=sim(net, T)。
誤差為[0.024 9, -0.118 5, -0.170 7, -0.242 2, -0.040 5, 0.143 9, -0.047 5, 0.078 3, -0.066 6, -0.057 3, -0.036 6, 0.003 2, -0.043 6, -0.009 9, 0.020 5, -0.031 0, -0.016 8, 0.057 3, -0.025 1, 0.018 0, 0.036 4, -0.218 0, -0.159 0, -0.112 9, -0.014 81, -0.120 8, 0.134 9, -0.043 6]。誤差均在可接受的范圍內(nèi),認(rèn)可數(shù)據(jù)已得到很好的訓(xùn)練,具備較好的仿真能力。
學(xué)習(xí)的誤差基本上在我們可以接受的范圍內(nèi),其學(xué)習(xí)效果如圖2所示。通過(guò)前面己經(jīng)驗(yàn)證,該網(wǎng)絡(luò)的學(xué)習(xí)能力以及預(yù)測(cè)能力有很大的優(yōu)越性。
2.3 預(yù)測(cè)結(jié)果分析
通過(guò)反歸一化公式:得到第17個(gè)月即2012年11月各藥品的采購(gòu)值。將2012年11月的實(shí)際采購(gòu)量與實(shí)證檢驗(yàn)建立模型后所得到的預(yù)測(cè)中結(jié)果進(jìn)行比較,結(jié)果見表3。
從表3中我們可以看出,除了個(gè)別品種誤差較大以外,如注射用苯唑西林鈉為530.21%、硫酸奈替米星注射液為52.60%,阿莫西林膠囊為42.89%,BP神經(jīng)網(wǎng)絡(luò)模型對(duì)基本藥物的采購(gòu)量的預(yù)測(cè)誤差率大多數(shù)在10%以下,經(jīng)Excel數(shù)據(jù)分析工具中成對(duì)雙樣本均值t檢驗(yàn)分析,結(jié)果見表4。
因?yàn)镻 > 0.05,故預(yù)測(cè)值與實(shí)際值均值差異無(wú)統(tǒng)計(jì)學(xué)意義。
模型預(yù)測(cè)結(jié)果是比較令人滿意的。由于在本次研究中藥品采購(gòu)量的變化是在時(shí)間序列上面進(jìn)行的,所采取的預(yù)測(cè)方法是單步預(yù)測(cè),每月的藥物采購(gòu)量還要受很多因素影響,不可能做到預(yù)測(cè)結(jié)果與實(shí)際的數(shù)據(jù)完全一致。除此之外,基本藥物制度實(shí)施的時(shí)間并不長(zhǎng),在湖北省基本藥物集中采購(gòu)平臺(tái)上所獲取采購(gòu)量的數(shù)據(jù)時(shí)間范圍也不長(zhǎng),所以個(gè)別藥品誤差的較大偏倚也在預(yù)料之中。
根據(jù)計(jì)算得出的結(jié)果,可以很好地預(yù)測(cè)一個(gè)月或幾個(gè)月內(nèi)內(nèi)湖北省的基本藥物采購(gòu)量,相關(guān)基本藥物生產(chǎn)企業(yè)可以根據(jù)預(yù)測(cè)結(jié)果做好生產(chǎn)計(jì)劃安排和原料采購(gòu)等工作,提高企業(yè)生產(chǎn)運(yùn)作效率和經(jīng)濟(jì)效益;基本醫(yī)療機(jī)構(gòu)可以根據(jù)情況調(diào)整藥物儲(chǔ)備和使用量,以使基本藥物的利用率和可及性都能得到很好的保障。
3 總結(jié)與展望
本文對(duì)湖北省2011年5月-2012年11月抗生素大類的部分基本藥物品種的采購(gòu)量預(yù)測(cè)進(jìn)行了定量分析,主要采用了BP神經(jīng)網(wǎng)絡(luò)法進(jìn)行預(yù)測(cè)的實(shí)證研究,不僅簡(jiǎn)化了網(wǎng)絡(luò)結(jié)構(gòu),而且提高了預(yù)測(cè)精度。結(jié)果比較理想,說(shuō)明本文所建立的基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型具有較好的預(yù)測(cè)能力和推廣潛力。
1) 采購(gòu)決策行為是由主觀因素及客觀因素相互影響共同構(gòu)成,具有動(dòng)態(tài)性和復(fù)雜性等特點(diǎn)。人工神經(jīng)網(wǎng)絡(luò)作為高度非線性體系,能夠?qū)τ绊懖少?gòu)行為的各變量之間的非線性關(guān)系進(jìn)行高精度的逼近,從而實(shí)現(xiàn)預(yù)測(cè)功能。
2) 實(shí)證表明,人工神經(jīng)網(wǎng)絡(luò)雖然存在不足,但其優(yōu)勢(shì)還是顯而易見的。人工神經(jīng)網(wǎng)絡(luò)是一個(gè)高度自動(dòng)化的系統(tǒng),只要有基本藥物的歷史采購(gòu)量,通過(guò)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和仿真,達(dá)到滿意精度后即可輸出特定時(shí)間點(diǎn)的采購(gòu)量,為基本藥物采購(gòu)決策提供科學(xué)的信息支持。但由于影響基本藥物采購(gòu)的各因素并不明了,難以對(duì)基藥采購(gòu)量的波動(dòng)情況進(jìn)行解釋,無(wú)法提供有意義的干預(yù)措施。
3) 由于社區(qū)衛(wèi)生服務(wù)機(jī)構(gòu)長(zhǎng)期以來(lái)缺乏對(duì)藥品使用數(shù)據(jù)的收集,在對(duì)其藥品需求分析時(shí)沒(méi)有足夠多的信息予以支持,所以在對(duì)BP神經(jīng)網(wǎng)絡(luò)的推廣應(yīng)用中,需要保證社區(qū)醫(yī)療機(jī)構(gòu)對(duì)藥品使用數(shù)據(jù)的收集、整理與統(tǒng)計(jì),從而增加預(yù)測(cè)的準(zhǔn)確性。
4) 加強(qiáng)有關(guān)基本藥物采購(gòu)分析的理論研究。基本藥物不同于一般商品,其供需關(guān)系雖然較為穩(wěn)定,但是在現(xiàn)存醫(yī)患信息極不對(duì)稱的情況下,由于誘導(dǎo)需求、道德風(fēng)險(xiǎn)等問(wèn)題造成劣品驅(qū)逐良品的現(xiàn)象,而對(duì)基本藥物的可及性和供需帶來(lái)不必要的風(fēng)險(xiǎn)。現(xiàn)行的有關(guān)基本藥物采購(gòu)理論還需進(jìn)一步完善。
5) 對(duì)基本藥物采購(gòu)量分析方法的探索。本文運(yùn)用BP神經(jīng)網(wǎng)絡(luò)在基本藥物采購(gòu)量短期預(yù)測(cè)上面進(jìn)行一次有益的探索,結(jié)論雖然具備理論指導(dǎo)意義和實(shí)際應(yīng)用價(jià)值。但是由于BP神經(jīng)網(wǎng)絡(luò)無(wú)法探知對(duì)變量造成波動(dòng)的影響因素,若從現(xiàn)實(shí)意義進(jìn)行指導(dǎo),還需要結(jié)合其他的分析方法如多元回歸分析、主成分分析等方法來(lái)相互補(bǔ)充,揚(yáng)長(zhǎng)避短。
參考文獻(xiàn)
[1] 王維, 賀京同, 張建勛, 等. 人工神經(jīng)網(wǎng)絡(luò)在非線性經(jīng)濟(jì)預(yù)測(cè)中的應(yīng)用[J]. 系統(tǒng)工程學(xué)報(bào), 2000, 15(2): 202-207.
[2] 劉衛(wèi)紅, 崔振霞. 基于BP神經(jīng)網(wǎng)絡(luò)的藥品采購(gòu)資金管理研究[J]. 中國(guó)鄉(xiāng)鎮(zhèn)企業(yè)會(huì)計(jì), 2012, 20(1): 70-71.
[3] 張俊才, 黃萬(wàn)杰. BP神經(jīng)網(wǎng)絡(luò)在醫(yī)療器材需求預(yù)測(cè)中的應(yīng)用[J]. 醫(yī)療衛(wèi)生裝備, 2004, 25(4): 8-9.
關(guān)鍵詞:小額信貸;信用風(fēng)險(xiǎn);BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):F830.51 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-9107(2012)02-0078-06
引言
農(nóng)戶小額信貸是指農(nóng)村信用社基于農(nóng)戶的信譽(yù),在核定的額度和期限內(nèi)向農(nóng)戶發(fā)放的不需抵押、擔(dān)保的貸款。1993年,中國(guó)社科院農(nóng)村發(fā)展研究所將小額信貸項(xiàng)目第一次借鑒到中國(guó),我國(guó)政府給予了大力支持。自2000年開始,為加大支農(nóng)力度,緩解農(nóng)戶貸款難問(wèn)題,在中國(guó)人民銀行推動(dòng)下,農(nóng)村信用社作為正規(guī)金融機(jī)構(gòu)全面試行并推廣農(nóng)戶小額信貸。據(jù)有關(guān)數(shù)據(jù)顯示,截至2009年3月末,全國(guó)農(nóng)戶小額信用貸款余額2518.6億元,同比增長(zhǎng)17.5%,增速同比增加1.9個(gè)百分點(diǎn);農(nóng)戶聯(lián)保貸款余額為2006.3億元,同比增長(zhǎng)33.6%,增速同比增加13.4個(gè)百分點(diǎn)。農(nóng)戶小額信貸在解決農(nóng)戶貸款難問(wèn)題、促進(jìn)農(nóng)民增收、支持農(nóng)村經(jīng)濟(jì)發(fā)展等方面發(fā)揮了重要作用。
然而,由于農(nóng)民控制風(fēng)險(xiǎn)能力有限,農(nóng)村信用基礎(chǔ)薄弱,農(nóng)戶小額信貸不需抵押、擔(dān)保的特點(diǎn)使得農(nóng)村信用社在小額信貸實(shí)施過(guò)程中面臨較大的信用風(fēng)險(xiǎn)。農(nóng)戶違約現(xiàn)象時(shí)有發(fā)生,導(dǎo)致農(nóng)戶小額信用貸款的不良率居高不下,影響農(nóng)村信用社的整體貸款質(zhì)量,阻礙了農(nóng)村信用社的健康發(fā)展和小額信貸的可持續(xù)發(fā)展。銀監(jiān)會(huì)監(jiān)管部主任楊家才在“2009中國(guó)農(nóng)村金融論壇”上指出,目前涉農(nóng)貸款不良率是7.4%,工業(yè)貸款不良率是2.29%,大企業(yè)貸款不良率是1.15%,中小企業(yè)貸款不良率是4.5%,涉農(nóng)貸款的不良率大大高于其他類貸款。另有資料顯示,截至2009年初,廬江農(nóng)村信用合作聯(lián)社農(nóng)戶小額信用貸款余額1941萬(wàn)元,不良貸款金額719.8萬(wàn)元,不良率達(dá)37.1%。因此,有效控制農(nóng)戶信用風(fēng)險(xiǎn)、提高信貸質(zhì)量已成為農(nóng)村信用社面臨的重要任務(wù)。
目前,農(nóng)戶小額信用貸款采取“等級(jí)管理,分級(jí)定額,隨用隨貸,余額控制,周轉(zhuǎn)使用”的管理辦法。在農(nóng)戶資信等級(jí)評(píng)定時(shí),一般是通過(guò)信貸員、村委會(huì)的主觀意見或使用評(píng)分表打分來(lái)確定。這些方法雖簡(jiǎn)單易行,但主觀性大且執(zhí)行過(guò)程不規(guī)范,沒(méi)有借助量化的數(shù)學(xué)模型,容易導(dǎo)致農(nóng)戶信用狀況評(píng)價(jià)不準(zhǔn),不能完全滿足農(nóng)村信用社信用風(fēng)險(xiǎn)管理的需要。本研究嘗試?yán)肂P神經(jīng)網(wǎng)絡(luò)建立農(nóng)戶信用風(fēng)險(xiǎn)評(píng)估模型,以此來(lái)識(shí)別農(nóng)戶在小額信貸中的信用風(fēng)險(xiǎn),嚴(yán)把貸款出口關(guān),提高農(nóng)戶小額信貸質(zhì)量,促進(jìn)小額信貸的可持續(xù)發(fā)展。
一、BP神經(jīng)網(wǎng)絡(luò)介紹
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,簡(jiǎn)稱ANN),是一種旨在模仿人腦結(jié)構(gòu)及其功能的腦式智能信息處理系統(tǒng),是由大量處理單元相互連接構(gòu)成的高度并行的非線性系統(tǒng),具有高度的非線性映射能力,良好的容錯(cuò)性和聯(lián)想記憶功能,自適應(yīng)能力較強(qiáng)。神經(jīng)網(wǎng)絡(luò)特有的這些性能,加之其對(duì)數(shù)據(jù)分布沒(méi)有嚴(yán)格要求,也無(wú)需詳細(xì)描述自變量和因變量間的函數(shù)關(guān)系,并且分類精度較高,使其在信用風(fēng)險(xiǎn)分析領(lǐng)域得到廣泛應(yīng)用。神經(jīng)網(wǎng)絡(luò)對(duì)信用風(fēng)險(xiǎn)的評(píng)估是通過(guò)其分類功能實(shí)現(xiàn)的,即先找出一組對(duì)信用分類有影響的因素作為網(wǎng)絡(luò)輸入,再通過(guò)有教師或無(wú)教師訓(xùn)練建立信用風(fēng)險(xiǎn)評(píng)估模型,當(dāng)輸入新樣本時(shí)該模型即可對(duì)其信用風(fēng)險(xiǎn)進(jìn)行判別分類。
Rumelhart和Mc Celland于1986年對(duì)具有非線性連續(xù)變換函數(shù)的多層感知器的誤差反向傳播(Error Back Proragation,BP)算法進(jìn)行了詳盡的分析,實(shí)現(xiàn)了多層感知器的設(shè)想。采用BP算法的多層感知器是至今為止應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò),通常將其稱為BP網(wǎng)絡(luò)。BP網(wǎng)絡(luò)是一種單向傳播的多層前饋網(wǎng)絡(luò),由輸入層、隱含層和輸出層組成,一個(gè)三層的BP網(wǎng)絡(luò)可完成由任意n維輸入空間到m維輸出空間的非線性映射。BP算法的思想是,學(xué)習(xí)過(guò)程由信息的正向傳遞和誤差的反向傳播這兩個(gè)過(guò)程組成。在正向傳遞過(guò)程中,輸入樣本信息從輸入層經(jīng)隱含層逐層計(jì)算后傳向輸出層,若輸出層實(shí)際輸出和期望輸出不符,則計(jì)算輸出層誤差值,然后轉(zhuǎn)入誤差的反向傳播階段。在誤差反向傳播過(guò)程中,輸出誤差經(jīng)隱含層向輸入層逐層反傳,并將誤差攤分給各層所有單元,各層單元的誤差就作為修正其權(quán)值的依據(jù)。這種不斷調(diào)整權(quán)值的過(guò)程,即是網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)過(guò)程。當(dāng)達(dá)到規(guī)定的誤差或一定的訓(xùn)練次數(shù),訓(xùn)練結(jié)束。其網(wǎng)絡(luò)結(jié)構(gòu)如下圖1所示。
二、實(shí)證研究
(一)樣本選擇與分組
本研究所用樣本來(lái)自2009年陜西省楊凌區(qū)3家農(nóng)村信用社提供的資料。按照五級(jí)分類標(biāo)準(zhǔn),逾期3個(gè)月以上的貸款為不良貸款,本研究也按此標(biāo)準(zhǔn)來(lái)確定農(nóng)戶是否違約。在樣本選擇過(guò)程中考慮到樣本類別的均衡,盡量使違約類樣本數(shù)量和不違約類樣本數(shù)量大致相等,在按時(shí)還貸的農(nóng)戶中隨機(jī)挑選了112戶,在未按時(shí)還貸的違約農(nóng)戶中隨機(jī)挑選了106戶,總計(jì)218戶。刪除24個(gè)部分?jǐn)?shù)據(jù)有缺失值的不合格樣本后,最終確定有效樣本為194個(gè),其中不違約樣本有102個(gè),違約樣本92個(gè)。
BP神經(jīng)網(wǎng)絡(luò)分為訓(xùn)練和工作兩個(gè)階段,網(wǎng)絡(luò)模型性能的好壞主要看其是否具有較好的泛化能力,即對(duì)新樣本正確處理的能力。一般將總樣本隨機(jī)分成訓(xùn)練集樣本和測(cè)試集樣本兩部分,對(duì)模型泛化能力的測(cè)試應(yīng)當(dāng)用測(cè)試集樣本數(shù)據(jù)進(jìn)行檢驗(yàn)。有的資料認(rèn)為訓(xùn)練集樣本規(guī)模一般應(yīng)達(dá)到有效樣本的75%-80%,本研究將194個(gè)樣本分成訓(xùn)練樣本和測(cè)試樣本兩組:利用SPSSl6.0軟件在102個(gè)不違約樣本中隨機(jī)抽取78個(gè),在違約樣本中隨機(jī)抽取72個(gè),將這150個(gè)樣本數(shù)據(jù)作為訓(xùn)練樣本集,而將其余的24個(gè)不違約樣本和20個(gè)違約樣本共44個(gè)樣本作為測(cè)試樣本集。
(二)指標(biāo)確定
本研究初始選取的指標(biāo)來(lái)自農(nóng)村信用社農(nóng)戶小額信用貸款資信等級(jí)評(píng)定表和農(nóng)戶借款申請(qǐng)書等檔案,選取了戶主年齡、戶主性別、家庭人口數(shù)、家庭勞動(dòng)力數(shù)、耕地面積、農(nóng)業(yè)收入、非農(nóng)收入、年總支出、信用社入股金額、房屋價(jià)值、機(jī)械價(jià)值、其他資產(chǎn)價(jià)值、貸款數(shù)額、貸款用途、貸款月利率共15個(gè)指標(biāo)。在以上指標(biāo)中,戶主的性別和借款用途兩個(gè)變量是語(yǔ)言變量,需要轉(zhuǎn)換為離散的數(shù)值量。在本研究中,戶主的性別為男時(shí)賦值為0,性別為女時(shí)賦值為1;當(dāng)貸款用途為用于種植業(yè)、養(yǎng)殖業(yè)等農(nóng)業(yè)基本生產(chǎn)時(shí)賦值為1,用于加工、運(yùn)輸、經(jīng)商等個(gè)體經(jīng)營(yíng)時(shí)賦值為2,用于生活用品、建房、治病、上學(xué)等一般消費(fèi)時(shí)賦值為3。
為了選擇對(duì)違約農(nóng)戶和非違約農(nóng)戶區(qū)分能力最
強(qiáng)的指標(biāo)變量以及消除變量間的多重共線性問(wèn)題,對(duì)以上所選取的15個(gè)指標(biāo)用SPSSl6.0軟件分別進(jìn)行正態(tài)性檢驗(yàn)、參數(shù)及非參數(shù)檢驗(yàn)和指標(biāo)變量之間的多重共線性檢驗(yàn)。
1.正態(tài)性檢驗(yàn)。在進(jìn)行樣本差異性檢驗(yàn)之前,采用單樣本K-S檢驗(yàn)即Kolmogorov-Smirnov檢驗(yàn)法,對(duì)每一個(gè)變量分別進(jìn)行正態(tài)性檢驗(yàn)。檢驗(yàn)結(jié)果表明,在0.05的顯著性水平下,變量戶主年齡的概率P值為0.179,大于0.05,而其余14個(gè)變量的概率P值均為0,說(shuō)明除變量戶主年齡服從正態(tài)分布以外,另外14個(gè)變量都不服從正態(tài)分布。
2.差異性檢驗(yàn)。兩獨(dú)立樣本T檢驗(yàn)。兩獨(dú)立樣本T檢驗(yàn)的前提是樣本來(lái)自的總體應(yīng)服從或近似服從正態(tài)分布,本研究對(duì)服從正態(tài)分布的變量戶主年齡采用兩獨(dú)立樣本T檢驗(yàn)。T檢驗(yàn)結(jié)果的F統(tǒng)計(jì)量觀察值的概率P值為0.098,大于顯著性水平0.05,認(rèn)為兩總體方差無(wú)顯著差異;對(duì)應(yīng)的T統(tǒng)計(jì)量觀察值的概率P值為0.027小于0.05,認(rèn)為兩總體均值存在顯著差異。
兩獨(dú)立樣本K-S檢驗(yàn)。對(duì)除變量戶主年齡外的其他不服從正態(tài)分布的變量采用兩獨(dú)立樣本K-s檢驗(yàn)。在K-s檢驗(yàn)結(jié)果中,耕地面積、農(nóng)業(yè)收入、非農(nóng)收入、年總支出、房屋價(jià)值、貸款數(shù)額、貸款用途幾個(gè)變量的概率P值小于0.05,認(rèn)為這幾個(gè)變量在兩總體的分布間存在顯著差異,其他幾個(gè)變量在兩總體間則不存在顯著差異。因此可以認(rèn)為戶主年齡、耕地面積、農(nóng)業(yè)收入、非農(nóng)收入、年總支出、房屋價(jià)值、貸款數(shù)額、貸款用途這8個(gè)變量在違約組和非違約組之間的差異顯著,在模型建立過(guò)程中可只保留差異顯著的8個(gè)變量,而將其他7個(gè)變量予以易II除。
3.共線性檢驗(yàn)。BP神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力和自適應(yīng)能力,輸入變量之間是否存在共線性問(wèn)題對(duì)網(wǎng)絡(luò)的處理結(jié)果影響不大,但為使網(wǎng)絡(luò)的訓(xùn)練效果更佳,本文使用方差擴(kuò)大因子法進(jìn)行變量問(wèn)的多重共線性檢驗(yàn)。VIF值越大,多重共線性問(wèn)題就越嚴(yán)重,一般認(rèn)為VIF值不應(yīng)大于5,但也可適當(dāng)放寬標(biāo)準(zhǔn)至不大于10。當(dāng)VIF值大于10時(shí),可認(rèn)為變量之間存在嚴(yán)重的共線性。檢驗(yàn)結(jié)果顯示,變量非農(nóng)收入的方差擴(kuò)大因子VIF值最大,但也僅為2.974,小于5,表明所選擇的8個(gè)變量之間并不存在多重共線性問(wèn)題,可以將這8個(gè)變量直接作為建立BP網(wǎng)絡(luò)模型的輸入變量。
(三)數(shù)據(jù)處理
為消除數(shù)據(jù)量綱和變量自身變化大小的影響,加快網(wǎng)絡(luò)訓(xùn)練的收斂速度,在模型建立之前,采用最小一最大標(biāo)準(zhǔn)化法對(duì)變量進(jìn)行歸一化即標(biāo)準(zhǔn)化處理,將網(wǎng)絡(luò)的輸入、輸出數(shù)據(jù)限制在[0,1],從而使各輸入分量在網(wǎng)絡(luò)訓(xùn)練開始時(shí)處于同等重要的地位。計(jì)算公式如下:
(四)BP神經(jīng)網(wǎng)絡(luò)信用風(fēng)險(xiǎn)評(píng)估模型的實(shí)現(xiàn)
1.BP網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)。(1)隱含層確定。單隱層BP網(wǎng)絡(luò)能完成由任意n維到m維的映射,與一個(gè)隱層相比,采用兩個(gè)隱層并無(wú)助于改善網(wǎng)絡(luò)性能,但隨隱層層數(shù)的增加,訓(xùn)練時(shí)間將急劇增加,且在訓(xùn)練過(guò)程中往往容易陷入局部最小誤差而無(wú)法收斂。通過(guò)調(diào)節(jié)網(wǎng)絡(luò)隱層神經(jīng)元數(shù)目可提高其誤差精度,且訓(xùn)練效果也比增加層數(shù)更明顯。因此本研究以一個(gè)隱層建立單隱層的三層BP神經(jīng)網(wǎng)絡(luò)。(2)輸入層和輸出層確定。輸入?yún)?shù)的合理與否對(duì)網(wǎng)絡(luò)的性能有重要影響。選擇輸入量的基本原則一是變量對(duì)輸出有較大影響且能夠提取或檢測(cè),二是各變量之間互不相關(guān)或相關(guān)性很小。輸入層節(jié)點(diǎn)數(shù)目取決于輸入數(shù)據(jù)的維數(shù)。通過(guò)前述指標(biāo)篩選,最終有8個(gè)指標(biāo)對(duì)農(nóng)戶是否違約影響較大且變量間不存在相關(guān)性,可以作為建立BP網(wǎng)絡(luò)模型的輸入變量,因此本研究確定BP網(wǎng)絡(luò)輸入層的神經(jīng)元個(gè)數(shù)為8個(gè)。輸出層的選擇相對(duì)容易,其節(jié)點(diǎn)數(shù)取決于輸出數(shù)據(jù)類型和表示該類型所需數(shù)據(jù)的大小兩個(gè)方面。當(dāng)BP網(wǎng)絡(luò)用于模式分類問(wèn)題時(shí),可用二進(jìn)制數(shù)表示輸出結(jié)果,其節(jié)點(diǎn)數(shù)可根據(jù)待分類類別數(shù)確定。本研究將農(nóng)戶信用風(fēng)險(xiǎn)分為違約和不違約兩類,因此可定義1個(gè)輸出節(jié)點(diǎn),用1表示違約類農(nóng)戶,0表示不違約類農(nóng)戶。(3)隱層節(jié)點(diǎn)數(shù)的確定。隱層節(jié)點(diǎn)數(shù)太少,網(wǎng)絡(luò)提取樣本信息的能力差,將不足以反映訓(xùn)練集的樣本規(guī)律。若隱層節(jié)點(diǎn)數(shù)太多,又可能會(huì)提取出樣本中非規(guī)律性的內(nèi)容如噪聲等,造成“過(guò)度吻合”,降低網(wǎng)絡(luò)的泛化能力,另外還會(huì)增加網(wǎng)絡(luò)的訓(xùn)練時(shí)間。對(duì)于隱層節(jié)點(diǎn)數(shù)的確定,至今沒(méi)有準(zhǔn)確的理論和規(guī)則,需要的往往是更多的經(jīng)驗(yàn)。在具體設(shè)計(jì)時(shí),可先根據(jù)經(jīng)驗(yàn)公式初步確定隱含層節(jié)點(diǎn)數(shù),然后通過(guò)對(duì)不同節(jié)點(diǎn)數(shù)的網(wǎng)絡(luò)進(jìn)行訓(xùn)練對(duì)比,再最終確定節(jié)點(diǎn)數(shù)。本研究采用公式作為計(jì)算隱層節(jié)點(diǎn)數(shù)的參考公式,得出隱節(jié)點(diǎn)數(shù)為17個(gè)。在網(wǎng)絡(luò)訓(xùn)練過(guò)程中不斷改變隱層節(jié)點(diǎn)數(shù),通過(guò)比較不同隱節(jié)點(diǎn)數(shù)下網(wǎng)絡(luò)的訓(xùn)練誤差精度及對(duì)兩類樣本的判別準(zhǔn)確率,在滿足網(wǎng)絡(luò)的訓(xùn)練誤差精度的前提下,選取判別準(zhǔn)確率最高時(shí)的節(jié)點(diǎn)數(shù)作為網(wǎng)絡(luò)模型最終的隱層節(jié)點(diǎn)數(shù)。經(jīng)過(guò)多次測(cè)試,最終確定隱層的節(jié)點(diǎn)數(shù)為14,由此構(gòu)成了一個(gè)8-14-1型的BP神經(jīng)網(wǎng)絡(luò)模型,在滿足誤差精度的情況下,此時(shí)模型對(duì)兩類樣本的判別準(zhǔn)確率最高。(4)傳遞函數(shù)的選取。BP網(wǎng)絡(luò)常用的傳遞函數(shù)有對(duì)數(shù)S型logsig函數(shù)、雙曲正切S型tansig函數(shù)和線性函數(shù)purelin。由于BP神經(jīng)網(wǎng)絡(luò)的非線性映射能力是通過(guò)S型傳遞函數(shù)所體現(xiàn)的,所以隱層一般采用S型傳遞函數(shù),而輸出層傳遞函數(shù)可以采用s型或線性。當(dāng)用s型傳遞函數(shù)作為輸出層的傳遞函數(shù)時(shí),其非線性逼近速度快于線性傳遞函數(shù)。本研究將隱層傳遞函數(shù)確定為tansig函數(shù),從而將隱層輸出值控制在(-1,+1)之間;因?yàn)榫W(wǎng)絡(luò)的輸出值為0或1,所以輸出層傳遞函數(shù)采用iogsig函數(shù)。(5)訓(xùn)練函數(shù)的確定。對(duì)網(wǎng)絡(luò)的訓(xùn)練本研究采用L-M改進(jìn)算法和批處理的訓(xùn)練模式。L-M改進(jìn)算法的收斂速度最快,并且適用于中小型網(wǎng)絡(luò)。對(duì)于L-M算法,MATLAB神經(jīng)網(wǎng)絡(luò)工具箱提供了批處理模式下的訓(xùn)練函數(shù)trainlm。本研究將選擇trainlm作為網(wǎng)絡(luò)的訓(xùn)練函數(shù)。
2.訓(xùn)練參數(shù)設(shè)置。(1)學(xué)習(xí)率。學(xué)習(xí)率決定網(wǎng)絡(luò)每一次訓(xùn)練中所產(chǎn)生的權(quán)值變化量,其選擇合理性是網(wǎng)絡(luò)穩(wěn)定的關(guān)鍵,太大可能導(dǎo)致系統(tǒng)不穩(wěn)定,太小會(huì)導(dǎo)致收斂速度慢、訓(xùn)練時(shí)間過(guò)長(zhǎng),不過(guò)能保證收斂于某個(gè)極小值。一般情況下,傾向于選取較小的學(xué)習(xí)速率以保證網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性,其選取范圍通常在0.01-0.8之間。當(dāng)前都是根據(jù)經(jīng)驗(yàn)來(lái)選擇,并沒(méi)有合理的解釋與推導(dǎo)??梢酝ㄟ^(guò)觀察網(wǎng)絡(luò)訓(xùn)練的誤差變化曲線來(lái)判斷選取的學(xué)習(xí)率是否合理.曲線下降較快說(shuō)明學(xué)習(xí)率比較合適,若出現(xiàn)較大的振蕩則說(shuō)明學(xué)習(xí)率偏大。經(jīng)過(guò)反復(fù)測(cè)試,本研究最終確定學(xué)習(xí)率為0.4。(2)訓(xùn)練次數(shù)。訓(xùn)練次數(shù)將直接影響網(wǎng)絡(luò)的準(zhǔn)確性和泛化能力,次數(shù)過(guò)小不能完成訓(xùn)練所設(shè)定的目標(biāo)誤差,次數(shù)過(guò)大則容易造成“過(guò)度學(xué)習(xí)”現(xiàn)象,使得網(wǎng)絡(luò)在對(duì)測(cè)試樣本進(jìn)行仿真測(cè)試時(shí)的準(zhǔn)確度不高。本研究將最大訓(xùn)練次數(shù)確定為10000,當(dāng)訓(xùn)練時(shí)間超過(guò)該設(shè)定時(shí),學(xué)習(xí)過(guò)程自動(dòng)終
止。(3)訓(xùn)練目標(biāo)誤差。MATLAB中默認(rèn)目標(biāo)誤差為0,但實(shí)際情況中訓(xùn)練樣本集很難達(dá)到。本研究輸出值設(shè)為0和1兩種情況,屬于二分類問(wèn)題,對(duì)訓(xùn)練精度要求不是特別高,將目標(biāo)誤差設(shè)為0.001。
3.網(wǎng)絡(luò)訓(xùn)練。在網(wǎng)絡(luò)訓(xùn)練時(shí)需要注意的是將兩類樣本交叉輸入,因?yàn)榧休斎胪活悩颖緦⑹咕W(wǎng)絡(luò)在訓(xùn)練時(shí)只建立與該類樣本相適應(yīng)的映射關(guān)系,而集中輸入另一類樣本時(shí),網(wǎng)絡(luò)權(quán)值的調(diào)整又轉(zhuǎn)向新的映射關(guān)系而否定前面訓(xùn)練的結(jié)果。當(dāng)網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)數(shù)為14時(shí),網(wǎng)絡(luò)根據(jù)訓(xùn)練樣本進(jìn)行訓(xùn)練的誤差變化曲線圖如圖2所示。
BP網(wǎng)絡(luò)模型對(duì)訓(xùn)練集樣本的判別分類準(zhǔn)確率達(dá)到100%,判定結(jié)果如表l所示。
4.網(wǎng)絡(luò)測(cè)試。在訓(xùn)練誤差達(dá)到要求后,根據(jù)測(cè)試集樣本的網(wǎng)絡(luò)模型輸出與期望輸出的誤差,判斷網(wǎng)絡(luò)的泛化性能。當(dāng)網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)為14時(shí),測(cè)試集樣本的網(wǎng)絡(luò)模型輸出見表2。
BP網(wǎng)絡(luò)模型對(duì)測(cè)試集樣本的分類準(zhǔn)確率如表3所示。
通過(guò)測(cè)試樣本集網(wǎng)絡(luò)輸出結(jié)果表2可以看出,1號(hào)、5號(hào)、10號(hào)、11號(hào)、29號(hào)、30號(hào)及31號(hào)樣本的網(wǎng)絡(luò)輸出結(jié)果與期望輸出不符,判別分類出現(xiàn)錯(cuò)誤。通過(guò)對(duì)測(cè)試樣本的判別分類表3可以看出,BP網(wǎng)絡(luò)模型對(duì)違約樣本分類識(shí)別的正確率達(dá)到了90%,對(duì)不違約樣本分類識(shí)別正確率為79.17%,整體的分類識(shí)別正確率為84.09%,取得了較好的評(píng)估結(jié)果,證明了所建BP網(wǎng)絡(luò)模型的精確性和有效性。
本研究將違約類農(nóng)戶誤判為非違約類農(nóng)戶稱為第一類錯(cuò)誤,將非違約類農(nóng)戶誤判為違約類農(nóng)戶稱為第二類錯(cuò)誤。顯然,對(duì)于金融機(jī)構(gòu)來(lái)說(shuō),第一類錯(cuò)誤的危害性遠(yuǎn)比第二類錯(cuò)誤嚴(yán)重,犯第二類錯(cuò)誤頂多是沒(méi)有將貸款發(fā)放出去而損失一筆利息收入,而犯第一類錯(cuò)誤則會(huì)造成貸出的款項(xiàng)無(wú)法收回而形成果賬。Ahman曾經(jīng)得出這樣一個(gè)研究結(jié)論,犯第一類錯(cuò)誤造成的損失是第二類錯(cuò)誤造成的損失的20倍至60倍。因此,應(yīng)盡量避免第一類錯(cuò)誤的發(fā)生。本研究所建立的BP網(wǎng)絡(luò)模型對(duì)違約類樣本識(shí)別的準(zhǔn)確率達(dá)到90%,犯第一類錯(cuò)誤的概率僅為10%,能夠較好的避免第一類錯(cuò)誤的發(fā)生,因而可認(rèn)為是一個(gè)較好的信用風(fēng)險(xiǎn)評(píng)估模型,可以將其作為農(nóng)村信用社識(shí)別農(nóng)戶信用風(fēng)險(xiǎn)的工具。
三、結(jié)論及政策建議
(一)結(jié)論
隨著小額信貸的發(fā)展,如何有效控制農(nóng)戶信用風(fēng)險(xiǎn)、提高信貸質(zhì)量以促進(jìn)小額信貸的可持續(xù)發(fā)展已成為農(nóng)信社面臨首要任務(wù)。農(nóng)戶小額信貸信用風(fēng)險(xiǎn)的評(píng)估研究對(duì)于完善農(nóng)戶小額信貸業(yè)務(wù),實(shí)現(xiàn)小額信貸的可持續(xù)發(fā)展有著重要的意義。
1.本文利用陜西省楊凌區(qū)3家農(nóng)村信用社提供的數(shù)據(jù)資料,借助SPSSl6.0軟件對(duì)樣本數(shù)據(jù)分別進(jìn)行正態(tài)性檢驗(yàn)、參數(shù)及非參數(shù)檢驗(yàn)和多重共線性檢驗(yàn),選擇出對(duì)違約農(nóng)戶和非違約農(nóng)戶區(qū)分能力最強(qiáng)的指標(biāo)變量,消除變量間的多重共線性問(wèn)題,在信息量不減少的情況下減少變量的個(gè)數(shù),從而減少了神經(jīng)網(wǎng)絡(luò)模型的輸入單元個(gè)數(shù),降低網(wǎng)絡(luò)模型的復(fù)雜程度,提高了訓(xùn)練速度。
2.利用MATLAB7.0軟件對(duì)農(nóng)戶小額信貸信用風(fēng)險(xiǎn)進(jìn)行實(shí)證研究,建立了8-14-1結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)模型。模型對(duì)訓(xùn)練集樣本的識(shí)別正確率達(dá)100%,對(duì)測(cè)試樣本集違約類農(nóng)戶的識(shí)別正確率達(dá)90%,總正確率達(dá)84.09%,雖然網(wǎng)絡(luò)模型對(duì)測(cè)試樣本集未違約類農(nóng)戶的識(shí)別準(zhǔn)確率只有79.17%,但農(nóng)村信用社在一定程度上可以容忍此類錯(cuò)誤發(fā)生所帶來(lái)的機(jī)會(huì)損失。因而,BP網(wǎng)絡(luò)模型能夠?yàn)檗r(nóng)村信用社識(shí)別和預(yù)測(cè)農(nóng)戶信用風(fēng)險(xiǎn)提供較好的依據(jù)。
3.BP神經(jīng)網(wǎng)絡(luò)是一種非參數(shù)模型,具有較強(qiáng)的非線性映射能力、容錯(cuò)能力和魯棒性,對(duì)數(shù)據(jù)的分布要求不嚴(yán)格,分類精度較高,并且可以很容易地繼承現(xiàn)有領(lǐng)域知識(shí),不斷接受新樣本、新經(jīng)驗(yàn)對(duì)模型進(jìn)行調(diào)整。另外,BP神經(jīng)網(wǎng)絡(luò)模型中的權(quán)重通過(guò)網(wǎng)絡(luò)對(duì)樣本訓(xùn)練形成,不需要對(duì)各項(xiàng)指標(biāo)確定權(quán)重,克服了由人工評(píng)價(jià)帶來(lái)的主觀性及模糊隨機(jī)性的影響,保證了結(jié)果的準(zhǔn)確性和客觀性。
(二)政策建議
關(guān)鍵詞:BP算法;經(jīng)營(yíng)狀況;指標(biāo)體系;評(píng)價(jià)模型
中圖分類號(hào):F27文獻(xiàn)標(biāo)志碼:A文章編號(hào):1673-291X(2010)31-0036-03
前言
企業(yè)的經(jīng)營(yíng)狀況越來(lái)越多受到投資者的關(guān)注,它也是企業(yè)經(jīng)濟(jì)活動(dòng)中的很重要的問(wèn)題,因此如何做企業(yè)的經(jīng)營(yíng)狀況評(píng)價(jià)問(wèn)題也就是企業(yè)面臨的一個(gè)十分重要的問(wèn)題。只有真正建立起適應(yīng)企業(yè)經(jīng)濟(jì)發(fā)展的評(píng)價(jià)模型,才能使企業(yè)在激烈的市場(chǎng)競(jìng)爭(zhēng)中立于不敗之地。
常用的評(píng)價(jià)模型很多,主要有統(tǒng)計(jì)方法和神經(jīng)網(wǎng)絡(luò)方法等。統(tǒng)計(jì)方法如層次分析法評(píng)價(jià)模型[1]、模糊綜合評(píng)價(jià)模型[2]、Logistic回歸模型[3]、Bayes判別信用評(píng)價(jià)模型[4]、因子分析法[5]、聚類分析法[6~7]和主成分分析法等,雖然這些方法已得到了廣泛的應(yīng)用,但他們或多或少存在著一些欠缺:有些模型只能應(yīng)用于線性場(chǎng)合,對(duì)于非線性場(chǎng)合不適用;有些模型對(duì)于數(shù)據(jù)的分布要求很嚴(yán)格;有些模型的建立依賴于個(gè)人經(jīng)驗(yàn),有些模型難以應(yīng)用于多因素場(chǎng)合。統(tǒng)計(jì)方法需要描述自變量與因變量之間的函數(shù)關(guān)系,當(dāng)狀況較為復(fù)雜,用統(tǒng)計(jì)方法不易解決的時(shí)候,神經(jīng)網(wǎng)絡(luò)可以成功的解決這一類問(wèn)題。由于人工神經(jīng)網(wǎng)絡(luò)具有并行處理、魯棒性和自組織等特點(diǎn)而被廣泛應(yīng)用[8~9]。下面采用BP神經(jīng)網(wǎng)絡(luò)建立企業(yè)經(jīng)營(yíng)狀況評(píng)價(jià)模型。
一、網(wǎng)絡(luò)設(shè)計(jì)與訓(xùn)練
將中國(guó)2008年的64家公司作為訓(xùn)練樣本,其中經(jīng)營(yíng)正常的公司有39家,經(jīng)營(yíng)差的公司有25家,測(cè)試樣本采用2009年的17家公司,其中經(jīng)營(yíng)正常的公司9家,經(jīng)營(yíng)差的公司有8家。
1.網(wǎng)絡(luò)層數(shù)的確定
構(gòu)造一個(gè)2層的BP網(wǎng)絡(luò)來(lái)解決本節(jié)提出的兩類模式分類問(wèn)題。
2.輸入維數(shù)、輸出層節(jié)點(diǎn)的確定
對(duì)兩類模式分類問(wèn)題,財(cái)務(wù)指標(biāo)選取4個(gè)財(cái)務(wù)指標(biāo)x1=每股收益, x2=每股凈資產(chǎn),x3 =凈資產(chǎn)收益率, x4=主營(yíng)利潤(rùn)增長(zhǎng)率, 用“0” 代表經(jīng)營(yíng)差的企業(yè),用“1” 代表經(jīng)營(yíng)正常的企業(yè).所以輸入維數(shù)為4,輸出層選取1個(gè)節(jié)點(diǎn)。
3.隱層節(jié)點(diǎn)的確定
一般狀況下,隱含層的結(jié)點(diǎn)數(shù)較難確定,因而采用試湊法。在能正確反映、實(shí)現(xiàn)輸入輸出映射的基礎(chǔ)上,盡量選取較少的隱層結(jié)點(diǎn)數(shù),從而使網(wǎng)絡(luò)模型盡可能的簡(jiǎn)單。為了使數(shù)據(jù)更加精準(zhǔn),先將數(shù)據(jù)進(jìn)行歸一化處理,隱層分別選取節(jié)點(diǎn)為3,4,5,利用上述訓(xùn)練樣本對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。當(dāng)隱層選取3個(gè)節(jié)點(diǎn)時(shí),訓(xùn)練誤差變化曲線(如圖1);當(dāng)隱層選取4個(gè)節(jié)點(diǎn)時(shí),訓(xùn)練誤差變化曲線(如圖2);當(dāng)隱層選取5個(gè)節(jié)點(diǎn)時(shí),訓(xùn)練誤差變化曲線(如圖3)。
圖1
圖 2
圖 3
從訓(xùn)練誤差曲線圖可以看出,當(dāng)隱層選取3個(gè)節(jié)點(diǎn)時(shí),當(dāng)訓(xùn)練到第11步時(shí),訓(xùn)練誤差達(dá)到0.001,當(dāng)隱層選取4個(gè)節(jié)點(diǎn)時(shí),當(dāng)訓(xùn)練到第5~6步時(shí),訓(xùn)練誤差達(dá)到0.001,當(dāng)隱層選取5個(gè)節(jié)點(diǎn)時(shí),當(dāng)訓(xùn)練到第10~11步時(shí),訓(xùn)練誤差達(dá)到0.001,因而,當(dāng)隱節(jié)點(diǎn)為4時(shí),所需要的訓(xùn)練步驟最少,所以隱層節(jié)點(diǎn)選為4。
二、基于BP神經(jīng)網(wǎng)絡(luò)的經(jīng)營(yíng)狀況評(píng)價(jià)模型
當(dāng)隱層節(jié)點(diǎn)選為4時(shí),各層的連接權(quán)值和閾值分別為:
w=3.33852.09120.1425- 0.3756- 0.1848 2.27941.5118- 2.85743.0057- 2.4902 0.5163- 0.4217- 1.0658 - 2.3104 - 0.8535 - 2.9116
B1=- 3.9598 1.3199 1.3199- 3.9598
V=[- 1.6817 2.9964 2.2098 3.8302] B2=- 3.6774
則由此得到BP神經(jīng)網(wǎng)絡(luò)的信用評(píng)價(jià)模型為:
y=gVjgXjixi+B1j+B2
其中:第一個(gè)g為logsig函數(shù),第二個(gè)g為logsig函數(shù),Vj為輸出權(quán)值,Wj為輸入權(quán)值,B1為輸入閾值,B2為輸出閾值。
三、網(wǎng)絡(luò)的仿真
1.訓(xùn)練樣本的網(wǎng)絡(luò)仿真
利用所建立的信用評(píng)價(jià)模型對(duì)64個(gè)訓(xùn)練樣本(經(jīng)營(yíng)差的企業(yè)25個(gè),序號(hào)為1-25,經(jīng)營(yíng)正常的企業(yè)39個(gè),序號(hào)為26-64)進(jìn)行兩類模式分類。仿真結(jié)果(見表1),從表1可以看出有25個(gè)網(wǎng)絡(luò)輸出值接近于0,序號(hào)為1-25,有39個(gè)網(wǎng)絡(luò)輸出值接近于1,序號(hào)為26-64,這表明在訓(xùn)練樣本中經(jīng)營(yíng)正常的企業(yè)的正確識(shí)別個(gè)數(shù)為39,經(jīng)營(yíng)差的企業(yè)正確識(shí)別個(gè)數(shù)為25(見表2),因此該評(píng)價(jià)模型對(duì)訓(xùn)練樣本的正確識(shí)別率達(dá)到100%。
2.測(cè)試樣本的網(wǎng)絡(luò)仿真
推廣能力是衡量神經(jīng)網(wǎng)絡(luò)性能好壞的重要標(biāo)志,因而,為了檢驗(yàn)網(wǎng)絡(luò)的推廣能力,將2009年第一季度的17家上市公司作為測(cè)試樣本,經(jīng)營(yíng)差的企業(yè)有8家,經(jīng)營(yíng)正常的企業(yè)有9家,測(cè)試樣本的網(wǎng)絡(luò)輸出結(jié)果如下(見表3):
從表3可以看出序號(hào)為1-8的網(wǎng)絡(luò)輸出值接近于0(0.9924),所以經(jīng)營(yíng)正常的企業(yè)正確識(shí)別了9家,從表4可以看出,該評(píng)價(jià)模型對(duì)測(cè)試樣本的正確識(shí)別率也達(dá)到了100%。
總結(jié)
采用中國(guó)2008年的64家上市公司和2009年的17家公司的財(cái)務(wù)數(shù)據(jù),考慮上市公司經(jīng)營(yíng)狀況的4 個(gè)主要財(cái)務(wù)指標(biāo):每股收益、每股凈資產(chǎn)、凈資產(chǎn)收益率、主營(yíng)利潤(rùn)增長(zhǎng)率。通過(guò)matlab 軟件,利用2008年的64家公司的數(shù)據(jù)建立了基于BP算法的經(jīng)營(yíng)狀況評(píng)價(jià)模型,并利用該模型對(duì)2009年的17家公司的經(jīng)營(yíng)狀況進(jìn)行了評(píng)價(jià)。仿真結(jié)果表明,訓(xùn)練后的網(wǎng)絡(luò)模型對(duì)訓(xùn)練樣本和測(cè)試樣本的正確識(shí)別率為100%。因此,基于BP算法的經(jīng)營(yíng)狀況評(píng)價(jià)模型能夠正確的對(duì)兩類模式進(jìn)行分類,具有潛在的應(yīng)用價(jià)值。
參考文獻(xiàn):
[1]汪勇,魏巍.電子商務(wù)網(wǎng)站的層次分析法評(píng)價(jià)模型構(gòu)建[J].湖北大學(xué)學(xué)報(bào),2010,(1):50-61.
[2]林斌,吳貴生,王劍.地方政府投融資管理體制發(fā)展趨勢(shì)探析――基于模糊綜合評(píng)價(jià)法[J].運(yùn)籌與管理,2010,(l):139-144.
[3]陳立文,孟苓閣.房地產(chǎn)上市公司Logistic預(yù)警模型研究[J].價(jià)值工程,2010,(8):34-36.
[4]林杰新,羅偉其,龐素琳.Bayes判別信用評(píng)價(jià)模型及其應(yīng)用研究[J].統(tǒng)計(jì)與決策,2005,(1):22-25.[5]毛春元,張?jiān)?黃萍.基于因子分析法的小康社會(huì)綜合評(píng)價(jià)模型[J].淮海工學(xué)院學(xué)報(bào),2010,(1):67-70.
[6]鞏芳,常青,白布赫,等.基于聚類分析的內(nèi)蒙古草原生態(tài)經(jīng)濟(jì)系統(tǒng)綜合評(píng)價(jià)[J].內(nèi)蒙古大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2010,(2):27-32.
[7]高新才,魏麗莉.中國(guó)區(qū)域城鄉(xiāng)協(xié)調(diào)發(fā)展評(píng)價(jià)模型與案例分析[J].西北師大學(xué)報(bào),2010,(1):91-96.
[8]朱國(guó)強(qiáng),劉厚泉.基于聚類的神經(jīng)網(wǎng)絡(luò)分類模型研究[J].微計(jì)算機(jī)信息,2008,(3):223-224.
[9]柳平,趙巖,王軍.基于非線性特征提取的EEG信號(hào)支持向量分類器[J].汕頭大學(xué)學(xué)報(bào),2009,(1):69-74.
An Evaluation Model of Enterprises’s Business Status Based on BP Algorithm
WANG Xiao-dong1,XUE Hong-zhi2,YANG Wen1
(1. School of Science, Xi’an Polytechnic University,Xi’an 710048,China;2. School of Science, Chang’an University Xi’an 710064,China)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:北大期刊
榮譽(yù):百種重點(diǎn)期刊