前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的人工神經(jīng)網(wǎng)絡(luò)的概念主題范文,僅供參考,歡迎閱讀并收藏。
論文摘要:隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,智能計(jì)算方法的應(yīng)用領(lǐng)域也越來越廣泛。本文介紹了當(dāng)前存在的一些智能計(jì)算方法,闡述了其工作原理和特點(diǎn),同時(shí)對(duì)智能計(jì)算方法的發(fā)展進(jìn)行了展望。
The Analysis for Several Classic Algorism of Intellegence Computation
YANG Ming-hui
(Wuhan University of Technology, Wuhan 430074, China)
Abstract: As the computer technology develops fast, the field for intelligence algorism become wider and wider.In this paper, I introduce some methods for intelligence, and analyze their Principles and characters, finally make a Forecast of the develop of integellence computation.
Key words:Intelligence Computation; Artificial Neural Network Algorithm;Genetic algorithm;Annealing Algorithm
1 引言
智能算法也稱作為“背影算法”,是人們從現(xiàn)實(shí)的生活中的各種現(xiàn)象總結(jié)出來的算法。它是從自然界得到啟發(fā),模仿它的原理而得到的算法,這樣我們可以利用仿生原理進(jìn)行設(shè)計(jì)我們的解決問題的路徑,這就是智能計(jì)算的思想。這方面的內(nèi)容很多,如人工神經(jīng)網(wǎng)絡(luò)技術(shù)、遺傳算法、模擬退火算法等,下面分別對(duì)其進(jìn)行分析。
2 人工神經(jīng)網(wǎng)絡(luò)算法
2.1 人工神經(jīng)網(wǎng)絡(luò)(ARTIFICIAL NEURAL NETWORK,簡(jiǎn)稱ANN)
人工神經(jīng)網(wǎng)絡(luò)是在對(duì)人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制的認(rèn)識(shí)理解基礎(chǔ)之上模擬其結(jié)構(gòu)和智能行為的一種工程系統(tǒng)。早在本世紀(jì)40年代初期,心理學(xué)家McCulloch、數(shù)學(xué)家Pitts就提出了人工神經(jīng)網(wǎng)絡(luò)的第一個(gè)數(shù)學(xué)模型,從此開創(chuàng)了神經(jīng)科學(xué)理論的研究時(shí)代。其后,F Rosenblatt、Widrow和J. J .Hopfield等學(xué)者又先后提出了感知模型,使得人工神經(jīng)網(wǎng)絡(luò)技術(shù)得以蓬勃發(fā)展。
2.2 人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn)
人工神經(jīng)網(wǎng)絡(luò)的知識(shí)存儲(chǔ)容量很大。在神經(jīng)網(wǎng)絡(luò)中,知識(shí)與信息的存儲(chǔ)表現(xiàn)為神經(jīng)元之間分布式的物理聯(lián)系。它分散地表示和存儲(chǔ)于整個(gè)網(wǎng)絡(luò)內(nèi)的各神經(jīng)元及其連線上。每個(gè)神經(jīng)元及其連線只表示一部分信息,而不是一個(gè)完整具體概念。只有通過各神經(jīng)元的分布式綜合效果才能表達(dá)出特定的概念和知識(shí)。
由于人工神經(jīng)網(wǎng)絡(luò)中神經(jīng)元個(gè)數(shù)眾多以及整個(gè)網(wǎng)絡(luò)存儲(chǔ)信息容量的巨大,使得它具有很強(qiáng)的不確定性信息處理能力。即使輸入信息不完全、不準(zhǔn)確或模糊不清,神經(jīng)網(wǎng)絡(luò)仍然能夠聯(lián)想思維存在于記憶中的事物的完整圖像。只要輸入的模式接近于訓(xùn)練樣本,系統(tǒng)就能給出正確的推理結(jié)論。
正是因?yàn)槿斯ど窠?jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)和其信息存儲(chǔ)的分布式特點(diǎn),使得它相對(duì)于其它的判斷識(shí)別系統(tǒng),如:專家系統(tǒng)等,具有另一個(gè)顯著的優(yōu)點(diǎn):健壯性。生物神經(jīng)網(wǎng)絡(luò)不會(huì)因?yàn)閭€(gè)別神經(jīng)元的損失而失去對(duì)原有模式的記憶。最有力的證明是,當(dāng)一個(gè)人的大腦因意外事故受輕微損傷之后,并不會(huì)失去原有事物的全部記憶。人工神經(jīng)網(wǎng)絡(luò)也有類似的情況。因某些原因,無論是網(wǎng)絡(luò)的硬件實(shí)現(xiàn)還是軟件實(shí)現(xiàn)中的某個(gè)或某些神經(jīng)元失效,整個(gè)網(wǎng)絡(luò)仍然能繼續(xù)工作。
人工神經(jīng)網(wǎng)絡(luò)是一種非線性的處理單元。只有當(dāng)神經(jīng)元對(duì)所有的輸入信號(hào)的綜合處理結(jié)果超過某一門限值后才輸出一個(gè)信號(hào)。因此神經(jīng)網(wǎng)絡(luò)是一種具有高度非線性的超大規(guī)模連續(xù)時(shí)間動(dòng)力學(xué)系統(tǒng)。它突破了傳統(tǒng)的以線性處理為基礎(chǔ)的數(shù)字電子計(jì)算機(jī)的局限,標(biāo)志著人們智能信息處理能力的一大飛躍。
3 遺傳算法
3.1 特點(diǎn)
遺傳算法是解決搜索問題的一種通用算法,對(duì)于各種通用問題都可以使用。搜索算法的共同特征為:(1)首先組成一組候選解;(2)依據(jù)某些適應(yīng)性條件測(cè)算這些候選解的適應(yīng)度;(3)根據(jù)適應(yīng)度保留某些候選解,放棄其他候選解;(4)對(duì)保留的候選解進(jìn)行某些操作,生成新的候選解。在遺傳算法中,上述幾個(gè)特征以一種特殊的方式組合在一起:基于染色體群的并行搜索,帶有猜測(cè)性質(zhì)的選擇操作、交換操作和突變操作。這種特殊的組合方式將遺傳算法與其它搜索算法區(qū)別開來。
遺傳算法還具有以下幾方面的特點(diǎn):
(1)遺傳算法從問題解的串集開始嫂索,而不是從單個(gè)解開始。這是遺傳算法與傳統(tǒng)優(yōu)化算法的極大區(qū)別。傳統(tǒng)優(yōu)化算法是從單個(gè)初始值迭代求最優(yōu)解的;容易誤入局部最優(yōu)解。遺傳算法從串集開始搜索,覆蓋面大,利于全局擇優(yōu)。
(2)許多傳統(tǒng)搜索算法都是單點(diǎn)搜索算法,容易陷入局部的最優(yōu)解。遺傳算法同時(shí)處理群體中的多個(gè)個(gè)體,即對(duì)搜索空間中的多個(gè)進(jìn)行評(píng)估,減少了陷入局部最優(yōu)解的風(fēng)險(xiǎn),同時(shí)算法本身易于實(shí)現(xiàn)并行化。
(3)遺傳算法基本上不用搜索空間的知識(shí)或其它輔助信息,而僅用適應(yīng)度函數(shù)值來評(píng)估個(gè)體,在此基礎(chǔ)上進(jìn)行遺傳操作。適應(yīng)度函數(shù)不僅不受連續(xù)可微的約束,而且其定義域可以任意設(shè)定。這一特點(diǎn)使得遺傳算法的應(yīng)用范圍大大擴(kuò)展。
3.2 運(yùn)用領(lǐng)域
前面描述是簡(jiǎn)單的遺傳算法模型,可以在這一基本型上加以改進(jìn),使其在科學(xué)和工程領(lǐng)域得到廣泛應(yīng)用。下面列舉了一些遺傳算法的應(yīng)用領(lǐng)域:(1)優(yōu)化:遺傳算法可用于各種優(yōu)化問題。既包括數(shù)量?jī)?yōu)化問題,也包括組合優(yōu)化問題;(2)程序設(shè)計(jì):遺傳算法可以用于某些特殊任務(wù)的計(jì)算機(jī)程序設(shè)計(jì);(3)機(jī)器學(xué)習(xí):遺傳算法可用于許多機(jī)器學(xué)習(xí)的應(yīng)用,包括分類問題和預(yù)測(cè)問題等。
4 退火算法
模擬退火算法來源于固體退火原理,將固體加溫至充分高,再讓其徐徐冷卻,加溫時(shí),固體內(nèi)部粒子隨溫升變?yōu)闊o序狀,內(nèi)能增大,而徐徐冷卻時(shí)粒子漸趨有序,在每個(gè)溫度都達(dá)到平衡態(tài),最后在常溫時(shí)達(dá)到基態(tài),內(nèi)能減為最小。根據(jù)Metropolis準(zhǔn)則,粒子在溫度T時(shí)趨于平衡的概率為e-ΔE/(kT),其中ΔE為溫度T時(shí)的內(nèi)能,ΔE為其改變量,k為Boltzmann常數(shù)。用固體退火模擬組合優(yōu)化問題,將內(nèi)能E模擬為目標(biāo)函數(shù)值f ,溫度T演化成控制參數(shù)t,即得到解組合優(yōu)化問題的模擬退火算法:由初始解i和控制參數(shù)初值t開始,對(duì)當(dāng)前解重復(fù)“產(chǎn)生新解計(jì)算目標(biāo)函數(shù)差接受或舍棄”的迭代,并逐步衰減t值,算法終止時(shí)的當(dāng)前解即為所得近似最優(yōu)解,這是基于蒙特卡羅迭代求解法的一種啟發(fā)式隨機(jī)搜索過程。退火過程由冷卻進(jìn)度表(Cooling Schedule)控制,包括控制參數(shù)的初值t及其衰減因子Δt,每個(gè)t值時(shí)的迭代次數(shù)L和停止條件S。
5 展望
目前的智能計(jì)算研究水平暫時(shí)還很難使“智能機(jī)器”真正具備人類的常識(shí),但智能計(jì)算將在21世紀(jì)蓬勃發(fā)展。不僅僅只是功能模仿要持有信息機(jī)理一致的觀點(diǎn)。即人工腦與生物腦將不只是功能模仿,而是具有相同的特性。這兩者的結(jié)合將開辟一個(gè)全新的領(lǐng)域,開辟很多新的研究方向。智能計(jì)算將探索智能的新概念,新理論,新方法和新技術(shù),而這一切將在以后的發(fā)展中取得重大成就。
隨著我國經(jīng)濟(jì)的快速發(fā)展,大量的工程建設(shè)也相繼展開,同時(shí)在工程建設(shè)中也出現(xiàn)了邊坡穩(wěn)定性的問題,而這些邊坡是影響工程建設(shè)質(zhì)量的重要因素。邊坡的穩(wěn)定性是工程建設(shè)研究的重要方向,在建筑工程、道路工程等很多工程中都與邊坡的穩(wěn)定性有關(guān)。邊坡工程是一個(gè)不斷變化的動(dòng)態(tài)過程,其變形破壞機(jī)理非常復(fù)雜。邊坡穩(wěn)定的因素有很多,如地質(zhì)因素、工程因素等,還有其本身的不確定性。邊坡的穩(wěn)定性對(duì)工程建設(shè)具有重大的影響,因此,如何科學(xué)合理的設(shè)計(jì)邊坡工程對(duì)工程建設(shè)的順利進(jìn)行具有非常重要的意義。目前,邊坡穩(wěn)定性的評(píng)價(jià)方法有很多,但是這些方法由于受到人為因素的影響,且應(yīng)用起來有不確定性,并沒有得到廣泛的應(yīng)用。本文利用人工神經(jīng)網(wǎng)絡(luò)的知識(shí)來評(píng)價(jià)邊坡的穩(wěn)定性,通過人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)上的特點(diǎn)探索影響邊坡穩(wěn)定性的因素,從而保證邊坡工程的穩(wěn)定性,促進(jìn)工程建設(shè)的快速發(fā)展。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò);邊坡工程;穩(wěn)定性;貢獻(xiàn)
Abstract:With the rapid development of our country's economy, a lot of engineering construction, one after another in the engineering construction at the same time also appeared a slope stability problem, and the slope are important factors affecting the quality of project construction. Slope stability is one of the important direction, construction research in construction engineering, road engineering, etc. Many projects are related to the stability of the slope. Slope engineering is a constantly changing dynamic process, the deformation failure mechanism is very complicated. Slope stability factors are many, such as geological factors, engineering factors and so on, and its uncertainty. Slope stability has a significant influence on engineering construction, therefore, how to scientific and reasonable design of slope engineering smooth going on of the project construction has very important significance. At present, the slope stability evaluation method are many, but these methods under the influence of artificial factors, and the application to have uncertainty, has not been widely used. In this paper, using the knowledge of the artificial neural network to evaluate the slope stability, by artificial neural network structural characteristics to explore the influencing factors of slope stability, thus ensuring the stability of the slope engineering, to promote the rapid development of engineering construction.
Keywords: artificial neural network; Slope engineering; Stability; Contribution to the
中圖分類號(hào): TP183文獻(xiàn)標(biāo)識(shí)碼:A
1 邊坡穩(wěn)定性的研究現(xiàn)狀
邊坡的變形和破壞會(huì)對(duì)工程建設(shè)造成重大的影響,邊坡的穩(wěn)定性受到很多因素的影響,從范圍上來說,主要包括自然因素和人為活動(dòng)因素。水文、地質(zhì)、人為工程活動(dòng)都可能造成邊坡穩(wěn)定性的破壞,其中邊坡應(yīng)力的變化和發(fā)展是造成邊坡穩(wěn)定性破壞的根本原因。具有代表性的造成邊坡失穩(wěn)的因素如下:地下工程開挖后,由于地下土層應(yīng)力的突然釋放對(duì)邊坡原有應(yīng)力狀態(tài)的影響;邊坡上堆積物的載重傳播到邊坡上的影響;邊坡土層暴露在自然環(huán)境中遭受外部環(huán)境風(fēng)化的影響;地下水的流動(dòng)對(duì)邊坡土層強(qiáng)度的影響。
工程地質(zhì)是邊坡穩(wěn)定性問題需要考慮的重要因素,它主要有以下兩個(gè)主要任務(wù):第一是要準(zhǔn)確的評(píng)價(jià)和預(yù)測(cè)與人為工程活動(dòng)關(guān)系密切的天然邊坡和人工邊坡的穩(wěn)定性、變化規(guī)律和發(fā)生破壞的幾率;第二是為科學(xué)合理的設(shè)計(jì)邊坡、保證邊坡的穩(wěn)定性、采取有力的邊坡防治措施提供準(zhǔn)確可靠的依據(jù)。而邊坡問題的出現(xiàn)總是和邊坡的變形和破壞有關(guān),為了準(zhǔn)確的評(píng)價(jià)和預(yù)測(cè)邊坡工程的穩(wěn)定性,首先要確定邊坡是否可能發(fā)生變形與破壞以及變形和破壞的方式和規(guī)模。因此邊坡穩(wěn)定性的工程地質(zhì)要分析和研究邊坡變形和破壞的規(guī)律。邊坡變形和破壞表明了邊坡土層在不同的條件下變化的過程,同時(shí)為邊坡變形破壞力學(xué)模型的建立提供了重要依據(jù)。
邊坡工程穩(wěn)定性的研究邊坡工程的重要組成部分,越來越多的專家和研究人員加入到邊坡穩(wěn)定性研究的隊(duì)伍中,它會(huì)隨著邊坡工程的建設(shè)一直發(fā)展下去。
2 人工神經(jīng)網(wǎng)絡(luò)概述
2.1 人工神經(jīng)網(wǎng)絡(luò)的概念
人工神經(jīng)網(wǎng)絡(luò)是人工智能科學(xué)的一個(gè)重要分支,在21世紀(jì)得到了快速發(fā)展,通過人工神經(jīng)元之間的連接來處理網(wǎng)絡(luò)信息,來實(shí)現(xiàn)類似人的活動(dòng)和行為,以網(wǎng)絡(luò)元件建立知識(shí)與信息的關(guān)系,而構(gòu)成的一種信息處理體系。神經(jīng)元之間的變化過程決定了網(wǎng)絡(luò)的學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)、信息處理、網(wǎng)絡(luò)模式識(shí)別等方面起著重要的作用,因此,它能將所有的控制因素考慮進(jìn)去。
2.2 評(píng)價(jià)信息表達(dá)
由于邊坡穩(wěn)定性的影響因素很多,定性的數(shù)據(jù)和資料錯(cuò)綜復(fù)雜,因此,要把這些定性的數(shù)據(jù)進(jìn)行量化,然后再輸入神經(jīng)網(wǎng)絡(luò)。邊坡結(jié)構(gòu)的高度、坡角等數(shù)據(jù)可直接進(jìn)行實(shí)際測(cè)定;巖體結(jié)構(gòu)類型和質(zhì)量類別等無法直接測(cè)定的數(shù)據(jù)要通過等級(jí)數(shù)字代碼來確定;巖體的巖性、破壞類型等定性數(shù)據(jù)則通過數(shù)字代碼來確定。將這些定性的數(shù)據(jù)進(jìn)行量化處理后,所有的信息數(shù)據(jù)就可以通過神經(jīng)網(wǎng)絡(luò)來處理,同時(shí)還能影響邊坡穩(wěn)定性因素的影響程度。顯而易見,當(dāng)我們獲得更多的原始信息,就能更加準(zhǔn)確的確定邊坡的特征,同時(shí)表達(dá)邊坡穩(wěn)定性因素的關(guān)系也更加復(fù)雜,通過神經(jīng)網(wǎng)絡(luò)的計(jì)算,就能確定邊坡穩(wěn)定性的評(píng)價(jià)信息,也就是邊坡的穩(wěn)定狀態(tài)。
2.3 人工神經(jīng)網(wǎng)絡(luò)的算法
人工神經(jīng)網(wǎng)絡(luò)是通過對(duì)人類大腦的結(jié)構(gòu)和運(yùn)行模式進(jìn)行研究而模擬其結(jié)構(gòu)和行為的工程系統(tǒng)。從20世紀(jì)40年代開始,人工神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型被第一次提出,從此人工神經(jīng)網(wǎng)絡(luò)的研究得到了快速發(fā)展,隨后很多專家和研究人員提出了其他的模型,極大地豐富了人工神經(jīng)網(wǎng)絡(luò)的研究?jī)?nèi)容。
近年來,前饋神經(jīng)網(wǎng)絡(luò)模型BP是在工程建設(shè)中應(yīng)用最為廣泛的模型,其結(jié)構(gòu)由輸入層、隱含層和輸出層三部分組成,其中輸入層由N個(gè)神經(jīng)元組成,隱含層由P個(gè)神經(jīng)元組成,輸出層由q個(gè)神經(jīng)元組成。假設(shè)有i個(gè)學(xué)習(xí)樣本,F(xiàn)為輸出層神經(jīng)元的平方誤差,就構(gòu)成了BP網(wǎng)絡(luò)結(jié)構(gòu)。在學(xué)習(xí)的過程中,神經(jīng)元連接出現(xiàn)的錯(cuò)誤為網(wǎng)絡(luò)輸出的誤差,輸入層接收輸出層的神經(jīng)元的誤差后,分配給每一個(gè)神經(jīng)單元,最終確定各層神經(jīng)元的參考誤差。
前向計(jì)算過程和誤差接收過程共同組成了BP網(wǎng)絡(luò)學(xué)習(xí)過程,其分為以下三步進(jìn)行:
(1)網(wǎng)絡(luò)初始化:輸入學(xué)習(xí)率a和b,確定學(xué)習(xí)誤差e,確定權(quán)重矩陣U、V的初始值;
(2)確定學(xué)習(xí)樣本的輸入值和期望輸出值,計(jì)算網(wǎng)絡(luò)節(jié)點(diǎn)的具體數(shù)值,計(jì)算輸出層和隱含層的誤差,最后對(duì)各邊權(quán)值進(jìn)行調(diào)整;
(3)通過改變學(xué)習(xí)效率a和b,使BP算法更加合理,重復(fù)進(jìn)行計(jì)算一直到代價(jià)函數(shù)F小于學(xué)習(xí)誤差e,整個(gè)學(xué)習(xí)過程就結(jié)束了。
3 人工神經(jīng)網(wǎng)絡(luò)在邊坡穩(wěn)定性中的應(yīng)用
由于影響邊坡穩(wěn)定的因素的多樣性和不確定性,這些影響因素和邊坡穩(wěn)定性之間的關(guān)系非常復(fù)雜,所以邊坡工程是一個(gè)極其復(fù)雜的非線性系統(tǒng)。而人工神經(jīng)網(wǎng)絡(luò)通過人工神經(jīng)元之間的連接來獲取網(wǎng)絡(luò)信息,它能解決復(fù)雜的非線性問題,所以人工神經(jīng)網(wǎng)絡(luò)在邊坡工程穩(wěn)定性中的應(yīng)用是非常必要的。通過對(duì)現(xiàn)實(shí)中的邊坡工程進(jìn)行學(xué)習(xí),人工神經(jīng)網(wǎng)絡(luò)把學(xué)習(xí)得到的結(jié)果儲(chǔ)存起來,并作為網(wǎng)絡(luò)的權(quán)值。輸入影響邊坡工程穩(wěn)定性的各種因素,包括定性和定量因素,通過人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)的計(jì)算和處理,就會(huì)輸出邊坡穩(wěn)定性的實(shí)際情況,人工神經(jīng)網(wǎng)絡(luò)就會(huì)建立影響邊坡穩(wěn)定性的因素和邊坡穩(wěn)定性現(xiàn)實(shí)情況的非線性關(guān)系。人工神經(jīng)網(wǎng)絡(luò)通過建立的這種非線性關(guān)系就能夠?qū)π碌倪吰路€(wěn)定性做出詳細(xì)準(zhǔn)確的評(píng)價(jià)。大量的應(yīng)用實(shí)例表明,通過人工神經(jīng)網(wǎng)絡(luò)對(duì)邊坡工程的穩(wěn)定性進(jìn)行評(píng)價(jià)是一種切實(shí)可行且科學(xué)合理的方法。
4 結(jié)語
通過人工神經(jīng)網(wǎng)絡(luò)在邊坡穩(wěn)定性中的應(yīng)用實(shí)例可以看出,人工神經(jīng)網(wǎng)絡(luò)對(duì)邊坡穩(wěn)定性的應(yīng)用具有較好的適應(yīng)性,并且可以準(zhǔn)確地分析和評(píng)價(jià)邊坡工程的穩(wěn)定性。影響邊坡穩(wěn)定性的定性和定量因素會(huì)被納入到人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)中,因?yàn)槿斯ど窠?jīng)網(wǎng)絡(luò)是以邊坡工程變形和破壞的實(shí)例作為主要內(nèi)容,所以學(xué)習(xí)樣本的準(zhǔn)確性和內(nèi)容的完備性決定了邊坡工程穩(wěn)定性的評(píng)價(jià)是否準(zhǔn)確,如果信息準(zhǔn)確完備,就能達(dá)到預(yù)期的效果。人工神經(jīng)網(wǎng)絡(luò)在邊坡穩(wěn)定性評(píng)價(jià)中具有很好的實(shí)用性,相信在以后的邊坡工程建設(shè)中會(huì)得到廣泛的應(yīng)用。
參考文獻(xiàn)
[1] 童樹奇.人工神經(jīng)網(wǎng)絡(luò)在邊坡工程中的應(yīng)用研究[J]. 廣東土木與建筑. 2006(09).
[2] 陳華明.基于神經(jīng)網(wǎng)絡(luò)技術(shù)的邊坡穩(wěn)定性研究[J]. 科技創(chuàng)新導(dǎo)報(bào). 2007(35).
【關(guān)鍵詞】 圖像識(shí)別技術(shù) 神經(jīng)網(wǎng)絡(luò)識(shí)別
模式識(shí)別研究的目的是用機(jī)器來模擬人的各種識(shí)別能力―比如說模擬人的視覺與聽覺能力,因此圖像識(shí)別的目的是對(duì)文字、圖像、圖片、景物等模式信息加以處理和識(shí)別,以解決計(jì)算機(jī)與外部環(huán)境直接通信這一問題??梢哉f,圖像識(shí)別的研究目標(biāo)是為機(jī)器配置視覺“器官”,讓機(jī)器具有視覺能力,以便直接接受外界的各種視覺信息。
一、圖像識(shí)別系統(tǒng)
一個(gè)圖像識(shí)別系統(tǒng)可分為四個(gè)主要部分:被識(shí)圖像、圖像信息獲取、圖像預(yù)處理、圖像特征提取、分類判決。
二、圖像識(shí)別方法
圖像識(shí)別的方法很多,可概括為統(tǒng)計(jì)(或決策理論)模式識(shí)別方法、句法(或結(jié)構(gòu))模式識(shí)別方法、模糊模式識(shí)別方法以及神經(jīng)網(wǎng)絡(luò)識(shí)別方法。重點(diǎn)介紹神經(jīng)網(wǎng)絡(luò)識(shí)別方法。
2.1神經(jīng)網(wǎng)絡(luò)識(shí)別方法
2.1.1人工神經(jīng)網(wǎng)絡(luò)的組成
人工神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱ANN)是由大量處理單元經(jīng)廣泛互連而組成的人工網(wǎng)絡(luò),用來模擬腦神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能。而這些處理單元我們把它稱作人工神經(jīng)元。
2.1.2人工神經(jīng)網(wǎng)絡(luò)的輸出
2.1.3人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
人工神經(jīng)網(wǎng)絡(luò)中,各神經(jīng)元的不同連接方式就構(gòu)成了網(wǎng)絡(luò)的不同連接模型。常見的連接模型有:前向網(wǎng)絡(luò)、從輸入層到輸出層有反饋的網(wǎng)絡(luò)、層內(nèi)有互聯(lián)的網(wǎng)絡(luò)及互聯(lián)網(wǎng)絡(luò)。
2.1.4 學(xué)習(xí)算法
1)感知器模型及其算法
算法思想:首先把連接權(quán)和閾值初始化為較小的非零隨機(jī)數(shù),然后把有n個(gè)連接權(quán)值的輸入送入網(wǎng)絡(luò)中,經(jīng)加權(quán)運(yùn)算處理后,得到一個(gè)輸出,如果輸出與所期望的有較大的差別,就對(duì)連接權(quán)值參數(shù)按照某種算法進(jìn)行自動(dòng)調(diào)整,經(jīng)過多次反復(fù),直到所得到的輸出與所期望的輸出間的差別滿足要求為止。
2)反向傳播模型及其算法
反向傳播模型也稱B-P模型,是一種用于前向多層的反向傳播學(xué)習(xí)算法。
算法思想是:B-P算法的學(xué)習(xí)目的是對(duì)網(wǎng)絡(luò)的連接權(quán)值進(jìn)行調(diào)整,使得調(diào)整后的網(wǎng)絡(luò)對(duì)任一輸入都能得到所期望的輸出。學(xué)習(xí)過程包括正向傳播和反向傳播。正向傳播用于對(duì)前向網(wǎng)絡(luò)進(jìn)行計(jì)算,即對(duì)某一輸入信息,經(jīng)過網(wǎng)絡(luò)計(jì)算后求出它的輸出結(jié)果;反向傳播用于逐層傳遞誤差,修改神經(jīng)元之間的連接權(quán)值,使網(wǎng)絡(luò)最終得到的輸出能夠達(dá)到期望的誤差要求。
B-P算法的學(xué)習(xí)過程如下:
第一步:選擇一組訓(xùn)練樣例,每一個(gè)樣例由輸入信息和期望的輸出結(jié)果兩部分組成;第二步:從訓(xùn)練樣例集中取出一樣例,把輸入信息輸入到網(wǎng)絡(luò)中;第三步:分別計(jì)算經(jīng)神經(jīng)元處理后的各層節(jié)點(diǎn)的輸出;第四步:計(jì)算網(wǎng)絡(luò)的實(shí)際輸出和期望輸出的誤差;第五步:從輸出層反向計(jì)算到第一個(gè)隱層,并按照某種原則(能使誤差向減小方向發(fā)展),調(diào)整網(wǎng)絡(luò)中各神經(jīng)元的權(quán)值;第六步:對(duì)訓(xùn)練樣例集中的每一個(gè)樣例重復(fù)一到五的步驟,直到誤差達(dá)到要求時(shí)為止。
3)Hopfield模型及其學(xué)習(xí)算法
它是一種反饋型的神經(jīng)網(wǎng)絡(luò),在反饋網(wǎng)絡(luò)中,網(wǎng)絡(luò)的輸出要反復(fù)地作為輸入再送入網(wǎng)絡(luò)中,使得網(wǎng)絡(luò)具有了動(dòng)態(tài)性,因此網(wǎng)絡(luò)的狀態(tài)在不斷的改變之中。
算法思想是:
(a) 設(shè)置互連權(quán)值
其中xis是s類樣例的第i個(gè)分量,它可以為1或0,樣例類別數(shù)為m,節(jié)點(diǎn)數(shù)為n。
(b) 未知類別樣本初始化。 Yi(0)=Xi 0≤i≤n-1
其中Yi(t)為節(jié)點(diǎn)I在t時(shí)刻的輸出,當(dāng)t=0時(shí),Yi(0)就是節(jié)點(diǎn)I的初始值,Xi為輸入樣本的第I個(gè)分量。
(c) 迭代直到收斂
關(guān)鍵詞 人工神經(jīng)網(wǎng)絡(luò)模型,人工語法學(xué)習(xí),自動(dòng)聯(lián)系者,序列學(xué)習(xí),簡(jiǎn)單循環(huán)網(wǎng)絡(luò)。
分類號(hào) B842
1 引言
人工神經(jīng)網(wǎng)絡(luò)模型(Artificial Neural Network Model,簡(jiǎn)稱ANN),顧名思義,就是用人造的程序、機(jī)械或設(shè)備來模擬人腦神經(jīng)網(wǎng)絡(luò)的模型。人工神經(jīng)網(wǎng)絡(luò)模型的用途有二:(1)發(fā)明基于神經(jīng)網(wǎng)絡(luò)的人工智能系統(tǒng),來模擬人的學(xué)習(xí)、記憶、推理等智能活動(dòng),以服務(wù)于人類的現(xiàn)實(shí)生活;(2)構(gòu)建各種心理活動(dòng)和心理過程的模型,以為各種心理學(xué)理論提供支持。前者是自動(dòng)化、通信、制造、經(jīng)濟(jì)領(lǐng)域關(guān)注的,我們平時(shí)所見的語音識(shí)別、經(jīng)濟(jì)領(lǐng)域使用的股票走勢(shì)預(yù)測(cè)等智能系統(tǒng)大多是基于人工神經(jīng)網(wǎng)絡(luò)模型研制出來的。而后者則是心理學(xué)家所關(guān)注的領(lǐng)域。至今,人工神經(jīng)網(wǎng)絡(luò)模型已被用來模擬諸如知覺、記憶、學(xué)習(xí)、判斷等各種心理活動(dòng),以解釋矛盾的實(shí)驗(yàn)數(shù)據(jù),為有關(guān)的心理學(xué)理論提供豐富的證據(jù)。
和其他領(lǐng)域的研究者們一樣,內(nèi)隱學(xué)習(xí)領(lǐng)域的研究者們也注意到了這一行之有效的工具。Cleeremans(1993)指出根據(jù)已有的內(nèi)隱學(xué)習(xí)理論構(gòu)造人工神經(jīng)網(wǎng)絡(luò)模型,將模型的輸出數(shù)據(jù)與人類被試的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行比較,能為原有的理論觀點(diǎn)提供證據(jù)[1]。Dienes和Perner(1996)也有類似的看法[2]。然而,在發(fā)揮人工神經(jīng)網(wǎng)絡(luò)模型在內(nèi)隱學(xué)習(xí)研究上的功效之前,必須解決如下問題:人工神經(jīng)網(wǎng)絡(luò)模型是否正如Cleeremans等所言適用于內(nèi)隱學(xué)習(xí)研究?如果是,用哪類人工神經(jīng)網(wǎng)絡(luò)模型來模擬內(nèi)隱學(xué)習(xí)?
2 人工神經(jīng)網(wǎng)絡(luò)模型的工作原理及其研究?jī)?nèi)隱學(xué)習(xí)的適用性
人工神經(jīng)網(wǎng)絡(luò)模型之所以適用于內(nèi)隱學(xué)習(xí),是因?yàn)樗幕竟ぷ髟砗蛢?nèi)隱學(xué)習(xí)的兩個(gè)本質(zhì)特征有著驚人的相似。
2.1 人工神經(jīng)網(wǎng)絡(luò)模型的工作原理
早在20世紀(jì)40年代,便有研究者對(duì)人工神經(jīng)網(wǎng)絡(luò)模型的工作原理做了最初的嘗試。1943年,McCulloch和Pitts用類似“開關(guān)”的閾限邏輯單元(Threshold Logic Unit)**來模擬神經(jīng)元,并將多個(gè)這樣的單元以相等的強(qiáng)度(權(quán)重)連接起來,形成網(wǎng)絡(luò),這就是著名的MP模型[3]。1949年,Hebb在論述條件反射的形成時(shí),無意間提到了神經(jīng)元間連接強(qiáng)度更新的重要法則,即兩個(gè)彼此相連的神經(jīng)元同時(shí)激活或同時(shí)抑制,都能增加神經(jīng)元間的連接強(qiáng)度,后人稱此為Hebb法則[4]。然而,MP模型和Hebb法則都不能構(gòu)成真正意義**上的神經(jīng)網(wǎng)絡(luò)模型,雖然,MP模型已經(jīng)具備將多個(gè)神經(jīng)元連接起來,形成網(wǎng)絡(luò)的雛形,但是由于不同單元間的連接強(qiáng)度相等,且恒定不可變化,MP模型不具備人工神經(jīng)網(wǎng)絡(luò)的基本特征――學(xué)習(xí)性;而Hebb雖然提出了權(quán)重變化的一條有效法則,但卻未將其應(yīng)用到人工神經(jīng)網(wǎng)絡(luò)中來。真正將神經(jīng)元連接成網(wǎng)絡(luò)的思想與借助于權(quán)重更新使網(wǎng)絡(luò)具有學(xué)習(xí)性的思想綜合在一起的要屬Rosenblatt。
Rosenblatt(1958)提出了第一個(gè)真正意義上的人工神經(jīng)網(wǎng)絡(luò)模型――感知器(Perceptron)[5]。其基本工作原理為:整個(gè)感知器由多個(gè)不同層次的加工單元組成,每個(gè)加工單元的功能類似于單個(gè)神經(jīng)元或一組神經(jīng)元,它能接收來自前一層的幾個(gè)加工單元的激活,并綜合這些激活,對(duì)此進(jìn)行簡(jiǎn)單運(yùn)算(例如:判斷總激活量是否達(dá)到某一閾限),然后將運(yùn)算的結(jié)果傳遞給下一層的加工單元。第一層單元的激活模式反映了外部刺激狀態(tài),即模型的輸入,而最后一層單元的激活模式則為模型的輸出反應(yīng)。某個(gè)單元對(duì)下一層的另一個(gè)單元的影響取決于兩個(gè)單元之間連接的強(qiáng)度(權(quán)重)。為了在給定輸入的情況下,使模型獲得類似于人類被試的輸出反應(yīng),必須不停地調(diào)節(jié)單元與單元間的連接權(quán)重。所以,在構(gòu)建合適的人工神經(jīng)網(wǎng)絡(luò)模型時(shí),研究者往往會(huì)先設(shè)置一系列初始權(quán)重,然后不斷地給予模型不同的輸入模式,在每個(gè)特定輸入后,比較模型輸出與正確輸出間的差異,并據(jù)此調(diào)整單元間的連接權(quán)重,這一過程不斷進(jìn)行,直到模型輸出和正確輸出間的差異達(dá)到最小值,此時(shí),模型便完成了整個(gè)學(xué)習(xí)過程。圖1為一個(gè)典型感知器的例子,它旨在判斷呈現(xiàn)于視網(wǎng)膜的光條是垂直的還是水平的。整個(gè)感知器由3個(gè)加工單元層組成,第一層為網(wǎng)膜層,即將整個(gè)視網(wǎng)膜分割為10×10的網(wǎng)格,用每個(gè)網(wǎng)膜單元對(duì)應(yīng)于一個(gè)網(wǎng)格,共100個(gè)單元,當(dāng)光條落
圖1 感知器例子(資料來源:文獻(xiàn)[3])
在視網(wǎng)膜的某幾個(gè)網(wǎng)格上時(shí),這些網(wǎng)格所對(duì)應(yīng)的網(wǎng)膜單元被激活。第二層為聯(lián)系層,其中的每個(gè)單元總是和某些網(wǎng)膜單元間存在興奮或抑制連接,不論興奮還是抑制連接,強(qiáng)度都是恒定的1或-1,當(dāng)與聯(lián)系單元連接的網(wǎng)膜單元的總激活量達(dá)到聯(lián)系單元的激活閾限時(shí),聯(lián)系單元被激活,例如圖1,Aj的接收到的總激活量為1+1+1-1=2,如果Aj的閾限為2,那么2=2,Aj被激活。第三層為反應(yīng)層,其中只包括一個(gè)反應(yīng)單元,它與所有的聯(lián)系單元連接,連接權(quán)重為Wj,其中,j表示第j個(gè)聯(lián)系單元。反應(yīng)單元將綜合來自聯(lián)系單元的激活信息,即將每個(gè)聯(lián)系單元的激活量乘以它們之間的連接權(quán)重,然后簡(jiǎn)單求和,得出總激活量,并判斷激活是否達(dá)到閾限,公式表示如下:
aR為反應(yīng)單元的激活水平,aj為聯(lián)系單元的激活水平,θ為閾限值。如果,總激活量達(dá)到反應(yīng)單元的閾限,反應(yīng)單元被激活(激活量為1),感知器決定光條為垂直,否則,反應(yīng)單元不被激活(激活量為0),感知器反應(yīng)光條為水平。當(dāng)然,感知器必須經(jīng)過一個(gè)漫長(zhǎng)的學(xué)習(xí)階段,才能完成這一簡(jiǎn)單的判斷任務(wù)。在學(xué)習(xí)階段,感知器接受各種不同的水平和垂直光條刺激,并一一做出反應(yīng),當(dāng)反應(yīng)正確時(shí),連接權(quán)重不做任何調(diào)整,一旦反應(yīng)錯(cuò)誤,感知器會(huì)自動(dòng)調(diào)整聯(lián)系單元與反應(yīng)單元間的權(quán)重,比如:當(dāng)反應(yīng)單元的激活量為0時(shí),而實(shí)際光條為垂直,說明反應(yīng)單元所接收到的總激活量小于閾限,此時(shí),則應(yīng)增大那些被激活的聯(lián)系單元與反應(yīng)單元間的連接權(quán)重,以提高總激活量,使其更有可能達(dá)到閾限,致使在下次刺激呈現(xiàn)時(shí),感知器更易做出正確反應(yīng)。當(dāng)然,Rosenblatt的感知器除了能調(diào)整權(quán)重外,還會(huì)調(diào)整反應(yīng)單元閾限。這種通過逐步調(diào)整連接權(quán)重和閾限,以減少感知器反應(yīng)和正確反應(yīng)間的差距的方法就是著名的感知器收斂法則(perceptron convergence rule)。不過,調(diào)整閾限的方法對(duì)于擁有多個(gè)反應(yīng)單元的模型來說過于復(fù)雜,所以未被以后的人工神經(jīng)網(wǎng)絡(luò)模型采納。
可見,Rosenblatt的貢獻(xiàn)是卓越的,他給出了人工神經(jīng)網(wǎng)絡(luò)的基本工作原理,基于感知器收斂法則發(fā)展而來的delta法則與斜率遞減(gradient descent)法已成為如今人工神經(jīng)網(wǎng)絡(luò)最主要的算法,本文第3點(diǎn)中將對(duì)此做詳細(xì)介紹。然而,值得注意的一點(diǎn)是感知器僅在聯(lián)系層和反應(yīng)層間使用了權(quán)重概念,學(xué)習(xí)過程也僅發(fā)生在這兩層之間,所以從本質(zhì)上講,感知器只屬于包含一個(gè)輸入層和一個(gè)輸出層的單層網(wǎng)絡(luò)(single layer network),這種單層網(wǎng)絡(luò)在解決某些實(shí)際問題時(shí),遇到了障礙。Minsky等(1969)指出感知器甚至無法模擬諸如XOR(異或)等簡(jiǎn)單運(yùn)算[3]。因此,在接下來的將近20年中,人工神經(jīng)網(wǎng)絡(luò)的發(fā)展一度進(jìn)入低迷期。直到80年代中期,逆向傳導(dǎo)法(back propagation)[6]、自動(dòng)聯(lián)系者(atuoassociator)[7]、循環(huán)模型(recurrent model)[8,9]一一提出,多層網(wǎng)絡(luò)廣泛應(yīng)用智能模擬任務(wù)中,人工神經(jīng)網(wǎng)絡(luò)才得以迅速發(fā)展。然而,這些算法和模型的基本工作原理與最初的感知器卻并無兩樣。
2.2 人工神經(jīng)網(wǎng)絡(luò)模型研究?jī)?nèi)隱學(xué)習(xí)的適用性
如上述,人工神經(jīng)網(wǎng)絡(luò)的工作原理為通過調(diào)整權(quán)重逐步學(xué)會(huì)正確反應(yīng)。那么,這些基于調(diào)整權(quán)重來學(xué)習(xí)正確反應(yīng)的人工神經(jīng)網(wǎng)絡(luò)模型是否適于研究?jī)?nèi)隱學(xué)習(xí)呢??jī)?nèi)隱學(xué)習(xí)這一概念強(qiáng)調(diào)的是兩個(gè)特征:第一,它是學(xué)習(xí)的一種形式;第二,這種學(xué)習(xí)是內(nèi)隱的、無需意識(shí)努力的。人工神經(jīng)網(wǎng)絡(luò)的工作原理極好地匹配了這兩個(gè)特征。首先,要建立針對(duì)某一心理活動(dòng)的合適的網(wǎng)絡(luò)模型,必須要經(jīng)過長(zhǎng)期的訓(xùn)練和學(xué)習(xí)過程,即向模型呈現(xiàn)許多刺激,要求其做出反應(yīng),并將模型反應(yīng)與要求的正確反應(yīng)進(jìn)行比較,據(jù)此逐步調(diào)整內(nèi)部結(jié)構(gòu),使模型在以后的刺激情景中,更易做出正確反應(yīng)。這種學(xué)習(xí)過程和人類的學(xué)習(xí)有著驚人的相似,人類在幼年時(shí),雖然腦神經(jīng)已發(fā)展完全,但是他們?nèi)匀徊荒軋?zhí)行各種認(rèn)知任務(wù),這時(shí)候的人腦就好比初始狀態(tài)的神經(jīng)網(wǎng)絡(luò)模型,雖然,已對(duì)模型基本結(jié)構(gòu)做了設(shè)定(比如,模型由幾個(gè)加工單元層組成,每層有幾個(gè)單元,哪些單元和哪些單元間存在聯(lián)系),但是由于所有的連接權(quán)重都是隨機(jī)設(shè)置的,模型不知道刺激與反應(yīng)間的聯(lián)系,常常會(huì)給出錯(cuò)誤反應(yīng),而當(dāng)經(jīng)過幾年的學(xué)習(xí)之后,人類嬰孩不斷地從外界接收刺激,做出反應(yīng),并接收來自外界的反饋,將之與自己的反應(yīng)做比較,逐步通過內(nèi)部結(jié)構(gòu)的改變,來調(diào)整自己的行為,從而能夠知覺事物、理解言語、控制自身的機(jī)體運(yùn)動(dòng),這就好比初始狀態(tài)的網(wǎng)絡(luò)模型,能夠通過調(diào)整權(quán)重,達(dá)到穩(wěn)定狀態(tài),對(duì)刺激模式做出正確反應(yīng)??梢?,人工神經(jīng)網(wǎng)絡(luò)模型很好地匹配了內(nèi)隱學(xué)習(xí)地第一個(gè)特征――兩者都是學(xué)習(xí)過程。其次,內(nèi)隱學(xué)習(xí)強(qiáng)調(diào)學(xué)習(xí)是內(nèi)隱地進(jìn)行的。由于無法直接探索學(xué)習(xí)過程是否是內(nèi)隱的,研究者往往通過驗(yàn)證學(xué)習(xí)中所獲得的知識(shí)是內(nèi)隱的來間接推斷學(xué)習(xí)過程是內(nèi)隱的,當(dāng)被試在分類或選擇任務(wù)中的表現(xiàn)高于隨機(jī),卻不知道自己是依據(jù)何種知識(shí)做出正確判斷時(shí),習(xí)得的知識(shí)被認(rèn)為是內(nèi)隱的,從而進(jìn)一步推斷學(xué)習(xí)過程也是內(nèi)隱的[10~12]。人工神經(jīng)網(wǎng)絡(luò)模型也一樣,從根據(jù)輸出結(jié)構(gòu)來調(diào)整權(quán)重的過程來看,根本無法判斷學(xué)習(xí)過程是否是內(nèi)隱的,而類似的,人工神經(jīng)網(wǎng)絡(luò)的知識(shí)表征形式顯示神經(jīng)網(wǎng)絡(luò)模型所獲得的知識(shí)很有可能是內(nèi)隱的。當(dāng)人工神經(jīng)網(wǎng)絡(luò)能做到正確反應(yīng)時(shí),指導(dǎo)模型該如何反應(yīng)的知識(shí)似乎是存在于單元的組織結(jié)構(gòu)和他們之間的連接權(quán)重上,根本無法直接從這種無序而雜亂的結(jié)構(gòu)和權(quán)重上看出什么規(guī)則,例如:上述判斷光條垂直和水平的感知器,我們并無法從直觀上判斷哪些單元表征垂直光條,哪些單元表征水平光條,這種知識(shí)表征形式很有可能是內(nèi)隱的。這種知識(shí)的表征形式被稱為分布式表征(distributed representation),它和傳統(tǒng)的局部表征(local representation)很不一樣,局部表征中,每個(gè)用不同的單元表征不同的事物,例如:?jiǎn)卧?表征事物1,單元2表征事物2……,在知識(shí)提取時(shí),就好比查字典一樣,根據(jù)不同的事物,找到表征的位置,便可以獲悉有關(guān)事物的各種知識(shí)。而分布表征可以將不同的事物表征在同一組單元中,比如垂直光條和水平光條,在知識(shí)提取時(shí),往往只需輸入新刺激的內(nèi)容,比如光條激活了視網(wǎng)膜的哪些區(qū)域,便能根據(jù)內(nèi)容找到合適的反應(yīng)。
3 廣泛應(yīng)用于內(nèi)隱學(xué)習(xí)領(lǐng)域的兩種人工神經(jīng)網(wǎng)絡(luò)模型
人工神經(jīng)網(wǎng)絡(luò)模型很好地匹配內(nèi)隱學(xué)習(xí)的兩大基本特征。因此,許多研究者針對(duì)不同的內(nèi)隱學(xué)習(xí)任務(wù),選擇不同的人工神經(jīng)網(wǎng)絡(luò)模型來擬合內(nèi)隱學(xué)習(xí)過程,以探討內(nèi)隱學(xué)習(xí)的本質(zhì)和機(jī)制[13~17]。
縱觀近40年來的內(nèi)隱學(xué)習(xí)研究,雖然不同的研究者開發(fā)了許多不同的任務(wù)形式,獲得了許多可喜的研究成果,但是這些任務(wù)都離不開兩種根本的任務(wù)形式――人工語法學(xué)習(xí)和序列學(xué)習(xí)。相應(yīng)地,根據(jù)兩個(gè)任務(wù)的不同特點(diǎn),研究者選擇了兩種不同的模型――自動(dòng)聯(lián)系者和簡(jiǎn)單循環(huán)網(wǎng)絡(luò)(simple recurrent network,簡(jiǎn)稱SRN)――分別對(duì)之加以模擬。
3.1 人工語法學(xué)習(xí)與自動(dòng)聯(lián)系者
人工語法學(xué)習(xí)任務(wù)通常是:在學(xué)習(xí)階段,要求被試在不知道內(nèi)在規(guī)則的情況下記憶一大堆合法字符串,然后,在測(cè)試階段,向被試呈現(xiàn)一批新的合法和非法字符串,并告知前面學(xué)習(xí)的字符串是一類符合語法規(guī)則的合法字符串,要求被試根據(jù)前面的學(xué)習(xí),判斷新的字符串是否合法[10]。從測(cè)試階段的要求、學(xué)習(xí)階段的要求和所學(xué)習(xí)的知識(shí)這三個(gè)不同的角度來看,人工語法學(xué)習(xí)具有三個(gè)主要特征:
第一,測(cè)試階段要求被試進(jìn)行的是一項(xiàng)典型的分類任務(wù)。相應(yīng)地,檢索1943年以來,人工神經(jīng)網(wǎng)絡(luò)模型發(fā)展的這段歷史,便可以發(fā)現(xiàn)只有模式聯(lián)系者(pattern associator)是專門針對(duì)模式識(shí)別和分類而開發(fā)出來的模型。模式聯(lián)系者的誕生源自于條件反射的思想,即建立刺激和反應(yīng)間的聯(lián)系。用模式聯(lián)系者的話說,就是對(duì)于特定的輸入刺激模式,給出相應(yīng)的反應(yīng)模式。有趣的是,當(dāng)用一組單元表示輸入模式,另一組單元表示輸出模式,它們兩兩連接在一起(如圖2),并使用Hebb法則Wij=εαiαi更新權(quán)重時(shí)(其中,ΔWij為輸入單元j和輸出單元i之間權(quán)重的變化量,ε為學(xué)習(xí)速率,是常數(shù),aWi為輸出單元的激活量,aWj為輸入單元的激活量),模式聯(lián)系者便能在同一個(gè)模型中存儲(chǔ)不同的輸入模式,將反應(yīng)模式相同的輸入模式歸于同一類,并且當(dāng)模式中的某些量缺失時(shí),比如某個(gè)輸入單元損壞,模型仍能正常運(yùn)行[3]??梢?,模式聯(lián)系者能夠有效地模擬分類任務(wù),甚至是某些腦神經(jīng)受損病人(相當(dāng)于某些輸入或輸出單元受損)的分類活動(dòng)。然而,人工語法學(xué)習(xí)并不僅是單純的分類任務(wù),它還具有其他特征,因此,只模擬測(cè)試階段的分類任務(wù)是遠(yuǎn)遠(yuǎn)不夠的。
第二,人工語法學(xué)習(xí)的另一個(gè)特征是,學(xué)習(xí)階段要求被試在沒有任何指導(dǎo)(反饋)的情況下學(xué)習(xí)字符串,即并沒有在被試學(xué)習(xí)某一字符串的同時(shí),告訴他們這一字符串屬于哪一類,合法還是非法。投射到模式聯(lián)系者中,就是在學(xué)習(xí)對(duì)特定刺激模式的分類時(shí),不伴隨相應(yīng)的反應(yīng)模式,即沒有輸出單元。事實(shí)上,人類的許多學(xué)習(xí)過程都是在沒有外部指導(dǎo)的情況下進(jìn)行的。比方說,當(dāng)孩子看到麻雀和燕子(刺激模式)時(shí),家長(zhǎng)告訴他這是鳥(反應(yīng)模式),但很多時(shí)候,家長(zhǎng)并不在身邊,比如,當(dāng)孩子看到鴿子時(shí),沒有外在反應(yīng)模式指導(dǎo),孩子仍能反應(yīng)為鳥,人類似乎能夠在沒有外在的反應(yīng)模式引導(dǎo)教育的情況下,學(xué)會(huì)分類。人工語法學(xué)習(xí)也是一樣,雖然在學(xué)習(xí)時(shí),沒有被告知哪些合法,哪些不合法,但是被試仍能學(xué)會(huì)分類規(guī)則。這些事實(shí)提示研究者:必須開發(fā)一種沒有外在引導(dǎo)者的自適應(yīng)模型。于是,McClelland 和Rumelhart(1985)在對(duì)模式聯(lián)系者稍做調(diào)整的基礎(chǔ)上,提出了模式聯(lián)系者的一個(gè)自適應(yīng)特例――自動(dòng)聯(lián)系者[7]。由于沒有外部引導(dǎo),任何自適應(yīng)模型必須具備自我反饋的功能,自動(dòng)聯(lián)系者也一樣,如圖3所示,每個(gè)單元除了接收外部輸入(e)以外,還必須接收來自其他單元的內(nèi)部輸入(i),這種存在內(nèi)部反饋的模型被稱為循環(huán)模型。為了達(dá)到分類的目的,自動(dòng)聯(lián)系者旨在再現(xiàn)單元的外部輸入模式,就好像人工語法學(xué)
圖3 含有8個(gè)單元的自動(dòng)聯(lián)系者(資料來源:文獻(xiàn)[7])
習(xí)中,記憶字符串一樣。而為了達(dá)到這一點(diǎn),必須調(diào)節(jié)連接權(quán)重,使單元的內(nèi)部輸入能匹配外部輸入,用公式表示為:
aWj為單元j的激活量。雖然,自動(dòng)聯(lián)系者模型沒有可比對(duì)的反應(yīng)模式,但是,上述算法的核心仍是用內(nèi)部狀態(tài)去匹配外部狀態(tài),盡量減少兩者間的差異,因此,上述公式仍可看成delta法則*的變式。當(dāng)然,除了使用delta法則來訓(xùn)練自動(dòng)聯(lián)系者外,也有研究者(例如,文獻(xiàn)[14])使用類似模式聯(lián)系者的Hebb法則訓(xùn)練該模型。和模式聯(lián)系者一樣,自動(dòng)聯(lián)系者也能習(xí)得不同的外部輸入模式,并對(duì)此做出分類。可見,自動(dòng)聯(lián)系者能夠很好地模擬人工語法學(xué)習(xí)任務(wù)學(xué)習(xí)和測(cè)試階段的表面屬性――無外部引導(dǎo)的分類學(xué)習(xí)任務(wù)。然而,它是否能模擬語法學(xué)習(xí)這一內(nèi)部屬性呢?
第三,人工語法學(xué)習(xí)的本質(zhì)特征在于所獲得的是有關(guān)語法的知識(shí)。雖然,如前所述,自動(dòng)聯(lián)系者獲得的是一種無法外顯的分布性表征的知識(shí),但是,有意思的是這種表征似乎代表了某一類別的原型。而原型或許就好比語法的抽象表示方法。McClelland 和Rumelhart(1985)曾構(gòu)建了一個(gè)由24個(gè)單元組成的自動(dòng)聯(lián)系者,將一些有關(guān)狗的信息輸入這24個(gè)單元[7],其中前8個(gè)單元輸入的是狗的名字信息,后16個(gè)單元輸入的是狗的外貌信息,結(jié)果發(fā)現(xiàn)經(jīng)過訓(xùn)練后,模型的權(quán)重矩陣呈現(xiàn)出特殊的構(gòu)造,即前8個(gè)單元之間及前3個(gè)單元與后16個(gè)單元間的權(quán)重處于隨機(jī)水平,而后16個(gè)單元間的權(quán)重卻出現(xiàn)某種固定的模式,McClelland和Rumelhart認(rèn)為這種固定的模式就是狗視覺表象的原型。雖然,無法從這種固定的權(quán)重模式中,看出典型的狗應(yīng)該具有哪些特征,但是至少可以認(rèn)為,如果兩個(gè)單元間的連接權(quán)重比較大,那么當(dāng)這兩個(gè)單元同時(shí)被激活時(shí),模型有可能將目標(biāo)判斷為狗。也就是說,原型所表征的是每個(gè)視覺特征間的聯(lián)系。這就好比,人工語法學(xué)習(xí)中的語法知識(shí),語法或許是由字母間的聯(lián)系所表征的。所以,從這點(diǎn)意義上來,自動(dòng)聯(lián)系者習(xí)得的原型或許就是語法知識(shí)。
3.2 序列學(xué)習(xí)和簡(jiǎn)單循環(huán)網(wǎng)絡(luò)
序列學(xué)習(xí)任務(wù)要求被試對(duì)一系列規(guī)則序列進(jìn)行選擇反應(yīng),其假設(shè)為:如果被試習(xí)得了序列間存在的固定規(guī)則,則他們可以依據(jù)前面呈現(xiàn)的序列來預(yù)測(cè)下一個(gè)項(xiàng)目是什么,成功的預(yù)測(cè)將會(huì)縮短被試的反應(yīng)時(shí)[11]。序列學(xué)習(xí)和人工語法學(xué)習(xí)之間的本質(zhì)區(qū)別在于:它是一項(xiàng)預(yù)測(cè)任務(wù),而非分類任務(wù),被試對(duì)某一項(xiàng)目的反應(yīng)依賴于前面的項(xiàng)目。
1990年,Elman開發(fā)了簡(jiǎn)單循環(huán)網(wǎng)絡(luò),專門用來模擬這類預(yù)測(cè)任務(wù)[9]。簡(jiǎn)單循環(huán)網(wǎng)絡(luò)的目的是根據(jù)當(dāng)前輸入的項(xiàng)目來預(yù)測(cè)下一個(gè)項(xiàng)目,它的基本結(jié)構(gòu)如圖4所示,由4個(gè)加工單元層組成,它們分別是輸入單元層、隱含單元層、上下文單元層和輸出單元層。輸入單元層用于表征當(dāng)前輸入的項(xiàng)目,輸出單元層用于表征模型所預(yù)測(cè)的項(xiàng)目,上下文單元層用于表征在當(dāng)前項(xiàng)目之前出現(xiàn)的項(xiàng)目序列,而隱含單元層負(fù)責(zé)在輸入、輸出和上下文單元層間的信息傳遞。簡(jiǎn)單循環(huán)網(wǎng)絡(luò)的工作原理為:在接收第一
圖4 簡(jiǎn)單循環(huán)網(wǎng)絡(luò)的基本結(jié)構(gòu)(資料來源:文獻(xiàn)[16])
個(gè)項(xiàng)目時(shí),輸入層中的某些單元被激活,并將激活傳遞給隱含層中的單元,隱含層除了將激活進(jìn)一步傳遞給輸出層,由輸出層預(yù)測(cè)第二個(gè)項(xiàng)目外,還將自己的激活水平復(fù)制于上下文層,當(dāng)接收第二個(gè)項(xiàng)目時(shí),隱含層除了收到來自輸入層的激活外,還將收到來自上下文層的激活,因此,它向輸出層傳遞的激活則包含了第一和第二兩個(gè)項(xiàng)目的信息,依此類推,輸出層所做出的預(yù)測(cè)是基于包含當(dāng)前項(xiàng)目之內(nèi)的所有項(xiàng)目的信息。當(dāng)然,和其他許多人工神經(jīng)網(wǎng)絡(luò)模型一樣,簡(jiǎn)單循環(huán)模型依據(jù)delta法則來調(diào)整權(quán)重的,即將模型給出的預(yù)測(cè)與真實(shí)出現(xiàn)的后續(xù)項(xiàng)目進(jìn)行比較,來調(diào)整權(quán)重。不過,簡(jiǎn)單循環(huán)網(wǎng)絡(luò)所使用的delta法則和自動(dòng)聯(lián)系者有兩點(diǎn)差異:(1)權(quán)重調(diào)整是通過斜率遞減法進(jìn)行的,即尋求預(yù)測(cè)反應(yīng)和真實(shí)項(xiàng)目之間誤差方差的最小值,用公式表示為:
其中,tout為真實(shí)的正確輸出,aout為模型的預(yù)測(cè)輸出;(2)不同于自動(dòng)聯(lián)系者,簡(jiǎn)單循環(huán)網(wǎng)絡(luò)是多層模型,當(dāng)調(diào)整輸出層單元和隱含層單元間的權(quán)重時(shí),計(jì)算預(yù)測(cè)和真實(shí)項(xiàng)目間的誤差方差是可以直接計(jì)算獲得的,然而當(dāng)要調(diào)整隱含層單元與輸入層單元或上下文層單元間的權(quán)重時(shí),由于不存在真實(shí)的正確反應(yīng),誤差方差則無從計(jì)算,所以Rumelhart和McClelland(1986)提出可以用輸出層單元的誤差來估計(jì)隱含層單元的誤差,即某一隱含單元的誤差為所有與之連接的輸出層單元的誤差與它們之間權(quán)重乘積求和的函數(shù)[6]
然后,同樣用斜率遞減法求出權(quán)重的變化量,這種誤差計(jì)算的法則和簡(jiǎn)單循環(huán)網(wǎng)絡(luò)中原有的信息流方向正好相反,所以又被稱為逆向推導(dǎo)。
簡(jiǎn)單循環(huán)網(wǎng)絡(luò)能有效地模擬序列學(xué)習(xí)中的預(yù)測(cè)機(jī)制,因此,它剛提出不久,就被用于模擬內(nèi)隱序列學(xué)習(xí),用來研究序列學(xué)習(xí)的抽象性等問題[13,15,16]。
總之,針對(duì)不同的內(nèi)隱學(xué)習(xí)任務(wù),為了得到更佳的模擬效果,研究者往往傾向于選擇不同人工神經(jīng)網(wǎng)絡(luò)模型加以模擬。然而,就像是任務(wù)之間的劃分并不絕對(duì)一樣(比如:Cleeremans等就曾將人工語法和序列學(xué)習(xí)結(jié)合在同一個(gè)任務(wù)中),神經(jīng)網(wǎng)絡(luò)模型和內(nèi)隱學(xué)習(xí)任務(wù)間的匹配也并不絕對(duì),比如:Boucher等(2003)就層用簡(jiǎn)單循環(huán)網(wǎng)絡(luò)來模擬序列學(xué)習(xí)[17]。
4 小結(jié)
基于權(quán)重調(diào)整來學(xué)習(xí)正確反應(yīng)的人工神經(jīng)網(wǎng)絡(luò)模型和內(nèi)隱學(xué)習(xí)的兩大本質(zhì)特征間有著極優(yōu)的匹配,人工神經(jīng)網(wǎng)絡(luò)模型在內(nèi)隱學(xué)習(xí)領(lǐng)域的適用性毋庸置疑。在這樣的背景下,出于深入探討內(nèi)隱學(xué)習(xí)的目的,研究者紛紛根據(jù)不同的內(nèi)隱學(xué)習(xí)任務(wù),選用不同的人工神經(jīng)網(wǎng)絡(luò)模型對(duì)之加以模擬[18]。到目前為止,針對(duì)兩種較為普遍的內(nèi)隱學(xué)習(xí)任務(wù),也相應(yīng)地出現(xiàn)了兩種使用較為廣泛的神經(jīng)網(wǎng)絡(luò)模型――自動(dòng)聯(lián)系者和簡(jiǎn)單循環(huán)網(wǎng)絡(luò)。在實(shí)際研究中,合理地使用這兩個(gè)模型,必將為內(nèi)隱學(xué)習(xí)的理論和人工模擬提供更有力的證據(jù)。
參考文獻(xiàn)
[1] Cleeremans A. Mechanisms of Implicit Learning: Connectionist Models of Sequence Processing. In: Jeffrey L E ed. Neural Network Modeling and Connectionism. London: MIT Press, 1993
[2] Dienes Z, Perner J. Implicit knowledge in people and connectionist networks. In: Underwood G.. Implicit cognition. Oxford: Oxford University Press, 1996
[3] McLeod P, Plunkett K, Rolls E T. Introduction to Connectionist Modelling of Cognitive Processes. Oxford: Oxford University Press, 1998
[4] Milner P. A Brief History of the Hebbian Learning Rule. Canadian Psychology, 2003, 44(1): 5~9
[5] Rosenblatt F. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological Reviews, 1958, 65: 386~408
[6] Rumelhart D, McClelland J. Parallel distributed processing (vol. 1). Cambridge: MIT press, 1986a
[7] McClelland J, Rumelhart D. Distributed Memory and the Represantation of General and Specific Information. Journal of Experimental Psychology: General, 1985, 114(2): 159~188
[8] Jordan M. An introduction to linear algebra in parallel distributed processing. In: Rumelhart D, McClelland J ed. Parallel distributed processing (vol. 1). Cambridge: MIT press, 1986a. 365~422
[9] Elman J. Finding structure in time. Cognitive Science, 1990, 14(2): 179~212
[10] Reber A S. Implicit learning of artificial grammars. Journal of Verbal Learning and Verbal Behavior, 1967, 6(2): 317~327
[11] Nissen M J, Bullemer P. Attentional requirement of learning: Evidence from performance measures. Cognitive Psychology, 1987, 19(1): 1~32
[13] 郭秀艷, 鄒玉梅, 李強(qiáng)等. 中學(xué)生顏色內(nèi)隱學(xué)習(xí)特征的實(shí)驗(yàn)研究. 心理與行為研究, 2003, 1(2): 122~127
[14] Cleeremans A, McClelland J L. Learning the Structure of Event Sequence. Journal of Experimental Psychology: General, 1991, 120(3): 235~253
[15] Dienes Z. Connectionist and Memory-Array Models of Artificial Grammar Learning. Cognitive Science, 1992, 16(1): 41~79
[16] Jiménez L, Méndez C, Cleeremans A. Comparing Direct and Indirect Measures of Sequence Learning. Journal of Experimental Psychology: Learning, Memory, and Cognition, 1996, 22(4): 948~969
[17] Dienes Z, Altmann G, Gao S J. Mapping across Domains Without Feedback: A Neural Network Model of Transfer of Implicit Knowledge. Cognitive Science, 1999, 23(1): 53~82
計(jì)算智能(Computational Intelligenee,簡(jiǎn)稱CI),又稱軟計(jì)算,該詞于1992年被美國學(xué)者J.C.Bezdekek首次提出,1994年全計(jì)算智能大會(huì)明確提出了計(jì)算智能的概念,標(biāo)志著計(jì)算智能作為一門獨(dú)立學(xué)科的誕生。傳統(tǒng)的人工智能問題的處理、結(jié)論的得出都需要在建立精確的數(shù)字模型的基礎(chǔ)上才能實(shí)現(xiàn),但現(xiàn)實(shí)中有很多的數(shù)據(jù)都是模糊的,無法建立精確的模型,使得人工智能的應(yīng)用范圍相對(duì)狹窄,而計(jì)算智能則突破了人工智能的瓶頸,以模型為基礎(chǔ),模擬人的理論與方法,只需要直接輸入數(shù)據(jù),系統(tǒng)就可以對(duì)數(shù)據(jù)進(jìn)行處理,應(yīng)用范圍更加的廣泛。
計(jì)算智能的本質(zhì)是一類準(zhǔn)元算法,主要包括進(jìn)化計(jì)算,人工神經(jīng)網(wǎng)絡(luò)、模糊計(jì)算、混沌計(jì)算、細(xì)胞自動(dòng)機(jī)等,其中以進(jìn)化計(jì)算、人工神經(jīng)網(wǎng)絡(luò)及模糊系統(tǒng)為典型代表。
1.1 進(jìn)化計(jì)算 進(jìn)化計(jì)算是采用簡(jiǎn)單的編碼技術(shù)來表示各種復(fù)雜的結(jié)構(gòu),并通過遺傳操作和優(yōu)勝劣汰的自然選擇來指導(dǎo)學(xué)習(xí)和確定搜索的方向,具有操作簡(jiǎn)單、通用性強(qiáng)、效率高的優(yōu)點(diǎn),其工作原理是通過種群的方式進(jìn)行計(jì)算,借助生物進(jìn)化的思想來解決問題,分為遺傳算法、進(jìn)化規(guī)劃及進(jìn)化策略三大類。
1.2 人工神經(jīng)網(wǎng)絡(luò) 人工神經(jīng)網(wǎng)絡(luò)是一個(gè)高度復(fù)雜的非線性動(dòng)力學(xué)系統(tǒng),具有模糊推理、并行處理、自訓(xùn)練學(xué)習(xí)等優(yōu)勢(shì),其工作原理是仿照生物神經(jīng)網(wǎng)絡(luò)處理信息方式,通過不同的算法和結(jié)構(gòu),將簡(jiǎn)單的人工神經(jīng)細(xì)胞相互連接,通過大量的人工神經(jīng)單元來同時(shí)進(jìn)行信息的傳播,并將信息儲(chǔ)存在改革細(xì)胞單元的連接結(jié)構(gòu)中,快速地得到期望的計(jì)算結(jié)構(gòu)。生物神經(jīng)網(wǎng)絡(luò)的細(xì)胞是在不斷的生成和更新著的,即部分細(xì)胞壞死,整個(gè)神經(jīng)網(wǎng)絡(luò)仍能維持正常的運(yùn)轉(zhuǎn)秩序而不會(huì)驟然崩潰,同樣人工神經(jīng)網(wǎng)絡(luò)也有著這樣的特性,即使部分神經(jīng)細(xì)胞發(fā)生問題,整個(gè)網(wǎng)絡(luò)也能夠正常的運(yùn)轉(zhuǎn)。人工神經(jīng)網(wǎng)絡(luò)按照連接方式的不同分為前饋式網(wǎng)絡(luò)與反饋式網(wǎng)絡(luò),前饋式網(wǎng)絡(luò)結(jié)構(gòu)中的神經(jīng)元是單層排列的,分為輸入層、隱藏層及輸出層三層,信息的傳播是單向的,每個(gè)神經(jīng)元只與前一層的神經(jīng)元相連,即信息只能由輸出層傳向隱藏層再傳向輸入層,而不能由輸出層直接傳向輸入層;反饋式網(wǎng)絡(luò)結(jié)構(gòu)中每個(gè)人工神經(jīng)細(xì)胞都是一個(gè)計(jì)算單元,在接受信息輸入的同時(shí)還在向外界輸出著信息。不同的行業(yè)和領(lǐng)域可以根據(jù)自身的需要將不同的網(wǎng)絡(luò)結(jié)構(gòu)和學(xué)習(xí)方法相結(jié)合,建立不同的人工神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)不同的研究目的。
1.3 模糊系統(tǒng) 客觀世界中的事物都具有不同程度的不確定性,如生活中的“窮與富”、美與丑”、“相關(guān)與不相關(guān)”無法用一個(gè)界線劃分清楚,對(duì)于事物不確定研究的過程中產(chǎn)生了模糊數(shù)學(xué),所謂模糊性是指客觀事物差異的中間過渡中的“不分明性”。美國專家L.A. Zdahe教授首次運(yùn)用了數(shù)學(xué)方法描述模糊概念,自此之后模糊數(shù)學(xué)形成了一個(gè)新的學(xué)科,并在世界范圍內(nèi)發(fā)展起來,在醫(yī)學(xué)、農(nóng)業(yè)等方面得到了應(yīng)用。
2 計(jì)算智能在機(jī)械制造中的應(yīng)用
機(jī)械制造業(yè)是國民經(jīng)濟(jì)的基礎(chǔ)產(chǎn)業(yè),機(jī)械制造業(yè)的發(fā)展對(duì)于促進(jìn)工業(yè)生產(chǎn)領(lǐng)域的發(fā)展,保持經(jīng)濟(jì)穩(wěn)步增長(zhǎng),滿足人們?nèi)粘I畹男枨?,提高人們的生活質(zhì)量有著重要意義。一個(gè)國家機(jī)械制造業(yè)水平的高低是衡量該國工業(yè)化程度的重要指標(biāo)。由于研究角度的不同,機(jī)械制造業(yè)有著不同的分類,如國家統(tǒng)計(jì)局將機(jī)械制造行業(yè)分為通用設(shè)備、專用設(shè)備、交通運(yùn)輸設(shè)備、電氣設(shè)備、儀器儀表及辦公設(shè)備五大類,證券市場(chǎng)將機(jī)械制造行業(yè)分為機(jī)械、汽車及配件、電氣設(shè)備三大子行業(yè)。根據(jù)調(diào)查顯示,2013年我國制造業(yè)產(chǎn)值規(guī)模突破20萬億元,同比增長(zhǎng)17.5%,產(chǎn)值占世界比重的19.8%,經(jīng)濟(jì)總量位居世界首位,利潤(rùn)4312.6億元,增長(zhǎng)0.33%,增加值累計(jì)同比增長(zhǎng)10.4%。
隨著計(jì)算智能研究的深入,計(jì)算智能在機(jī)械制造中得到了應(yīng)用。伴隨著機(jī)械行業(yè)的飛速發(fā)展,各類生產(chǎn)安全事故也時(shí)有發(fā)生。造成安全事故的原因是多方面的,首先是操作人員安全意識(shí)淡??;其次是企業(yè)的安全管理和監(jiān)督缺失,我國相當(dāng)多的機(jī)械制造企業(yè)不重視勞動(dòng)安全衛(wèi)生方面的數(shù)據(jù)統(tǒng)計(jì)和資料積累,為了追求最大利潤(rùn)在安全生產(chǎn)方面投入的資金過少,缺乏對(duì)員工開展安全教育的培訓(xùn)。建立科學(xué)的安全生產(chǎn)評(píng)價(jià)方式對(duì)于防止各類安全事故,提高安全效益有著積極意義。人工智能的安全評(píng)價(jià)方法以線性函數(shù)為基礎(chǔ),而安全生產(chǎn)評(píng)價(jià)體系是一個(gè)復(fù)雜的系統(tǒng),涉及的內(nèi)容繁雜,需要考慮的因素很多,存在很大的不確定性,導(dǎo)致得到的結(jié)論與實(shí)際現(xiàn)場(chǎng)常常不能一致,計(jì)算智能以選擇非線性函數(shù)建立安全生產(chǎn)評(píng)價(jià)模型,實(shí)現(xiàn)對(duì)非線性函數(shù)關(guān)系的擬合,解決了這一難題。
在機(jī)械制造中存在著大量的模糊信息,如機(jī)械設(shè)備的損耗、零件設(shè)計(jì)目標(biāo)等信息都是用比較模糊的術(shù)語來表達(dá),傳統(tǒng)的人工智能進(jìn)行新的零件生產(chǎn)制造時(shí),設(shè)計(jì)人員對(duì)零件進(jìn)行設(shè)計(jì),確定零件的尺寸,然后試生產(chǎn)零件應(yīng)用在設(shè)備中,如不符合要求,再進(jìn)行調(diào)整,這就要求設(shè)計(jì)人員有著豐富的知識(shí)和實(shí)踐經(jīng)驗(yàn),能夠根據(jù)需要設(shè)計(jì)出適合的零件,而計(jì)算智能以系統(tǒng)論作為基礎(chǔ)的,對(duì)選擇的自變量進(jìn)行適當(dāng)?shù)膬?yōu)化和控制,只需要設(shè)計(jì)人員將零件的形狀、大小、作用等輸入計(jì)算機(jī),并對(duì)零件制造的程序編排,利用計(jì)算機(jī)確定零件的制造技術(shù),同時(shí)控制零件的質(zhì)量,使零件設(shè)計(jì)、制造的過程更加便捷。
本研究應(yīng)用神經(jīng)網(wǎng)絡(luò)的原理,基于BP網(wǎng)絡(luò)使用MATLAB語言建立一個(gè)剩余油分布的預(yù)測(cè)系統(tǒng)。該系統(tǒng)通過學(xué)習(xí)在地理坐標(biāo)和孔隙度之間建立一個(gè)非線性函數(shù)關(guān)系,以此來預(yù)測(cè)任何區(qū)域的孔隙度,再通過孔隙度與剩余油飽和度之間的關(guān)系達(dá)到剩余油分布預(yù)測(cè)的目的。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);剩余油分布;BP網(wǎng)絡(luò);預(yù)測(cè)
中圖分類號(hào):TP183文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)36-2706-03
BP Artificial Neural Networks for the Remaining Oil Prediction
SHI Xiao-song, CHENG Guo-jian
(School of Computer Science, Xi'an Shiyou University, Xi'an 710065, China)
Abstract: After a majority of our oilfield and secondary recovery, we just get 30% of the total reserves, which means that 60% to 70% of the remaining residual oil in the ground become remaining oil . China's 2007 crude oil output grew only by 1.6 percent to 12.872 million tons. Clarifying the law of distribution of the remaining oil and improving oil recovery is not only an economic effect, but also a National oil strategic issue.
In this study, we used MATLAB language to establish a forecast system of distribution of remaining oil based on BP network. After studying, this system can get a nonlinear function between the geographical coordinates and porosity. We can get the regional porosity using this system. Then using the relationship the porosity and the remaining oil, we can known the distribution of the remaining oil.
Key words: artificial neural networks; distribution of remaining oil; BP network; prediction
1 引言
我國多數(shù)油田經(jīng)過一次、二次采油后,僅能采出地下總儲(chǔ)量的30%左右,這意味著有60%~70%的剩余石油仍然殘留在地下成為剩余油。對(duì)剩余油分布預(yù)測(cè)的研究可以提高石油開發(fā)的效率和節(jié)約開發(fā)成本。人工神經(jīng)網(wǎng)絡(luò)是計(jì)算機(jī)中重要的一門學(xué)科,它具有自學(xué)習(xí)和自適應(yīng)的能力,可以通過預(yù)先提供的一批相互對(duì)應(yīng)的輸入-輸出數(shù)據(jù),分析掌握兩者之間潛在的規(guī)律,最終根據(jù)這些規(guī)律,用新的輸入數(shù)據(jù)來推算輸出結(jié)果。本文就是用人工神經(jīng)網(wǎng)絡(luò),基于已知的數(shù)據(jù)來預(yù)測(cè)剩余油的分布。神經(jīng)網(wǎng)絡(luò)技術(shù)有著逼近任意非線性映射的能力,通過學(xué)習(xí)獲知系統(tǒng)差分方程中的位置非線性函數(shù),這使得它在系統(tǒng)建模和預(yù)測(cè)中有著很好的應(yīng)用。
2 剩余油分布預(yù)測(cè)的研究
從20世紀(jì)80年代開始,研究剩余油分布和提高采收率問題已引起世界各石油生產(chǎn)國的普遍關(guān)注。針對(duì)剩余油分布的研究方法在各個(gè)層面都有了一定的突破。目前,剩余分布的研究方法主要有:地質(zhì)方法,油藏工程、試井及數(shù)值模擬方法和室內(nèi)實(shí)驗(yàn)技術(shù)等。
2.1 剩余油分布預(yù)測(cè)的研究現(xiàn)狀
目前,國內(nèi)外對(duì)剩余油研究的重點(diǎn)主要集中在三個(gè)方面:1)對(duì)生于有分布的描述;2)對(duì)剩余油飽和度的測(cè)量與監(jiān)測(cè)技術(shù)的研究;3)對(duì)剩余油挖潛技術(shù)的研究。
2.2 剩余油分布預(yù)測(cè)要用到的主要參數(shù)
影響剩余油分布的因素很多,通常劃分為兩類:地質(zhì)因素和開發(fā)因素。地質(zhì)因素主要包括有:油藏非均質(zhì)性、構(gòu)造、斷層等。開發(fā)因素主要包括有:注采系統(tǒng)的完善程度、注采關(guān)系和井網(wǎng)布井、成產(chǎn)動(dòng)態(tài)。前者屬于內(nèi)因,后者屬于外因。它們的綜合作用就導(dǎo)致了目前剩余油分布的多樣性。
剩余油飽和度是描述剩余油的重要概念。某種流體的飽和度是指:儲(chǔ)層巖石孔隙中某種流體所占的體積百分?jǐn)?shù)。它表示了孔隙空間為某種流體所占據(jù)的程度。巖石中由幾相流體充滿其孔隙,則這幾相流體飽和度之和就為1(100%)。隨著油田發(fā)開油層能力的衰減,即使是經(jīng)過注水侯還會(huì)在地層孔隙中存在著尚未驅(qū)盡的原油,這些油在巖石孔隙中所占體積的百分比稱為剩余油飽和度
3 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(Artifical Neural Network,ANN),亦稱為神經(jīng)網(wǎng)絡(luò)(Neural Networks,NN),是由大量處理神經(jīng)單元(神經(jīng)元Neuros)廣泛互聯(lián)而成的網(wǎng)絡(luò),是對(duì)人腦的抽象、簡(jiǎn)化和模擬,反應(yīng)人腦的基本特征。神經(jīng)網(wǎng)絡(luò)的基本功能有聯(lián)想記憶、非線性映射、分類與識(shí)別、優(yōu)化計(jì)算、知識(shí)處理等。ANN在解決復(fù)雜的或是非線性問題時(shí),具有獨(dú)特的性能。近年來,國內(nèi)外眾多學(xué)者將其應(yīng)用到石油等領(lǐng)域,取得了不少成果。人工神經(jīng)網(wǎng)絡(luò)具有以下幾個(gè)特征:1)并行分布處理;2)非線性映射; 3)通過訓(xùn)練進(jìn)行學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)是通過研究過去的數(shù)據(jù)記錄進(jìn)行訓(xùn)練的,一個(gè)經(jīng)過適當(dāng)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)具有歸納全部數(shù)據(jù)的能力,因此,神經(jīng)網(wǎng)絡(luò)能夠解決那些由數(shù)學(xué)模型或描述規(guī)則難以處理的控制過程問題;4)適應(yīng)與綜合; 5)分類與識(shí)別,神經(jīng)網(wǎng)絡(luò)可以很好地解決對(duì)非線性曲面的逼近問題,因此比傳統(tǒng)的分類器具有更好的分類與識(shí)別能力。
目前,BP算法已經(jīng)成為應(yīng)用最多且最主要的一種訓(xùn)練前饋人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,也是前饋網(wǎng)絡(luò)得以廣泛應(yīng)用的基礎(chǔ)。BP算法的學(xué)習(xí)目的是對(duì)網(wǎng)絡(luò)的連接權(quán)值進(jìn)行調(diào)整,使得調(diào)整后的網(wǎng)絡(luò)對(duì)任一輸入都能得到所期望的輸出。BP算法的基本思想是學(xué)習(xí)過程由正向傳播和反向傳播組成。正向傳播用于對(duì)前饋網(wǎng)絡(luò)進(jìn)行計(jì)算,即對(duì)某一輸入信息,經(jīng)過網(wǎng)絡(luò)計(jì)算后求出它的輸出結(jié)果;反向傳播用于逐層傳遞誤差,修改神經(jīng)元間的連接權(quán)值,以使網(wǎng)絡(luò)對(duì)輸入信息經(jīng)過計(jì)算后所得到的輸出能達(dá)到期望的誤差要求。BP網(wǎng)絡(luò)算法的指導(dǎo)思想是:網(wǎng)絡(luò)權(quán)值的修正與閾值的修正,使誤差函數(shù)沿梯度方向下降。
圖1給出了整個(gè)BP算法學(xué)習(xí)過程的流程圖。
關(guān)鍵詞:徑向基神經(jīng)網(wǎng)絡(luò)(RBFN); 超高壓; 繼電保護(hù); LLS; 梯度下降法
中圖分類號(hào):TN911-34; TP332 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-373X(2011)20-0196-04
Algorithm of EHV Relaying Protection Based on RBF Neural Network
ZHANG Dong1, WANG Tao2
(1. Inner Mongolia Electric Power Group, Hohhot 010080, China;
2. School of Electronics and Information Engineering, Soochow University, Suzhou 215021, China)
Abstract: An algorithm of EHV (extra high voltage) relaying protection based on RBFN (radial basis function neural network) is proposed. The algorithm can conduct the training according to the existing relaying data sample set because the RBFN has learning ability, find the internal relations of fault detection, fault location, self-adaptive automatic reclosing technology, differential protection and distance protection by analysis, and realize the self-adaptive control over the future relaying protection data samples. The highlight of this algorithm is that the factors of both predicting precision and training time of RFBN are taken into consideration in the process of construction. The linear least squares (LLS) and the gradient descent method are employed for MATLAB simulation experiment to obtain a more accurate result of prediction.
Keywords: RBFN; EHV; relaying protection; LLS; gradient descent
0 引 言
隨著電力工業(yè)的不斷發(fā)展,現(xiàn)代電力系統(tǒng)已成為┮桓齦囈追竅咝?、高竻矀蝙o拇笙低常人們對(duì)系統(tǒng)運(yùn)行的可靠性、持續(xù)性和穩(wěn)定性要求也越來越高,這就使得電力系統(tǒng)中問題的解決越來越困難。
繼電保護(hù)的任務(wù)就是檢測(cè)故障信息,識(shí)別故障信號(hào),進(jìn)而決定保護(hù)是否跳閘。傳統(tǒng)的繼電保護(hù)和故障診斷方法自適應(yīng)能力有限,不能適應(yīng)各種運(yùn)行方式和診斷復(fù)雜故障。
徑向基神經(jīng)網(wǎng)絡(luò)(RBFN)具有很強(qiáng)的自適應(yīng)能力、學(xué)習(xí)能力、非線性映射能力和容錯(cuò)能力,并且魯棒性好,應(yīng)用在電力系統(tǒng)繼電保護(hù)有很大優(yōu)勢(shì),很多難以列出方程式或難以求解的復(fù)雜的非線性問題,應(yīng)用徑向基神經(jīng)網(wǎng)絡(luò)(RBFN)方法都可以得到很好的解決。
1 人工神經(jīng)網(wǎng)絡(luò)概述
1.1 人工神經(jīng)網(wǎng)的概念
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANNs)也簡(jiǎn)稱為神經(jīng)網(wǎng)絡(luò)(NNs)或稱作連接模型(Connectionist Model),它是一種模范動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度,通過調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系,從而達(dá)到處理信息的目的。人工神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)和自適應(yīng)的能力,可以通過預(yù)先提供一批相互對(duì)應(yīng)的輸入-輸出數(shù)據(jù),分析掌握兩者之間潛在的規(guī)律,最終根據(jù)這些規(guī)律,用新的輸入數(shù)據(jù)來推算輸出結(jié)果,這種學(xué)習(xí)分析的過程被稱為“訓(xùn)練”。
人工神經(jīng)網(wǎng)絡(luò)是一門模擬人腦生物過程的人工智能技術(shù),是根據(jù)大腦神經(jīng)元電化學(xué)活動(dòng)抽象出來的一種多層網(wǎng)絡(luò)結(jié)構(gòu),它是由大量的神經(jīng)元互聯(lián)形成的復(fù)雜的非線性系統(tǒng)。神經(jīng)元結(jié)構(gòu)如圖1所示。所有輸入M通過一個(gè)權(quán)重K進(jìn)行加權(quán)求和后加上閾值d,再經(jīng)傳遞函數(shù)f的作用后即為該神經(jīng)元的輸出a,且有:
Иa=f(MK+d)(1)И
1.2 徑向基神經(jīng)網(wǎng)絡(luò)理論
徑向基神經(jīng)網(wǎng)絡(luò)(RBFN)是一個(gè)三層的前饋神經(jīng)網(wǎng)絡(luò),包括一個(gè)輸入層、一個(gè)徑向基層(即隱含層)和┮桓鍪涑霾恪F浠本原理是以徑向基函數(shù)作為隱層單元的基,構(gòu)成隱含層空間,隱含層對(duì)輸入矢量進(jìn)行變換將低維的模式輸入數(shù)據(jù)變換到高維空間內(nèi),使得在低維空間內(nèi)的線性不可分問題在高維空間內(nèi)線性可分。徑向基函數(shù)它模擬了人腦中局部調(diào)整、相互覆蓋感受野(Receptive Field),因此是一種局部逼近網(wǎng)絡(luò),科學(xué)界已經(jīng)證明它能以任意精度逼近任意函數(shù),其拓?fù)浣Y(jié)構(gòu)如圖2所示。
圖1 人工神經(jīng)元模型
圖2 RBF網(wǎng)絡(luò)結(jié)構(gòu)圖
輸入層節(jié)點(diǎn)獲取輸入向量后,傳遞輸入向量到隱含層。隱含層節(jié)點(diǎn)由徑向基函數(shù)構(gòu)成,徑向基函數(shù)可采取多種形式(通常采用Gaussian函數(shù))。隱含層執(zhí)行非線性變換,將輸入空間映射到一個(gè)新的空間。輸出層通常是簡(jiǎn)單的線性函數(shù)。隱含層節(jié)點(diǎn)和輸出層節(jié)點(diǎn)以不同的權(quán)重完全連接。隱含層節(jié)點(diǎn)的激活函數(shù)對(duì)輸入激勵(lì)產(chǎn)生一個(gè)局部響應(yīng),輸入向量越靠近基函數(shù)的中心,隱含層節(jié)點(diǎn)做出的響應(yīng)越大。隱含層第j結(jié)點(diǎn)的輸出響應(yīng)為:
ИGj(x)=exp-x-μj2σ2j (2)И
式中:x= [ X1,X2,…,Xn ] 為輸入向量;μj,σj分別為第j個(gè)神經(jīng)元的中心和大?。籧為神經(jīng)元的個(gè)數(shù)。
輸出層為隱含層各個(gè)單元的加權(quán)和:
И=f(x)=∑cj=1wjGj(x)(3)И
式中:wj為第j 個(gè)神經(jīng)元對(duì)應(yīng)的權(quán)值。
2 基于RBF的超高壓繼電保護(hù)算法
2.1 訓(xùn)練數(shù)據(jù)的樣本采集
訓(xùn)練所需要的樣本數(shù)據(jù),直接關(guān)系到訓(xùn)練出來經(jīng)驗(yàn)函數(shù)精度的優(yōu)劣,所以一組好的訓(xùn)練樣本是經(jīng)驗(yàn)函數(shù)精度的保證。本文采用內(nèi)蒙古電力集團(tuán)公司超高壓局近幾年對(duì)繼電保護(hù)數(shù)據(jù)記錄,其中樣本數(shù)據(jù)繁多,從中選取了5 000個(gè)有效數(shù)據(jù)作為樣本,用其中4 000來訓(xùn)練經(jīng)驗(yàn)函數(shù),后1 000個(gè)用來檢測(cè)訓(xùn)練效果。
2.2 RBF神經(jīng)網(wǎng)絡(luò)混合學(xué)習(xí)算法
RBF網(wǎng)絡(luò)的學(xué)習(xí)分為兩個(gè)過程。第一個(gè)過程:根據(jù)所有輸入向量確定各隱含層節(jié)點(diǎn)的高斯函數(shù)的中心值cj。第二個(gè)過程:在確定了隱含層j的參數(shù)后,根據(jù)樣本,利用最小二乘法原則求出輸出層的權(quán)值wjt。建立RBF神經(jīng)網(wǎng)絡(luò)的關(guān)鍵問題是根據(jù)給定的訓(xùn)練樣本確定徑向基函數(shù)的中心。因?yàn)橐坏┐_定了徑向基函數(shù)的中心cj,則對(duì)于所有的訓(xùn)練樣本而言Gj和預(yù)期輸出yt 是已知的,輸出權(quán)值`jt可以通過最小二乘法求出。
2.2.1 調(diào)整隱層神經(jīng)元中心及寬度
梯度下降法的構(gòu)造過程中首先定義誤差函數(shù):
ИE=12∑Nn=1En(4)И
式中:N為樣本個(gè)數(shù);En為輸入第nЦ鲅本是的誤差定義為:
ИEn=∑sk=1(tnk-ynk)2, n=1,2,…,N(5)И
要使誤差函數(shù)最小化,則參數(shù)的修正量應(yīng)與其負(fù)梯度成正比則有:ЕCj=-η1ECj和Δσj=-η2E鄲要j Т入后得:
ИЕCj=2η1∑Nn=1∑sk=1(tnk-ynk)•Rnjwn(k,j)•pn-cnj(σnj)2(6)
Δσj=2η2∑Nn=1∑sk=1(tnk-ynk)•Rnjwn(k,j)pn-cnj2(σnj)3(7)И
當(dāng)所有樣本輸入完成后,運(yùn)用迭代的方法對(duì)參數(shù)進(jìn)行調(diào)整,如下所示:
ИCj(m+1)=Cj(m)+ΔCj(8)
σj(m+1)=σj(m)+Δσj(9)И
式中:Cj是中心的學(xué)習(xí)速率;σj是高斯寬度的學(xué)習(xí)速率;m為迭代次數(shù)。為了保證分類器的泛化性能,采用的高斯寬度的學(xué)習(xí)速率通常大于中心的學(xué)習(xí)速率,因?yàn)樾〉膶W(xué)習(xí)速率使算法收斂過慢,而過大的學(xué)習(xí)速率可能會(huì)導(dǎo)致算法變得不穩(wěn)定。
2.2.2 RBF網(wǎng)絡(luò)的權(quán)值確定
首先設(shè)定輸入矩陣為:M∈Rr×N,隱層輸入矩陣為:P∈Ru×N;輸出層矩陣為:K∈Rs×N;其中n為訓(xùn)練樣本。若RBF網(wǎng)絡(luò)的待定輸出層權(quán)值W∈Rs×u,其三者關(guān)系為:
ИK=W×P(10)И
樣本的目標(biāo)輸出為:T=(t1,t2,…,ts)T∈Rs×N,在這里采用線性最小二乘法(LLS)來使得目標(biāo)輸出與網(wǎng)絡(luò)實(shí)際輸出之間的誤差達(dá)到最小,運(yùn)用R的R+來求得W為R+T。
2.2.3 經(jīng)驗(yàn)函數(shù)訓(xùn)練流程圖
本文所訓(xùn)練的經(jīng)驗(yàn)函數(shù)的算法流程圖分為兩個(gè)階段,第一階段是樣本處理,由于樣本具有重復(fù)性,在經(jīng)過樣本處理后,就保證了存儲(chǔ)在樣本庫中的樣本都具有代表性,消除重復(fù)訓(xùn)練,提高訓(xùn)練速率;第二階段是訓(xùn)練經(jīng)驗(yàn)函數(shù)。訓(xùn)練過程如圖3所示。
圖3 經(jīng)驗(yàn)函數(shù)的算法流程圖
3 實(shí)驗(yàn)結(jié)果與分析
該研究采用Matlab 7.0.0來做仿真實(shí)驗(yàn),針對(duì)關(guān)注的5個(gè)重要的超高壓繼電保護(hù)指標(biāo)分別進(jìn)行預(yù)測(cè),實(shí)驗(yàn)數(shù)據(jù)來自內(nèi)蒙古電力集團(tuán)公司超高壓局近幾年對(duì)繼電保護(hù)數(shù)據(jù)記錄,實(shí)驗(yàn)采用大量超高壓繼電保護(hù)值來訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),當(dāng)網(wǎng)絡(luò)訓(xùn)練達(dá)到誤差平方和目標(biāo)0.01時(shí),網(wǎng)絡(luò)訓(xùn)練結(jié)束。
圖4~圖8分別為故障檢測(cè)、故障定位,自適應(yīng)自動(dòng)重合閘技術(shù)、差動(dòng)保護(hù)以及距離保護(hù)的預(yù)測(cè)值與實(shí)際值之間的比較(其中橫軸均為時(shí)間序列,縱軸為超高壓繼電保護(hù)的相應(yīng)指標(biāo)值)。
通過仿真結(jié)果可以看出:曲線的擬合度較好,說明通過RBF神經(jīng)網(wǎng)絡(luò)短期預(yù)測(cè)超高壓繼電保護(hù)取得了較好的效果。但是長(zhǎng)期的預(yù)測(cè)則需要考慮超高壓繼電保護(hù)各衡量指標(biāo)的突變情況,此時(shí)RBF神經(jīng)網(wǎng)絡(luò)無法對(duì)其做出準(zhǔn)確的預(yù)測(cè)。
4 結(jié) 語
本文將RBF神經(jīng)網(wǎng)絡(luò)及其相關(guān)算法應(yīng)用到超高壓繼電保護(hù)預(yù)測(cè)上,可以更好、更快地動(dòng)態(tài)預(yù)測(cè)繼電保護(hù)的工作狀態(tài)。在其中RBF網(wǎng)絡(luò)大大提高了訓(xùn)練的速度,節(jié)省了時(shí)間且預(yù)測(cè)精度更高,在局部的短期預(yù)測(cè)中占有優(yōu)勢(shì)。怎樣進(jìn)一步改進(jìn)優(yōu)化預(yù)測(cè)算法是RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)超高壓繼電保護(hù)的下一步研究方向。
參考文獻(xiàn)
[1]馬銳.人工神經(jīng)網(wǎng)絡(luò)原理\.北京:機(jī)械工業(yè)出版社,2010.
[2]劉學(xué)軍.繼電保護(hù)原理\.北京:中國電力出版社,2007.
[3]賀張萍.深度探討繼電保護(hù)裝置狀態(tài)檢修需求及應(yīng)用難點(diǎn)\.科技資訊,2010(32):120-122.
[4]黃懿.繼電保護(hù)可靠運(yùn)行的控制分析\.中國科技博覽,2010(3):61-64.
[5]MOHAMED E A, TALAAT H A; KHAMIS E A. Fault diagnosis system for tapped power transmission lines \. Source: Electric Power Systems Research, 2010, 80 (5): 599-613.
[6]Eissa M M, Sowilam G M A, Sharaf A M. A new protection detection technique for high impedance fault using neu-ral network \// Proceedings of 2006 Large Engineering Systems Conference on Power Engineering. \: \, 2006: 146-151.
[7]DUTTA A A, KADU A N. Pattern recognition method for detecting fault in EHV transmission lines \// Proceedings of2nd International Conference on Mechanical and Electrical Technology. \: ICMET, 2010: 24-27.
[8]劉田田,燕潔.人工神經(jīng)網(wǎng)絡(luò)在電力系統(tǒng)繼電保護(hù)中的應(yīng)用\.電力學(xué)報(bào),2007(2):190-192.
[9]呂衛(wèi)勝.人工智能技術(shù)在電力系統(tǒng)繼電保護(hù)中的應(yīng)用\.山東電力技術(shù),2006(1):61-63.
[10]KHORASHADI-ZADEH H, EBRAHIMI M R A. AN ANN based approach to improve the distance relaying algorithm \// Proceedings of the 2004 IEEE Conference on Cybernetics and Intelligent Systems. Singapore: IEEE, 2004:1374-1379.
[11]曾曉林,薛建輝,洪剛.粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)在高壓斷路器機(jī)械故障診斷中的應(yīng)用\.電網(wǎng)與清潔能源,2010,26(6):57-61.
[12]李風(fēng)光,楊志.基于BP網(wǎng)絡(luò)的自適應(yīng)接地保護(hù)研究\.電網(wǎng)與清潔能源,2010,26(10):31-34.
關(guān)鍵詞:灰色神經(jīng)網(wǎng)絡(luò);商品銷售;算法;銷售預(yù)測(cè)
中圖分類號(hào):F71文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)27-7743-02
市場(chǎng)銷售是根據(jù)根據(jù)市場(chǎng)過去和現(xiàn)在的信息,運(yùn)用一定的數(shù)學(xué)方法,對(duì)產(chǎn)品的需求進(jìn)行評(píng)估推測(cè),市場(chǎng)預(yù)測(cè)可以減少企業(yè)風(fēng)險(xiǎn),為企業(yè)決策提供依據(jù)。做為市場(chǎng)預(yù)測(cè)組成部分的需求預(yù)測(cè),是直接影響企業(yè)生產(chǎn)企業(yè),投資取向,庫存保有量的重要依據(jù),精確的需求預(yù)測(cè)可以減少庫存,降低訂單流失率,更有效的配置資源。對(duì)于商品銷售預(yù)測(cè)來說,有很多種方法,本文采用灰色神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)商品銷量。
1 灰色系統(tǒng)和神經(jīng)網(wǎng)絡(luò)概述
1.1 灰色系統(tǒng)
灰色系統(tǒng)理論是一種研究少數(shù)據(jù)、貧信息、不確定性問題的新方法,它以“部分信息已知,部分信息未知”的“小樣本”,“貧信息”不確定系統(tǒng)為研究對(duì)象,通過對(duì)“部分”已知信息的生成、開發(fā)、提取有價(jià)值的信息,實(shí)現(xiàn)對(duì)系統(tǒng)運(yùn)行行為、演化規(guī)律的正確描述和有效監(jiān)控。它是我國學(xué)者鄧聚龍教授在1982年首先提出的,經(jīng)過20年的發(fā)展,灰色系統(tǒng)已基本建立起一門新興學(xué)科的結(jié)構(gòu)體系,其主要內(nèi)容包括以灰色朦朧集為基礎(chǔ)的理論體系,以灰色關(guān)聯(lián)空間為依托的分析體系,以灰色序列生成為基礎(chǔ)的方法體系,以灰色模型為核心的模型體系和以系統(tǒng)分析、評(píng)估、建模、預(yù)測(cè)、決策、控制、優(yōu)化為主體的技術(shù)體系。
灰色系統(tǒng)中建立的模型稱為灰色模型(GreyModel)簡(jiǎn)稱GM模型,是以原始數(shù)據(jù)序列為基礎(chǔ)做某種生成后建立的微分方程。建模中最有代表性的是針對(duì)時(shí)間序列的GM建模,它直接將時(shí)間序列數(shù)據(jù)轉(zhuǎn)化為微分方程,利用系統(tǒng)信息,使抽象的模型量化,量化的概念模型化,最后進(jìn)行模型優(yōu)化,從而使所建的GM模型在尋求不到系統(tǒng)的概率特性或隸屬特性的情況下顯示其優(yōu)越性。
1.2 神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)理論(ArtificialNeuralNetworks)是智能算法理論的一種,由于其具有大規(guī)模并行處理、分布式信息存儲(chǔ),容錯(cuò)性,自組織性和自適應(yīng)性等特點(diǎn),目前已經(jīng)得到了國內(nèi)外學(xué)者的廣泛關(guān)注。目前,人工神經(jīng)網(wǎng)絡(luò)已成功應(yīng)用在函數(shù)擬合、數(shù)據(jù)預(yù)測(cè)、模式識(shí)別、優(yōu)化控制等很多工程領(lǐng)域,并在一些傳統(tǒng)方法難以解決的問題上取得了滿意的結(jié)果。
人工神經(jīng)是由一些稱為神經(jīng)元的基本部件按一定規(guī)則組合形成的,它由神經(jīng)元,神經(jīng)元間連接方式和訓(xùn)練規(guī)則三個(gè)因素組成。其中最主要的部分是神經(jīng)元,它由由輸入,非線性變換和輸出三部分構(gòu)成,是一個(gè)基本計(jì)算單元,計(jì)算過程為,輸入經(jīng)過權(quán)值連接到內(nèi)部后求和,和值首先與一個(gè)閥值做比較,然后經(jīng)過非線性變化,得到輸出。神經(jīng)元的非線性變換有多種形式,比較常用的有Sigmoid函數(shù),限幅函數(shù)等。神經(jīng)元間不同的連接方式構(gòu)成了不同類型的神經(jīng)網(wǎng)絡(luò),比如信號(hào)由一層單向傳播到另一層的前饋型神經(jīng)網(wǎng)絡(luò),信號(hào)在層與層之間傳播的反饋型神經(jīng)網(wǎng)絡(luò)等。目前,比較典型的神經(jīng)網(wǎng)絡(luò)包括BP網(wǎng)絡(luò),RBF網(wǎng)絡(luò)、小波網(wǎng)絡(luò)等。
2 基于灰色神經(jīng)網(wǎng)絡(luò)的銷量建模
2.1 網(wǎng)絡(luò)建模
對(duì)于銷量預(yù)測(cè)的問題來說,灰色模型GNNM(1,N)的微分表達(dá)式為:
其中, y1是商品的銷售量,y2-yn是影響銷售量的因子。
求解微分方程(1)可得如下的離散響應(yīng)方程:
令 ,則式2變?yōu)?
y1的閥值設(shè)為: 。
BP網(wǎng)絡(luò)LB層神經(jīng)元的激活函數(shù)取為Sigmoid函數(shù):
將式(3)變型后映射到BP網(wǎng)絡(luò)中,得到如下的映射銷量問題的灰色神經(jīng)網(wǎng)絡(luò)模型,如圖1所示。
2.2 學(xué)習(xí)算法
該模型中各個(gè)參數(shù)根據(jù)網(wǎng)絡(luò)輸出和實(shí)際輸出的誤差進(jìn)行調(diào)整,從而是網(wǎng)絡(luò)輸出不斷逼近實(shí)際輸出,學(xué)習(xí)算法如下:
Step 1.根據(jù)系統(tǒng)數(shù)據(jù)列特征,選取兩個(gè)較小的值做為 a,b1,b2,…,bn-1
Step 2.根據(jù)網(wǎng)絡(luò)權(quán)值定義計(jì)算ω11,ω21,ω22, …,ω2n,ω31,ω32,…,ω3n
Step 3.對(duì)每一個(gè)輸入序列(t,y(t)),(t=1,2,3,…,N)進(jìn)行如下操作:
t輸入LA層節(jié)點(diǎn),對(duì)LB、LC、LD層的節(jié)點(diǎn)進(jìn)行如下計(jì)算:
計(jì)算每層輸出
計(jì)算網(wǎng)絡(luò)輸出與期望輸出的誤差
調(diào)整隔層權(quán)值:
調(diào)整LB到LC的連接權(quán)值:
調(diào)整LA到LB的連接權(quán)值:
調(diào)整閥值:
Step 4重復(fù)步驟3,直至滿足結(jié)束條件為止。
2.3 總體設(shè)計(jì)
采用灰色神經(jīng)網(wǎng)絡(luò)進(jìn)行銷量預(yù)測(cè),總的步驟分為灰色神經(jīng)網(wǎng)絡(luò)構(gòu)建,灰色神經(jīng)網(wǎng)絡(luò)訓(xùn)練和灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)三步,其中灰色神經(jīng)網(wǎng)絡(luò)構(gòu)建是根據(jù)輸入輸出變量構(gòu)建灰色神經(jīng)網(wǎng)絡(luò),灰色神經(jīng)網(wǎng)絡(luò)訓(xùn)練是對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)是對(duì)訓(xùn)練好的網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),其灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)系統(tǒng)總體框圖如圖2所示。
3 基于灰色神經(jīng)網(wǎng)絡(luò)的銷量預(yù)測(cè)
采用灰色神經(jīng)來對(duì)某型冰箱的銷售的做預(yù)測(cè),分析得出影響該型冰箱的市場(chǎng)需求的因素為以下幾個(gè)指標(biāo),1)競(jìng)爭(zhēng)對(duì)手;2)市場(chǎng)特征;3)成本;4)廣告力度;5)品牌認(rèn)可;6)售后服務(wù);7)價(jià)格性價(jià)比。輸出數(shù)據(jù)為銷售量,用模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練預(yù)測(cè),設(shè)置輸入節(jié)點(diǎn)數(shù)為8,輸出節(jié)點(diǎn)數(shù)為1,即為預(yù)測(cè)銷售量,網(wǎng)絡(luò)共迭代100次,得到的預(yù)測(cè)值和實(shí)際值的結(jié)果如圖3所示。
從圖3中可以看到,灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的銷量值和實(shí)際值非常接近,說明了灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的有效性。
1 傳統(tǒng)工業(yè)的優(yōu)化設(shè)計(jì)應(yīng)用
傳統(tǒng)機(jī)械優(yōu)化設(shè)計(jì)方法大多應(yīng)用于機(jī)械結(jié)構(gòu)和零件功能的優(yōu)化設(shè)計(jì),針對(duì)機(jī)械結(jié)構(gòu)的性能和形態(tài)進(jìn)行優(yōu)化。在機(jī)械結(jié)構(gòu)上,內(nèi)點(diǎn)罰函數(shù)優(yōu)化法,能夠?qū)偠群蛪簭澖M合強(qiáng)度結(jié)構(gòu)進(jìn)行良好的優(yōu)化,既能夠滿足尺寸要求又能良好的控制結(jié)構(gòu)自重。在形態(tài)方面,典型的是軸對(duì)稱鍛造部件的毛坯形狀的優(yōu)化。在性能方面,采用坐標(biāo)轉(zhuǎn)換法和黃金分割法對(duì)部分兩岸結(jié)構(gòu)進(jìn)行優(yōu)化設(shè)計(jì),使得機(jī)械結(jié)構(gòu)更加準(zhǔn)確保持運(yùn)動(dòng)平衡性,提高了傳力性能。這樣看來,傳統(tǒng)機(jī)械優(yōu)化設(shè)計(jì)方法依然能夠取得良好的效果,所以在機(jī)械設(shè)計(jì)發(fā)展中不能忽略傳統(tǒng)優(yōu)化方法的
作用。
2 現(xiàn)代工業(yè)的優(yōu)化設(shè)計(jì)應(yīng)用
現(xiàn)代高新設(shè)計(jì)方法在機(jī)械優(yōu)化設(shè)計(jì)中的應(yīng)用已越來越廣泛。但應(yīng)該看到,現(xiàn)代的設(shè)計(jì)不僅僅是單一的完成給定產(chǎn)品的設(shè)計(jì),而應(yīng)該要將產(chǎn)品使用及設(shè)備維修等因素統(tǒng)一進(jìn)行考慮。所以,機(jī)械優(yōu)化設(shè)計(jì)在強(qiáng)調(diào)環(huán)保設(shè)計(jì)和可靠性設(shè)計(jì)等考慮綜合性因素的機(jī)械優(yōu)化設(shè)計(jì)應(yīng)用工作更為活躍,機(jī)械優(yōu)化設(shè)計(jì)的應(yīng)用領(lǐng)域更加廣泛,涉及到航空航天工程機(jī)械及通用機(jī)械與機(jī)床的機(jī)械優(yōu)化設(shè)計(jì);涉及到水利、橋梁和船舶機(jī)械優(yōu)化設(shè)計(jì);涉及到汽車和鐵路運(yùn)輸行業(yè)及通訊行業(yè)機(jī)械優(yōu)化設(shè)計(jì);涉及到輕工紡織行業(yè)、能源工業(yè)和軍事工業(yè)機(jī)械優(yōu)化設(shè)計(jì);涉及到建筑領(lǐng)域機(jī)械優(yōu)化設(shè)計(jì);涉及到石油及石化行業(yè)機(jī)械優(yōu)化設(shè)計(jì);涉及到食品機(jī)械等機(jī)械優(yōu)化設(shè)計(jì)。機(jī)械優(yōu)化設(shè)計(jì)的應(yīng)用還能夠解決具有復(fù)雜結(jié)構(gòu)的系統(tǒng)問題。
2.1 優(yōu)化設(shè)計(jì)網(wǎng)絡(luò)軟件的應(yīng)用
優(yōu)化算法的研究已經(jīng)有所成績(jī),利用網(wǎng)絡(luò)平臺(tái)逐漸開發(fā)一些工業(yè)化在線優(yōu)化軟件,便于工業(yè)設(shè)計(jì)使用。對(duì)于在線機(jī)械優(yōu)化設(shè)計(jì)軟件來說,亟待解決的問題就是模型問題,對(duì)于非常復(fù)雜的系統(tǒng)來說,結(jié)構(gòu)、流程、物料和系統(tǒng)參數(shù)等,都非常復(fù)雜,如果計(jì)算對(duì)象比較模糊,運(yùn)算效率會(huì)受到嚴(yán)重的影響,這就給在線優(yōu)化軟件帶來了巨大的困難。為了解決這種情況,通過合適的算法解決辨別模型,結(jié)合神經(jīng)網(wǎng)絡(luò)和學(xué)習(xí)特點(diǎn)進(jìn)行數(shù)據(jù)的識(shí)別,讓在線優(yōu)化軟件也能夠良好的應(yīng)用于各種模型,比如國內(nèi)比較成熟的 NEUMAX 軟件包,基于神經(jīng)遺傳算法的在線優(yōu)化軟件包,都能夠良好的實(shí)現(xiàn)各種模型的遺傳算法,這些軟件已經(jīng)成功應(yīng)用于甲醇合成機(jī)械設(shè)計(jì)的優(yōu)化工作中。
2.2 優(yōu)化設(shè)計(jì)在MATLAB中的應(yīng)用
在機(jī)械設(shè)計(jì)中引入優(yōu)化設(shè)計(jì)方法不僅能使設(shè)計(jì)的機(jī)械零件滿足性能要求,還能使其在某些特定方面達(dá)到最優(yōu)。利用 MATLAB優(yōu)化工具箱求解機(jī)械優(yōu)化設(shè)計(jì)問題不僅避免了傳統(tǒng)的設(shè)計(jì)方法中人工試湊、分析比較過程中的繁雜與重復(fù),而且編程簡(jiǎn)單、結(jié)果可靠。在上述實(shí)例中,利用 MATLAB 軟件中FEMINCON函數(shù)求解夾具設(shè)計(jì)問題,最 終設(shè)計(jì)的 夾具要比采用傳統(tǒng)設(shè)計(jì)方法設(shè)計(jì)的質(zhì)量輕、成本低,并且設(shè)計(jì)效率高。
2.3 人工神經(jīng)網(wǎng)絡(luò)法在機(jī)械優(yōu)化設(shè)計(jì)中的應(yīng)用
人工神經(jīng)網(wǎng)絡(luò)是人類模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立的一種信息處理系統(tǒng),是理論化的人腦神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型。人工神經(jīng)網(wǎng)絡(luò)從事例中學(xué)習(xí),可以處理非線性問題,特別擅長(zhǎng)處理那些需要人直觀判斷的信息匱乏的問題,如不完全數(shù)據(jù)集合,模糊信息以及高度復(fù)雜問題等。人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于優(yōu)化設(shè)計(jì),主要體現(xiàn)在以下兩個(gè)方面:
Hopfield 網(wǎng)絡(luò) 2.BP 網(wǎng)絡(luò)
2.4 模糊優(yōu)化方法在機(jī)械優(yōu)化設(shè)計(jì)中的應(yīng)用應(yīng)用模糊優(yōu)化理論能夠?qū)⒃O(shè)計(jì)中的模糊因素和模糊主觀信息定量化,通過合理給定約束函數(shù)、目標(biāo)函數(shù)的容許值、期望值及其模糊分布 (隸屬函數(shù)) 來 “軟化”邊界條件,擴(kuò)大尋優(yōu)范圍和體現(xiàn)專家的經(jīng)驗(yàn)、觀點(diǎn)和某些公認(rèn)的設(shè)計(jì)準(zhǔn)則。把模糊技術(shù)應(yīng)用于優(yōu)化設(shè)計(jì)建模,其特長(zhǎng)不僅在于它善于表達(dá)模糊概念,處理模糊因素,而且還可將復(fù)雜問題簡(jiǎn)化,使優(yōu)化模型更加合理。采用模糊理論建立優(yōu)化設(shè)計(jì)模型對(duì)求解復(fù)雜系統(tǒng)優(yōu)化設(shè)計(jì)問題具有重要意義。