公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中的運(yùn)用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中的運(yùn)用范文,希望能給你帶來靈感和參考,敬請閱讀。

數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中的運(yùn)用

摘要:21世紀(jì)是互聯(lián)網(wǎng)的時代,無論是生產(chǎn)還是生活都離不開互聯(lián)網(wǎng),在網(wǎng)絡(luò)給我們的生活帶來極大的便利的同時,網(wǎng)絡(luò)上一些不安全因素也侵害信息安全和財產(chǎn)安全,因此必須要在使用網(wǎng)絡(luò)的時候明確一些危害的來源,找到解決的方案。數(shù)據(jù)挖掘技術(shù)作為當(dāng)前最新型的計算機(jī)網(wǎng)絡(luò)防御構(gòu)建技術(shù)對于凈化網(wǎng)絡(luò)空間,保證使用者信息財產(chǎn)安全有著極為重要的作用。本文將從計算機(jī)網(wǎng)絡(luò)病毒和危險進(jìn)行分析從而進(jìn)一步提出相關(guān)的數(shù)據(jù)挖掘技術(shù)原理與實際應(yīng)用途徑,希望能對有關(guān)人員起到一定的幫助作用。

關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);網(wǎng)絡(luò)安全;計算機(jī);病毒;應(yīng)用

一、當(dāng)前我國網(wǎng)絡(luò)安全現(xiàn)狀與技術(shù)

互聯(lián)網(wǎng)之所以便捷主要是因為其具有以下幾種特點(diǎn):(1)無主管性:每個人都可以是計算機(jī)和網(wǎng)絡(luò)的主人。(2)跨國性:利用網(wǎng)絡(luò)可以輕松實現(xiàn)跨國交流,因此這也加大了網(wǎng)絡(luò)安全的防范難度。(3)不設(shè)防性:大部分計算機(jī)不具有較高安全系數(shù)的防御系統(tǒng),因此容易成為黑客和病毒的攻擊目標(biāo)。除此之外一些網(wǎng)絡(luò)犯罪分子更加猖獗,依靠技術(shù)肆意破壞網(wǎng)絡(luò)安全。當(dāng)前我國的網(wǎng)絡(luò)安全方面主要面臨的隱患有以下幾點(diǎn)。

(一)不法分子對網(wǎng)絡(luò)的惡意破壞

因為信息價值的重要性大量不法分子利用黑客技術(shù)對個人用戶和企業(yè)用戶計算機(jī)進(jìn)行攻擊,并大量在網(wǎng)頁和一些應(yīng)用軟件中植入病毒和木馬程序,在沒有專業(yè)殺毒軟件的情況下或是由于輕信釣魚網(wǎng)站的陷阱就很容易被攻擊或者造成信息丟失。在目前世界范圍內(nèi)黑客網(wǎng)站的數(shù)量已經(jīng)突破十萬,并且其規(guī)模和技術(shù)還在快速增長,甚至部分技術(shù)增長速度要超過一半殺毒軟件的木馬識別數(shù)據(jù)庫,令用戶防不勝防。還有計算機(jī)病毒的攻擊,這種攻擊往往不容易被察覺也并沒有實質(zhì)性表現(xiàn),只是一段運(yùn)行代碼就可以讓計算機(jī)或者軟件處于癱瘓狀態(tài),嚴(yán)重會造成大量數(shù)據(jù)的丟失狀況。目前我國在應(yīng)對黑客和病毒方面的措施還比較落后,互聯(lián)網(wǎng)風(fēng)險還比較大。

(二)網(wǎng)絡(luò)違法犯罪引發(fā)的嚴(yán)重危害

相比于黑客和病毒的攻擊網(wǎng)絡(luò)違法犯罪對于個人用戶和企業(yè)用戶的危害更為直接,往往會直接影響到生活和經(jīng)濟(jì)。當(dāng)前利用網(wǎng)絡(luò)技術(shù)進(jìn)行犯罪的主要形式有:(1)經(jīng)濟(jì)詐騙類:有很多不法分子利用銀行的漏洞或是受害者防范意識不強(qiáng)的心理來進(jìn)行犯罪,他們盜刷銀行卡,通過各種手段竊取銀行卡信息,造成了很大的經(jīng)濟(jì)損失。還有利用偽基站等技術(shù)進(jìn)行電信詐騙的犯罪事件,其影響惡劣讓人觸目驚心。(2)信息類犯罪:當(dāng)前很多不法分子利用各種渠道來獲取用戶在網(wǎng)頁上瀏覽的痕跡和在一些網(wǎng)站上留下的個人信息,他們竊取其電話、各種證件的號碼來實施犯罪,更有甚者還會竊取個人企業(yè)機(jī)密信息甚至國家機(jī)密信息進(jìn)行販賣或是進(jìn)行相關(guān)犯罪活動,這對用戶的安全造成了巨大的威脅,在很大程度上破壞了社會穩(wěn)定性和國家安全。(3)金融類犯罪,目前各個銀行的手機(jī)客戶端和微信支付寶等第三方客戶端在用戶當(dāng)中得到普及,一些不法分子利用一些非法手段進(jìn)行用戶支付密碼的竊取,或是進(jìn)行相關(guān)金融詐騙造成了金融安全的嚴(yán)重漏洞,這嚴(yán)重危害了互聯(lián)網(wǎng)的健康發(fā)展。

(三)傳統(tǒng)的網(wǎng)絡(luò)入侵檢測方法所存在的弊端

傳統(tǒng)的網(wǎng)絡(luò)入侵檢測方法的弊端也給了不法分子可乘之機(jī),網(wǎng)絡(luò)入侵檢測大體上分為異常入侵檢測和誤用入侵檢測兩種方法:(1)誤用入侵檢測方法:這種方法只能對以往的行為進(jìn)行相關(guān)檢測,而對于一些新入侵行為則無法進(jìn)行發(fā)現(xiàn)和預(yù)警,這種檢測結(jié)果的實際效果非常小,因此在當(dāng)前網(wǎng)絡(luò)入侵檢測中該種方法逐漸被淘汰掉。(2)異常入侵檢測方法:這種檢測方法相比于誤用入侵檢測法要先進(jìn)的多,對于一些小規(guī)模網(wǎng)站的檢測有著很高效便捷的效果,能夠有效做到入侵甄別。但是如果網(wǎng)絡(luò)入侵手段比較高明且偽裝比較好或是一些個大型的網(wǎng)站檢測這種方法就顯得力不從心。異常入侵檢測法用到了數(shù)據(jù)挖掘的技術(shù),但是其核心還是圍繞傳統(tǒng)的統(tǒng)計方法和貝葉斯網(wǎng)絡(luò)來展開的,隨著網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大該種技術(shù)的適應(yīng)性變得越來越差,因此開發(fā)以數(shù)據(jù)挖掘為核心的網(wǎng)絡(luò)防護(hù)技術(shù)顯得至關(guān)重要和迫切。

二、計算機(jī)病毒特點(diǎn)

計算機(jī)病毒不好被控制防范有很大程度上來源于病毒自身的特點(diǎn),一般病毒的特點(diǎn)可以總結(jié)為三種:傳染性強(qiáng)、傳播方式多樣和破壞性強(qiáng)。這三種特點(diǎn)讓計算機(jī)病毒的防控工作成為了難點(diǎn)。

(一)病毒的傳染性特點(diǎn)

之所以稱之為“病毒”是因為它像現(xiàn)實生活中的生物病毒一樣擁有者較強(qiáng)的傳染性。與現(xiàn)實中生物病毒所不同的地方是計算機(jī)病毒是由黑客編制的程序代碼,它的“宿主”可以是計算機(jī)中的任何一個軟件或是文件、文件夾,由于是人為編制的原因其適應(yīng)性一般較強(qiáng)能夠兼容在任意符合條件的儲存介質(zhì)中進(jìn)行搜索。所謂傳染性指的是“病毒”的自我繁殖過程,一旦計算機(jī)的一個文件或是程序軟件感染病毒,在啟動時如果關(guān)聯(lián)到任何其他軟件都可能造成并發(fā)“感染”,病毒的恐怖之處還在于當(dāng)被感染用戶進(jìn)行聯(lián)機(jī)上網(wǎng)時它還可以入侵與之相關(guān)的其他設(shè)備造成大規(guī)模入侵持續(xù)感染,危害極大。

(二)病毒有多重傳播方式

病毒傳播方式多種多樣,這來源于互聯(lián)網(wǎng)的開放性,一般來講病毒最主要的傳播方式要借助于系統(tǒng)漏洞和電子郵件,目前利用電子郵件進(jìn)行病毒傳播的行為比較常見,當(dāng)打開電子郵件后里面的一個鏈接就很可能導(dǎo)致計算機(jī)感染病毒。當(dāng)然利用網(wǎng)絡(luò)系統(tǒng)漏洞來進(jìn)行病毒傳播的也屢見不鮮,當(dāng)因為漏洞感染病毒時,病毒會在計算機(jī)上對遠(yuǎn)程主機(jī)系統(tǒng)進(jìn)行不斷的掃描和搜索,當(dāng)這種搜索搜尋到新的漏洞時便會讓遠(yuǎn)程主機(jī)感染病毒,進(jìn)而讓更多用戶受到侵害。

(三)病毒破壞性極強(qiáng)

計算機(jī)病毒的破壞性在于持續(xù)泄漏用戶的數(shù)據(jù)信息,一旦通過黑客木馬等感染病毒,依據(jù)病毒的潛伏性隱蔽性特點(diǎn)就很有可能造成長期的損失,最嚴(yán)重的狀況可能讓整個計算機(jī)和網(wǎng)絡(luò)系統(tǒng)癱瘓,讓正常工作被迫停止。

三、數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)是當(dāng)前的數(shù)據(jù)庫技術(shù),它的核心是通過對一個范圍內(nèi)所有數(shù)據(jù)的挖掘研究來找到其中有用的數(shù)據(jù)來進(jìn)行收集和整理,在整理之后最重要的是要將得到的數(shù)據(jù)內(nèi)在的聯(lián)系進(jìn)行發(fā)掘,通過數(shù)據(jù)之間的各種表現(xiàn)來找到客觀的規(guī)律,進(jìn)而進(jìn)行相關(guān)判斷。一般進(jìn)行數(shù)據(jù)挖掘后往往能夠找到平時難以發(fā)現(xiàn)的聯(lián)系,找到新的突破口。數(shù)據(jù)挖掘的過程一般要分為三個階段:(1)數(shù)據(jù)的準(zhǔn)備。將需要的數(shù)據(jù)錄入到系統(tǒng)中。(2)設(shè)置數(shù)據(jù)挖掘的模式,在這個環(huán)節(jié)需要根據(jù)所需要挖掘的數(shù)據(jù)的不同和預(yù)期結(jié)果的不同來進(jìn)行模式設(shè)置,在模式設(shè)置后可以讓系統(tǒng)更高效的運(yùn)行。(3)分析后的數(shù)據(jù)整理:分析后的數(shù)據(jù)整理主要是得出數(shù)據(jù)間的潛在聯(lián)系,將數(shù)據(jù)進(jìn)行總結(jié)歸類,并將結(jié)果作為后期的數(shù)據(jù)處理依據(jù)。利用數(shù)據(jù)挖掘進(jìn)行計算機(jī)網(wǎng)絡(luò)防控的優(yōu)勢在于它能更好的發(fā)現(xiàn)平時不易察覺的數(shù)據(jù)間的聯(lián)系,這也正是針對病毒的隱蔽性特點(diǎn),利用數(shù)據(jù)挖掘可以較快速的實現(xiàn)對未知入侵的檢測,并且還能將得到的結(jié)果進(jìn)行備份處理,這樣對于服務(wù)器和服務(wù)器也可以實現(xiàn)高效的監(jiān)督和檢查效果。數(shù)據(jù)挖掘的方法還有較強(qiáng)的適應(yīng)能力,能夠根據(jù)病毒等的不斷變化而隨之變化,當(dāng)前的利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)的“人工免疫”防控技術(shù)能夠?qū)崿F(xiàn)計算機(jī)網(wǎng)絡(luò)的自我監(jiān)督,自我更新,這種動態(tài)化的學(xué)習(xí)能力克服了傳統(tǒng)網(wǎng)絡(luò)監(jiān)測技術(shù)的更新慢,動態(tài)反應(yīng)慢的問題,針對未來未知的可能發(fā)生的病毒侵害,這種方法顯現(xiàn)了其優(yōu)勢。

四、利用數(shù)據(jù)挖掘進(jìn)行網(wǎng)絡(luò)安全防控的工作原理

(一)工作原理

數(shù)據(jù)挖掘技術(shù)的原理要分為幾個模塊:(1)數(shù)據(jù)源模塊:這個模塊的主要功能是將網(wǎng)絡(luò)上的數(shù)據(jù)進(jìn)行整合,并將整合后的數(shù)據(jù)源傳輸給終端主機(jī),在這個階段不需要進(jìn)行過多的處理只需要進(jìn)行簡單的預(yù)處理,最主要還是要抓住特定數(shù)據(jù)的相關(guān)結(jié)構(gòu)。(2)預(yù)處理模塊:預(yù)處理模塊的主要工作時進(jìn)行數(shù)據(jù)的分類,并將數(shù)據(jù)的格式進(jìn)行規(guī)劃統(tǒng)一將其轉(zhuǎn)化為主機(jī)能夠識別的格式。進(jìn)行數(shù)據(jù)分類時主要是依據(jù)數(shù)據(jù)的來源IP與端口位置,利用預(yù)處理技術(shù)能夠減少數(shù)據(jù)的冗余,讓數(shù)據(jù)的辨識度得到提高,最終提高終端的處理效率。(3)數(shù)據(jù)挖掘模塊:該模塊依據(jù)不同的模式有著不同的算法,通過該步驟能夠較準(zhǔn)確的發(fā)掘數(shù)據(jù)間的潛在聯(lián)系,為后期的進(jìn)一步?jīng)Q策做好數(shù)據(jù)分析基礎(chǔ)。(4)規(guī)則庫模塊:規(guī)則庫模塊包括對以往病毒種類的儲存和對新型病毒種類的更新,它會將以往挖掘過的病毒的信息存儲在其中,并以此對當(dāng)前挖掘結(jié)果進(jìn)行分析,一旦出現(xiàn)吻合就會以識別出來。如果出現(xiàn)新病毒則會納入其儲存庫中。(5)決策模塊,這時整個系統(tǒng)的最終模塊,決策模塊是最終決定挖掘結(jié)果的,如果病毒與庫中出現(xiàn)大面積吻合則可直接判斷為病毒進(jìn)行防御,如果吻合度不高但挖掘結(jié)果表明其風(fēng)險性較大,則進(jìn)一步進(jìn)行決策判斷,如果其是病毒則納入庫中進(jìn)行收集并進(jìn)行防御。

(二)構(gòu)建以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ)的計算機(jī)網(wǎng)絡(luò)安全病毒防御系統(tǒng)

構(gòu)建防御系統(tǒng)需要以下幾個階段:(1)關(guān)聯(lián)原則:關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)的基礎(chǔ),在數(shù)據(jù)挖掘時主要是依據(jù)數(shù)據(jù)間的因果、時序和簡單三種關(guān)聯(lián)關(guān)系來進(jìn)行判斷,并將復(fù)雜的數(shù)據(jù)整理成相互關(guān)聯(lián)的關(guān)聯(lián)網(wǎng)。(2)聚類分析:聚類分析首先要將有同一特性的數(shù)據(jù)劃分到一個組內(nèi),這樣不同的組有不同的特性在挖掘時就可以進(jìn)行組內(nèi)挖掘和組關(guān)系之間的挖掘?qū)崿F(xiàn)疏密分布識別,對于全局性的把控有很大幫助。(3)分類分析:分類分析主要用到了統(tǒng)計的方法,將預(yù)定的分類個體按照類別進(jìn)行錄入能夠充分的利用機(jī)器學(xué)習(xí)的方法構(gòu)建模型進(jìn)而達(dá)到分析數(shù)據(jù)的目的。(4)異類分析:異類分析的核心是找到與其他數(shù)據(jù)偏離較大的數(shù)據(jù)或是不能分組的孤立數(shù)據(jù),往往這種數(shù)據(jù)是整個數(shù)據(jù)挖掘的突破口,能夠在其中找到想要的結(jié)果。

(三)決策樹挖掘

決策樹挖掘的理論是將判斷條件進(jìn)行分解,依據(jù)從大到小,從廣到細(xì)的原則將數(shù)據(jù)的判斷進(jìn)行逐級劃分,進(jìn)行分別的狀態(tài)測試,當(dāng)有一級不滿足判斷條件即可做出相應(yīng)的防御反應(yīng)。一般利用數(shù)據(jù)挖掘來進(jìn)行決策樹挖掘的條件為(1)該程序是否有破壞能力。(2)該程序是否有傳染復(fù)制能力。(3)該程序是否具備隱蔽性能力。依據(jù)決策樹進(jìn)行逐級分析判斷能夠很好的利用以往數(shù)據(jù)庫中的存儲的結(jié)果,同時在逐級判斷的過程中可以在第一步或是前幾步就得出病毒的信息,這樣可以大大的減少計算機(jī)的分析時間和壓力,為后面的系統(tǒng)細(xì)致分析做好基礎(chǔ)。

五、基于數(shù)據(jù)挖掘技術(shù)的防御系統(tǒng)構(gòu)建策略

構(gòu)建基于數(shù)據(jù)挖掘技術(shù)的防御系統(tǒng)需要分成幾個步驟來實現(xiàn)。

(一)構(gòu)建健全的數(shù)據(jù)挖掘技術(shù)理論體系

數(shù)據(jù)挖掘理論體系在實時更新著,因此企業(yè)技術(shù)專業(yè)人員要首先完善理論技術(shù)的體系構(gòu)建,要加強(qiáng)企業(yè)與國外先進(jìn)技術(shù)的融合和國內(nèi)高校新成果的結(jié)合,要積極構(gòu)建適合自己行業(yè)模式的數(shù)據(jù)挖掘系統(tǒng),在基礎(chǔ)理論上加以深化。要依照企業(yè)內(nèi)部需要進(jìn)行數(shù)據(jù)挖掘模塊劃分以適應(yīng)企業(yè)自身的需求。

(二)構(gòu)建數(shù)據(jù)挖掘技術(shù)的標(biāo)準(zhǔn)和軟件系統(tǒng)

一般軟件系統(tǒng)的獲得有三種途徑,第一種是直接購買成品軟件,這種方法一般對于企業(yè)適應(yīng)性較差但是方便快捷。第二種是企業(yè)進(jìn)行自主軟件開發(fā),這種方法需要投入大量人力物力資源,適合經(jīng)濟(jì)實力足夠的大型企業(yè),軟件能夠直接與企業(yè)需要相符提高防御效率。第三種是聘請專業(yè)公司人員進(jìn)行輔助開發(fā),這時一般企業(yè)最多選擇的方式。隨著數(shù)據(jù)挖掘技術(shù)交互性的增強(qiáng)訂立數(shù)據(jù)挖掘的標(biāo)準(zhǔn)非常重要,要引進(jìn)標(biāo)準(zhǔn)的處理數(shù)據(jù)庫服務(wù)器進(jìn)行硬件支撐,利用國際通用的數(shù)據(jù)語言進(jìn)行標(biāo)準(zhǔn)化作業(yè)可以實現(xiàn)更高效率的數(shù)據(jù)挖掘。

(三)利用專業(yè)化人員進(jìn)行后期網(wǎng)絡(luò)管理維護(hù)

數(shù)據(jù)挖掘技術(shù)是持續(xù)保證企業(yè)網(wǎng)絡(luò)安全的關(guān)鍵技術(shù),因此在建設(shè)完畢后需要專業(yè)人員進(jìn)行維護(hù)和管理。企業(yè)應(yīng)當(dāng)積極聘請專業(yè)人員進(jìn)行相關(guān)維護(hù)工作,同時積極組織企業(yè)內(nèi)部人員進(jìn)行相關(guān)理論的學(xué)習(xí)與研究,與時俱進(jìn)。企業(yè)可以與高等院校形成合作關(guān)系,利用高校研究成果輔助企業(yè)健全網(wǎng)絡(luò)管理維護(hù)工作。

結(jié)語

綜上而言,數(shù)據(jù)挖掘技術(shù)是針對網(wǎng)絡(luò)安全方面目前的高效率應(yīng)用技術(shù),企業(yè)要積極針對此加以建設(shè)以防范可能發(fā)生的黑客攻擊病毒侵入導(dǎo)致的信息機(jī)密泄露事件。要不斷對該技術(shù)進(jìn)行創(chuàng)新應(yīng)對未來更多變的網(wǎng)絡(luò)環(huán)境。

參考文獻(xiàn):

[1]鄭艷君.數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中的應(yīng)用[J].計算機(jī)仿真,2011,28(12):118-121.

[2]陸科達(dá),萬勵,吳潔明等.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)安全事件預(yù)測研究[J].科技通報,2012,28(6):37-39.

[3]劉軍.數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)入侵檢測中的應(yīng)用[J].南京工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2006,28(2):79-84.

作者:史寶萍 單位:中國人民大學(xué)