前言:想要寫出一篇引人入勝的文章?我們特意為您整理了談電信網(wǎng)絡(luò)實(shí)時(shí)數(shù)據(jù)挖掘智能技術(shù)范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:目前,很多網(wǎng)絡(luò)技術(shù)已經(jīng)應(yīng)用到了方方面面。在現(xiàn)在的網(wǎng)絡(luò)發(fā)展相對不穩(wěn)定的情況下,數(shù)據(jù)挖掘技術(shù)在電信方面廣為應(yīng)用,但是通過這種技術(shù)并不能獲得更加深層次的數(shù)據(jù)信息。因此,主要從數(shù)據(jù)挖掘技術(shù)導(dǎo)論、智能技術(shù)與數(shù)據(jù)挖掘技術(shù)的結(jié)合以及相關(guān)案例對數(shù)據(jù)挖掘的智能技術(shù)進(jìn)行剖析。
關(guān)鍵詞:電信網(wǎng)絡(luò);實(shí)時(shí)數(shù)據(jù)挖掘;智能技術(shù)
引言
近年來,網(wǎng)絡(luò)技術(shù)的發(fā)展給通信技術(shù)的發(fā)展帶來了曙光,特別是電信行業(yè)的迅猛發(fā)展,更是推動了數(shù)據(jù)挖掘技術(shù)的應(yīng)用。1數(shù)據(jù)挖掘的智能技術(shù)導(dǎo)論數(shù)據(jù)挖掘技術(shù)是一種對數(shù)據(jù)進(jìn)行處理的技術(shù),將所能獲得的數(shù)據(jù)進(jìn)行深層挖掘,挖掘出常人所不熟知的潛在的有用信息。數(shù)據(jù)挖掘技術(shù)需要根據(jù)所獲得的數(shù)據(jù)類型選擇分析方法,如網(wǎng)絡(luò)結(jié)構(gòu)分析法、數(shù)據(jù)統(tǒng)計(jì)法等,該過程是一個(gè)動態(tài)重復(fù)的過程,如果在數(shù)據(jù)挖掘的過程中沒有獲得預(yù)期的數(shù)值就要重新回到前面的步驟進(jìn)行重復(fù)操作[1]。該挖掘技術(shù)的主要方法是通過對所觀測到的數(shù)據(jù)進(jìn)行解析,以天為單位或以時(shí)、分為單位對未來的數(shù)據(jù)進(jìn)行預(yù)測,根據(jù)所要研究的對象設(shè)置自變量和因變量。例如,將t作為自變量,x作為因變量來推測所產(chǎn)生的數(shù)據(jù)關(guān)系。其中t代表的是同一天(時(shí)、分)時(shí)間內(nèi)的時(shí)間間隔,x代表的是所有可預(yù)測的變化量[2]。要對電信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析,就要將這些數(shù)據(jù)進(jìn)行適當(dāng)?shù)男问睫D(zhuǎn)換。轉(zhuǎn)換以時(shí)間序列作為基礎(chǔ)。近年來,通過學(xué)者們對數(shù)據(jù)挖掘技術(shù)的不斷研究出現(xiàn)了很多以時(shí)間序列為主的數(shù)據(jù)挖掘技術(shù)。但是在電信領(lǐng)域,網(wǎng)絡(luò)環(huán)境不穩(wěn)定,尤其是數(shù)據(jù)變換具有十分頻繁的波動,所以電信網(wǎng)的問題不應(yīng)該只是數(shù)據(jù)統(tǒng)計(jì)、保管那么簡單。因此,傳統(tǒng)的數(shù)字挖掘技術(shù)將不能廣范圍的應(yīng)用于電信行業(yè)的發(fā)展。
2數(shù)據(jù)挖掘的主要過程
數(shù)據(jù)挖掘主要從數(shù)據(jù)本身出發(fā)。一般數(shù)據(jù)挖掘包括信息采集、將數(shù)據(jù)進(jìn)行整合、對數(shù)據(jù)的規(guī)范化整理、數(shù)據(jù)排除和清理、數(shù)據(jù)之間進(jìn)行變換、實(shí)施數(shù)據(jù)挖掘過程、對數(shù)據(jù)挖掘過程進(jìn)行評估、用相關(guān)的知識進(jìn)行表達(dá)八個(gè)步驟。
2.1信息采集
首先確定研究對象,根據(jù)所要研究的對象確定數(shù)據(jù)特征,然后選擇出合適的信息采集方法,收集整理所要研究的數(shù)據(jù)。對于數(shù)據(jù)量大的數(shù)據(jù)庫,選擇一個(gè)合適的保管途徑和數(shù)據(jù)存儲器是十分有必要的。
2.2將數(shù)據(jù)進(jìn)行整合
由于數(shù)據(jù)來源、格式特點(diǎn)、數(shù)據(jù)特征等性質(zhì)的不同,要有邏輯性的對所要數(shù)據(jù)進(jìn)行整理。電信行業(yè)不同于一般的商業(yè)化企業(yè),它作為世界通信過程中十分重要的一種介質(zhì),自然需要信息的共享,而這種信息數(shù)據(jù)的整合就方便了電信行業(yè)的各企業(yè)之間的資源共享[3]。
2.3對數(shù)據(jù)的規(guī)范化整理
數(shù)據(jù)挖掘技術(shù)雖然對數(shù)據(jù)匯總及分析十分方便,但是所用的時(shí)間很長,即使是對少量的數(shù)據(jù)進(jìn)行分析也需要很長的時(shí)間,而企業(yè)運(yùn)營和商業(yè)化管理往往包含的數(shù)據(jù)量是十分巨大的。所以對數(shù)據(jù)的規(guī)范化整理可以將數(shù)據(jù)庫進(jìn)行適當(dāng)程度的縮小,將大多數(shù)存在同一水平的數(shù)據(jù)進(jìn)行求平均值的處理。這樣不僅將數(shù)據(jù)挖掘技術(shù)的范圍縮小了不少,而且不會對最終數(shù)據(jù)的結(jié)果產(chǎn)生影響,甚至與原結(jié)果保持高度一致。2.4數(shù)據(jù)排除和清理在龐大的數(shù)據(jù)庫中,有的數(shù)據(jù)存在明顯的錯(cuò)誤、有的數(shù)據(jù)結(jié)構(gòu)不完整,并且這些數(shù)據(jù)面對不同的信息采集途徑時(shí)會有不同的表示方法,所以要對數(shù)據(jù)進(jìn)行排除和清理。將不完整的數(shù)據(jù)補(bǔ)充完整,存在明顯錯(cuò)誤和偶然性的數(shù)據(jù)就要舍棄,否則所得到的結(jié)果將會存在較大程度上的誤差,導(dǎo)致對整個(gè)電信行業(yè)的發(fā)展預(yù)期產(chǎn)生影響。
2.5數(shù)據(jù)之間進(jìn)行變換
數(shù)據(jù)變換的方法有很多種,如平滑聚集、數(shù)據(jù)規(guī)范化、數(shù)據(jù)概括等方式就是將數(shù)據(jù)轉(zhuǎn)化成有用的知識點(diǎn)進(jìn)行數(shù)據(jù)分析和挖掘。對于有實(shí)際作用,但是計(jì)算量大的一些數(shù)據(jù)可以采用概念分化、數(shù)據(jù)離散整合的方法進(jìn)行轉(zhuǎn)換。2.6實(shí)施數(shù)據(jù)挖掘過程根據(jù)所得數(shù)據(jù)的特征及所包含的數(shù)據(jù)信息的不同,要選擇正確的分析方法。常用的幾種分析方法有數(shù)據(jù)概括法、大規(guī)模的數(shù)據(jù)統(tǒng)計(jì)法、利用數(shù)據(jù)規(guī)則進(jìn)行推理的方法、模糊集、網(wǎng)絡(luò)結(jié)構(gòu)法(常見的為神經(jīng)網(wǎng)絡(luò))、遺傳算法、通過實(shí)例進(jìn)行推斷的方法等。通過這些方法可以將數(shù)據(jù)中存在的隱藏信息挖掘出來,給整個(gè)電信行業(yè)的發(fā)展帶來極大的商業(yè)價(jià)值。
2.7對數(shù)據(jù)挖掘過程進(jìn)行評估
這些數(shù)據(jù)大多數(shù)都是從商業(yè)途徑獲得,所以避免不了具有一定的商業(yè)價(jià)值,尤其是對于電信這一特殊的行業(yè)。所以對最終的數(shù)據(jù)進(jìn)行評估也是數(shù)據(jù)商業(yè)化的一種體現(xiàn)方式[4]。
2.8用相關(guān)的知識進(jìn)行表達(dá)
將數(shù)據(jù)挖掘的最終結(jié)果通過透明公開的方式展示給電信用戶是十分必要的。此外,將其作為商業(yè)數(shù)據(jù)密封起來以供其他方面的商業(yè)發(fā)展也是數(shù)據(jù)挖掘的另一種作用。
3數(shù)據(jù)挖掘的智能技術(shù)的預(yù)測方式
由導(dǎo)論可知,數(shù)據(jù)挖掘?yàn)楦鞣矫娴念A(yù)測做出了很大的貢獻(xiàn)。其預(yù)測方式主要包括時(shí)間序列基礎(chǔ)上的感知預(yù)測、協(xié)作組合預(yù)測以及利用網(wǎng)狀結(jié)構(gòu)模型進(jìn)行預(yù)測。
3.1時(shí)間序列基礎(chǔ)上的感知預(yù)測
將時(shí)間序列作為主要觀察量,通過觀察數(shù)據(jù)變化得出計(jì)算公式,將計(jì)算公式中的斜率值代入,取代時(shí)間序列的值。主要通過斜率值的變化來觀測最接近于實(shí)際的數(shù)值,進(jìn)而對全局模式進(jìn)行預(yù)測。但是,在此過程中需要注意考慮時(shí)間序列存在的隨機(jī)性和偶然性,要建立可靠的描述圖進(jìn)行觀察,對一些具有明顯誤差的數(shù)據(jù)和具有偶然性的數(shù)據(jù)進(jìn)行刪除,通過觀察平均數(shù)據(jù)得出結(jié)論。更需要注意的是,由于電信號的不穩(wěn)定性使得電信號會在短時(shí)間內(nèi)出現(xiàn)多次數(shù)據(jù)波動,所以,每隔一段時(shí)間就要對電信號根據(jù)脈沖進(jìn)行分類。從最相似的數(shù)據(jù)中提取出符合實(shí)際和電信號波動范圍的數(shù)值,并將該數(shù)值應(yīng)用到全局觀測的位置。
3.2協(xié)作組合預(yù)測
數(shù)據(jù)挖掘的智能技術(shù)的預(yù)測方式有很多種,但他們都有一個(gè)共同點(diǎn)就是預(yù)測的基礎(chǔ)都是時(shí)間序列。這些不同的預(yù)測方式之間必定存在不同的優(yōu)勢和劣勢,所以就需要對不同的預(yù)測方式即進(jìn)行組合,協(xié)調(diào)出相對完善的預(yù)測方式。其中的協(xié)作主要是該過程中多方之間的協(xié)作,即當(dāng)存在多種時(shí),需要一種外在的具有沖擊性的策略對其進(jìn)行調(diào)整。對于這一問題,很多學(xué)者的解決策略都只是側(cè)重于將數(shù)據(jù)進(jìn)行分類整理,并沒有考慮到最佳數(shù)值的組合[5]。
3.3利用網(wǎng)狀結(jié)構(gòu)模型進(jìn)行預(yù)測(以神經(jīng)網(wǎng)絡(luò)為例)
由斜率等替代量觀測出各水平變量的等量變化。網(wǎng)狀模型結(jié)構(gòu)特別是神經(jīng)網(wǎng)絡(luò)相對于其他結(jié)構(gòu),預(yù)測性、準(zhǔn)確性要高。它可以準(zhǔn)確地計(jì)算出7個(gè)自變量和1個(gè)因變量之間的運(yùn)算關(guān)系。其主要計(jì)算方式為線性函數(shù)、激活函數(shù)等。在規(guī)定的區(qū)間、特定的節(jié)點(diǎn)內(nèi),將該輸入節(jié)點(diǎn)的輸入信號與對應(yīng)的加權(quán)數(shù)相乘,就可以將各輸入神經(jīng)之間連接起來,由脈沖信號轉(zhuǎn)變?yōu)殡娦盘柊l(fā)出。
4數(shù)據(jù)挖掘的智能技術(shù)的框架模式
數(shù)據(jù)挖掘的智能技術(shù)常用的框架模式為多框架模式,即借助于多個(gè)實(shí)現(xiàn)對網(wǎng)絡(luò)信號及電信號的監(jiān)測和控制。該框架模式通過環(huán)球網(wǎng)的服務(wù)完成了不同的監(jiān)管任務(wù)。該框架模式的主要步驟具體如下。最初是通過各種途徑收集用戶的相關(guān)信息和電信號的網(wǎng)絡(luò)數(shù)據(jù)。將這些數(shù)據(jù)進(jìn)行整合、篩選后就會將這些數(shù)據(jù)發(fā)送給相關(guān)管理員,進(jìn)行保管。這樣的過程主要是為了將一些錯(cuò)誤的數(shù)據(jù)及具有偶然性的數(shù)據(jù)排除在外,保證預(yù)測結(jié)果的準(zhǔn)確性。主要預(yù)測的目標(biāo)為網(wǎng)絡(luò)延時(shí)狀態(tài)、鏈接程序的接受率、服務(wù)器所能承載的負(fù)荷等。其中,鏈接程序的接受率是預(yù)測的重點(diǎn),它直接關(guān)系到后面服務(wù)器所能承載的負(fù)荷的情況。然后是對變量之間的變化關(guān)系進(jìn)行推斷及相關(guān)運(yùn)算。運(yùn)用各感知系統(tǒng)對預(yù)測進(jìn)行感知預(yù)測,但是由于數(shù)據(jù)是一直在變化的,所以在監(jiān)測時(shí)間內(nèi)每隔一段時(shí)間就要對數(shù)據(jù)進(jìn)行重新采取、計(jì)算和評估。在此過程中需要注意的是,有些時(shí)間段內(nèi)數(shù)據(jù)波動范圍會比較大,有些時(shí)間段內(nèi)數(shù)據(jù)波動范圍比較小,所謂對于時(shí)間段的選取也要有充分的考慮。
5各數(shù)據(jù)結(jié)構(gòu)所產(chǎn)生的實(shí)驗(yàn)結(jié)果分析
通過建立模型器和引用模型結(jié)構(gòu)建立模擬環(huán)境可以將各變量之間的數(shù)據(jù)關(guān)系展現(xiàn)出來。但是,同樣的數(shù)據(jù)關(guān)系通過智能技術(shù)也可以獲得。這些數(shù)據(jù)關(guān)系依然是建立在時(shí)間序列的基礎(chǔ)上,便于對后臺的各統(tǒng)計(jì)數(shù)據(jù)、服務(wù)器的負(fù)荷能力進(jìn)行統(tǒng)計(jì)[6]。例如,在一家工廠中設(shè)計(jì)出了一個(gè)網(wǎng)狀統(tǒng)計(jì)結(jié)構(gòu),在該結(jié)構(gòu)中可以看到該企業(yè)的信息獲取途徑和索取手段。這時(shí)可以將該企業(yè)的所有數(shù)據(jù)分為三個(gè)層面:全局統(tǒng)計(jì)數(shù)據(jù)、斷點(diǎn)(階段性)數(shù)據(jù)統(tǒng)計(jì)和鏈接程序數(shù)據(jù)統(tǒng)計(jì)。運(yùn)用這些不同層面的數(shù)據(jù)進(jìn)行計(jì)算,計(jì)算最后出現(xiàn)的數(shù)據(jù)代表著該事件中各變量之間的變化關(guān)系,這種關(guān)系同樣是建立在時(shí)間序列的基礎(chǔ)上的。例如,根據(jù)計(jì)算結(jié)果可以得到200個(gè)有效數(shù)據(jù)。這些數(shù)據(jù)中,每一個(gè)數(shù)據(jù)都可以代表一個(gè)變量。對于時(shí)間序列與這些變量之間的關(guān)系要進(jìn)行預(yù)處理。首先,對這些變量之間的變化關(guān)系進(jìn)行線性分析,得到一個(gè)新的數(shù)據(jù)組,然后利用這一新的數(shù)據(jù)組之間的變化量的變化關(guān)系來推測鏈接程序的接受率。當(dāng)然,并不是這組數(shù)據(jù)中的所有數(shù)值都可以拿來進(jìn)行數(shù)據(jù)推測,我們可以將其中大部分?jǐn)?shù)值代入到計(jì)算公式中進(jìn)行計(jì)算,剩下的一小部分作為數(shù)據(jù)驗(yàn)證。因?yàn)檫@種數(shù)據(jù)分布具有一定的隨機(jī)性,所以這種數(shù)據(jù)計(jì)算并不適合建立在時(shí)間序列的基礎(chǔ)上。
6結(jié)論
為了研究電信行業(yè)中大規(guī)模數(shù)據(jù)如何處理的問題,本文就數(shù)據(jù)挖掘的智能技術(shù)進(jìn)行了討論,看到了多框架模式的高效性、準(zhǔn)確性,體會到了數(shù)據(jù)挖掘技術(shù)的優(yōu)點(diǎn)及其不同的預(yù)測方法。
參考文獻(xiàn):
[1]戴勇,王詩卉.創(chuàng)新網(wǎng)絡(luò)守門人區(qū)域比較研究:以電信領(lǐng)域?yàn)槔齕J].科研管理,2019,40(7):106-118.
[2]汪明達(dá),周俏麗,蔡東風(fēng).采用混合模型的電信領(lǐng)域用戶流失預(yù)測[J/OL].計(jì)算機(jī)工程與應(yīng)用,2019,(9):1-15.
[3]侯全心,陳烈強(qiáng),張式娟,等.中國電信與中國聯(lián)通網(wǎng)絡(luò)建設(shè)領(lǐng)域深度合作思路探討[J].郵電設(shè)計(jì)技術(shù),2016,(9):74-77.
[4]魯義軒.聯(lián)想與瞻博網(wǎng)絡(luò)再合作借國際經(jīng)驗(yàn)進(jìn)軍電信領(lǐng)域DC市場[J].通信世界,2016,(24):49.
[5]陳曉.網(wǎng)絡(luò)安全建設(shè)在電信領(lǐng)域的應(yīng)用[J].科技經(jīng)濟(jì)市場,2016,(7):63-65.
[6]莫建麟,廖建鋒.電信網(wǎng)絡(luò)領(lǐng)域?qū)崟r(shí)數(shù)據(jù)挖掘的智能技術(shù)[J].光通信研究,2013,(3):7-10,21.
作者:張英繼 單位:中國電信股份有限公司保定分公司