前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。
關(guān)鍵詞:大數(shù)據(jù)技術(shù)數(shù)據(jù)挖掘數(shù)據(jù)采集海量異構(gòu)數(shù)據(jù)數(shù)據(jù)可視化
引言
在云計(jì)算、物聯(lián)網(wǎng)等一系列信息技術(shù)快速發(fā)展的方向,各種移動(dòng)智能設(shè)備、傳感網(wǎng)絡(luò)、電商網(wǎng)站、網(wǎng)絡(luò)社交在運(yùn)行的過程中時(shí)時(shí)刻刻產(chǎn)生數(shù)據(jù),這些數(shù)據(jù)發(fā)揮出了重要的作用。大數(shù)據(jù)的體量越來越大、類型越來越多,逐漸影響各行業(yè)的生產(chǎn)與發(fā)展。只有掌握大數(shù)據(jù)挖掘的關(guān)鍵技術(shù)[1-11],才能更好地發(fā)揮大數(shù)據(jù)的價(jià)值。本文首先針對(duì)大數(shù)據(jù)的定義和特征進(jìn)行了分析。
1大數(shù)據(jù)技術(shù)與數(shù)據(jù)挖掘
當(dāng)前時(shí)代背景下,大數(shù)據(jù)不僅滲透到了行業(yè)的各個(gè)領(lǐng)域也進(jìn)入到人們的生活生產(chǎn)之中,大數(shù)據(jù)已經(jīng)是一個(gè)社會(huì)所討論的熱點(diǎn)問題。具體來說,大數(shù)據(jù)是指所涉及的數(shù)據(jù)規(guī)模巨大,并且無法利用主流軟件工具在短時(shí)間內(nèi)進(jìn)行管理、處理和挖掘的數(shù)據(jù),通過企業(yè)的經(jīng)營(yíng)和決策將之轉(zhuǎn)換為有用的信息。大數(shù)據(jù)的特征主要體現(xiàn)在4個(gè)方面,(1)數(shù)據(jù)體量巨大,針對(duì)大數(shù)據(jù)的體量衡量已經(jīng)由TB躍升到PB級(jí)別。2()是大數(shù)據(jù)的數(shù)據(jù)類型具有多樣性的特征,根據(jù)社會(huì)的各個(gè)行業(yè)分類不同,大數(shù)據(jù)的類型分類也有所不同,例如包括了傳統(tǒng)格式化的數(shù)據(jù)類型,也包括來自互聯(lián)網(wǎng)的視頻圖片、位置、網(wǎng)絡(luò)日志等。(3)大數(shù)據(jù)具有極快的速度,即處理速度快。(4)大數(shù)據(jù)具有較高的應(yīng)用價(jià)值,大數(shù)據(jù)的特點(diǎn)還體現(xiàn)在追求高質(zhì)量的數(shù)據(jù)方面,這也是大數(shù)據(jù)的基本特征。大數(shù)據(jù)挖掘與分析的意義。在進(jìn)行大數(shù)據(jù)挖掘的過程中,數(shù)據(jù)分析設(shè)計(jì)核心流程,在互聯(lián)網(wǎng)迅猛發(fā)展的當(dāng)下數(shù)據(jù)分析的需求越來越高,同時(shí)信息數(shù)據(jù)也產(chǎn)生出了巨大的價(jià)值。在長(zhǎng)期發(fā)展的過程中大數(shù)據(jù)已經(jīng)逐漸演變成一種產(chǎn)業(yè),在產(chǎn)業(yè)中利潤(rùn)最高的地方便在于如何提高數(shù)據(jù)的分析能力,通過對(duì)數(shù)據(jù)的分析與挖掘,能夠挖掘出數(shù)據(jù)的更多潛在價(jià)值,在當(dāng)前的大數(shù)據(jù)時(shí)代,針對(duì)數(shù)據(jù)進(jìn)行挖掘與分析是實(shí)現(xiàn)數(shù)據(jù)價(jià)值的重要環(huán)節(jié),也是決策的重要決定性元素。針對(duì)傳統(tǒng)的數(shù)據(jù)進(jìn)行分析主要是針對(duì)結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行分析與挖掘,并且在長(zhǎng)期應(yīng)用的過程中形成了成套的分析體系。但在當(dāng)前的大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)體量不斷增多數(shù)據(jù)類型越來越多,也使得半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)不斷增長(zhǎng),導(dǎo)致傳統(tǒng)的數(shù)據(jù)分析技術(shù)面臨巨大挑戰(zhàn)和沖擊。因此,只有探索基于大數(shù)據(jù)挖掘的數(shù)據(jù)分析技術(shù),才能夠滿足大數(shù)據(jù)挖掘的現(xiàn)實(shí)需要。
2大數(shù)據(jù)挖掘的關(guān)鍵技術(shù)
2.1大數(shù)據(jù)的采集
針對(duì)大數(shù)據(jù)采集是實(shí)現(xiàn)大數(shù)據(jù)挖掘的基礎(chǔ)和前提,在數(shù)據(jù)采集的過程中需要根據(jù)不同的需求對(duì)數(shù)據(jù)進(jìn)行識(shí)別和感知,首先在基礎(chǔ)支撐層可以針對(duì)平臺(tái)中所蘊(yùn)含的數(shù)據(jù)進(jìn)行必要的核對(duì),在此基礎(chǔ)上根據(jù)數(shù)據(jù)庫(kù)技術(shù)借助運(yùn)營(yíng)商上對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行處理,使之更好地滿足實(shí)際需求,在數(shù)據(jù)整合處理的過程中,通過企業(yè)的決策信息使之更好地指導(dǎo)企業(yè)的發(fā)展提高企業(yè)自身的運(yùn)營(yíng)能力。在大家的互聯(lián)網(wǎng)時(shí)代,每天都會(huì)從互聯(lián)網(wǎng)上產(chǎn)生海量的數(shù)據(jù)信息,這些數(shù)據(jù)一方面滿足了客戶的需求,另一方面企業(yè)通過對(duì)這些數(shù)據(jù)信息進(jìn)行設(shè)計(jì),能夠發(fā)現(xiàn)更具有潛力的市場(chǎng),從而展現(xiàn)出更高的價(jià)值。當(dāng)前,在數(shù)據(jù)采集的過程中,單一用戶位置、信息價(jià)值等蘊(yùn)含的數(shù)據(jù)含量?jī)r(jià)值相對(duì)較低,而為了更好地提高數(shù)據(jù)整體的價(jià)值,需要從更加多元的角度出發(fā)進(jìn)行數(shù)據(jù)收集。尤其是在當(dāng)前的網(wǎng)絡(luò)環(huán)境下,借助聚類和關(guān)聯(lián)的分析能夠收集到更加完整的數(shù)據(jù),使之更好地展現(xiàn)其價(jià)值。
2.2大數(shù)據(jù)預(yù)處理技術(shù)
大數(shù)據(jù)預(yù)處理技術(shù)是在數(shù)據(jù)挖掘前對(duì)數(shù)據(jù)進(jìn)行前期清理、集成、歸納。通過大數(shù)據(jù)預(yù)處理技術(shù),能夠針對(duì)海量的數(shù)據(jù)信息進(jìn)行審核和價(jià)值分析,總有篩選出有用的信息。通過大數(shù)據(jù)數(shù)量的增加對(duì)各項(xiàng)數(shù)據(jù)進(jìn)行綜合匯總,進(jìn)一步提高數(shù)據(jù)處理的效果。應(yīng)用大數(shù)據(jù)預(yù)處理技術(shù)的過程中也分為前期處理、中期處理和后期處理。(1)前期處理是借助大數(shù)據(jù)挖掘技術(shù)針對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行挖掘,從而實(shí)現(xiàn)數(shù)據(jù)信息的分類和整理工作;(2)中期處理是數(shù)據(jù)處理的過程中,針對(duì)非結(jié)構(gòu)數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行有效預(yù)處理,并且選取數(shù)據(jù)核心中的數(shù)據(jù)量,為接下來的核心流程做好準(zhǔn)備;(3)后期數(shù)據(jù)處理是根據(jù)數(shù)據(jù)庫(kù)中的持續(xù)支持和關(guān)鍵數(shù)據(jù),通過有效整合對(duì)數(shù)據(jù)進(jìn)行必要挖掘和搜索。
2.3大數(shù)據(jù)管理技術(shù)
借助數(shù)據(jù)管理能夠幫助信息數(shù)據(jù)在復(fù)雜的應(yīng)用系統(tǒng)中,多樣化的互聯(lián)網(wǎng)設(shè)備,對(duì)海量的數(shù)據(jù)進(jìn)行收集匯總。物聯(lián)網(wǎng)系統(tǒng)中的數(shù)據(jù)復(fù)雜多樣,隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,對(duì)于各類數(shù)據(jù)的應(yīng)用場(chǎng)景也在不斷演變,使得數(shù)據(jù)的類型越發(fā)多樣。因此,只有借助大數(shù)據(jù)管理技術(shù)從不同的維度出發(fā)對(duì)數(shù)據(jù)進(jìn)行有效的分析和管理,才能對(duì)數(shù)據(jù)進(jìn)行高效整理,從而根據(jù)不同行業(yè)的需求挖掘相應(yīng)的技術(shù),根據(jù)具體設(shè)計(jì)的系統(tǒng)框架提高數(shù)據(jù)的利用價(jià)值和效率。
2.4大數(shù)據(jù)處理和可視化技術(shù)
大數(shù)據(jù)信息具備快速處理的特點(diǎn),因此在進(jìn)行數(shù)據(jù)信息整理的過程中,如果針對(duì)數(shù)據(jù)信息不能及時(shí)處理,那么有用的數(shù)據(jù)信息可能因此錯(cuò)過,進(jìn)而難以展現(xiàn)其數(shù)據(jù)價(jià)值。因此,在數(shù)據(jù)處理的過程中需要針對(duì)數(shù)據(jù)信息進(jìn)行實(shí)時(shí)挖掘,也要進(jìn)行在線管理,這樣才能保證數(shù)據(jù)質(zhì)量不斷提升,進(jìn)一步提高數(shù)據(jù)的利用效率。不僅如此,針對(duì)數(shù)據(jù)算法和數(shù)據(jù)模式進(jìn)行有效分析的過程中,借助數(shù)據(jù)的可視化技術(shù)能夠?qū)⒂?jì)算機(jī)的融合與認(rèn)知功能進(jìn)行進(jìn)一步提升,采用人機(jī)交互的方式對(duì)數(shù)據(jù)進(jìn)行有效整合。
2.5海量異構(gòu)數(shù)據(jù)處理
互聯(lián)網(wǎng)的飛速發(fā)展使得海量機(jī)構(gòu)數(shù)據(jù)的種類越來越多,數(shù)據(jù)的類型也越來越繁雜,這就需要加快數(shù)據(jù)處理的速度才能提高數(shù)據(jù)挖掘的效果。但從現(xiàn)實(shí)情況來看,在數(shù)據(jù)處理的過程中由于技術(shù)和理念的落后,經(jīng)常會(huì)降低數(shù)據(jù)信息的使用價(jià)值,因此這就需要借助大數(shù)據(jù)技術(shù)對(duì)信息進(jìn)行有效的處理通過集成模塊和數(shù)據(jù)庫(kù)整理,實(shí)現(xiàn)數(shù)據(jù)的深度融合,進(jìn)而更加有效的利用數(shù)據(jù)。在數(shù)據(jù)處理的過程中借助必要的探測(cè)模塊,能夠針對(duì)數(shù)據(jù)劃分出在線時(shí)間、進(jìn)行時(shí)間和離線時(shí)間,這樣能夠進(jìn)一步提高數(shù)據(jù)的分析和計(jì)算能力,進(jìn)而最大程度挖掘出數(shù)據(jù)的價(jià)值。
3結(jié)語(yǔ)
在當(dāng)前時(shí)代背景下互聯(lián)網(wǎng)和信息技術(shù)飛速發(fā)展使得數(shù)據(jù)信息發(fā)揮出了更大的價(jià)值,然而實(shí)現(xiàn)這種價(jià)值的前提是對(duì)數(shù)據(jù)進(jìn)行有效的挖掘和處理,加之?dāng)?shù)據(jù)應(yīng)用的范圍越來越廣泛,傳統(tǒng)的數(shù)據(jù)處理方法已經(jīng)難以滿足大數(shù)據(jù)時(shí)代信息數(shù)據(jù)處理的需求。因此,大數(shù)據(jù)挖掘關(guān)鍵技術(shù)尤為重要,通過分析大數(shù)據(jù)挖掘與分析的關(guān)鍵技術(shù),能夠更好地管理大數(shù)據(jù),挖掘數(shù)據(jù)信息,使之更好地服務(wù)于企業(yè)和社會(huì)的發(fā)展。
參考文獻(xiàn)
[1]黃哲學(xué),曹付元,李俊杰,陳小軍.面向大數(shù)據(jù)的海云數(shù)據(jù)系統(tǒng)關(guān)鍵技術(shù)研究[J].網(wǎng)絡(luò)新媒體技術(shù),2012,1(06):20-26.
[2]陳良臣.大數(shù)據(jù)挖掘與分析的關(guān)鍵技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2015(11):93+96.
[3]曹存洋.大數(shù)據(jù)挖掘與分析的關(guān)鍵技術(shù)研究[J].通訊世界,2017(17):55-56.
[4]付琳.大數(shù)據(jù)處理系統(tǒng)模式及其應(yīng)用分析[J].集成電路應(yīng)用,2018,35(12):30-31.
[5]龔芳海,李文彪.基于互聯(lián)網(wǎng)的大數(shù)據(jù)挖掘關(guān)鍵技術(shù)分析[J].無線互聯(lián)科技,2018,15(04):59-60.
[6]蔡靜穎.大數(shù)據(jù)挖掘關(guān)鍵技術(shù)的分析與研究[J].產(chǎn)業(yè)科技創(chuàng)新,2020,2(34):33-34.
[7]崔巍.大數(shù)據(jù)挖掘與分析的關(guān)鍵技術(shù)研究[J].中國(guó)新通信,2020,22(08):62.
[8]楊威.基于大數(shù)據(jù)的計(jì)算機(jī)信息處理技術(shù)分析[J].集成電路應(yīng)用,2020,37(08):62-63.
[9]程文聰.面向大規(guī)模網(wǎng)絡(luò)安全態(tài)勢(shì)分析的時(shí)序數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D].湖南:國(guó)防科學(xué)技術(shù)大學(xué),2010.
[10]楊杰.基于時(shí)空軌跡大數(shù)據(jù)的群體行為模式挖掘分析關(guān)鍵技術(shù)[D].江蘇:東南大學(xué),2015.
[11]韓晶.大數(shù)據(jù)服務(wù)若干關(guān)鍵技術(shù)研究[D].北京:北京郵電大學(xué),2013.
作者:迎梅 單位:呼和浩特民族學(xué)院
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)