公務(wù)員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)時代數(shù)據(jù)挖掘思考分析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)時代數(shù)據(jù)挖掘思考分析范文,希望能給你帶來靈感和參考,敬請閱讀。

大數(shù)據(jù)時代數(shù)據(jù)挖掘思考分析

摘要:科學(xué)技術(shù)的發(fā)展與變化給人們的生活帶來了較多的便利,大數(shù)據(jù)時代的來臨也讓人們感受到了數(shù)據(jù)信息的重要性。結(jié)合當(dāng)前大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)的發(fā)展變化過程進(jìn)行分析,研究合理應(yīng)用數(shù)據(jù)挖掘技術(shù)的策略措施,期望通過對大數(shù)據(jù)時代未來的發(fā)展展望,展現(xiàn)出數(shù)據(jù)挖掘技術(shù)的有效作用以及相關(guān)信息價值,進(jìn)而讓人們體會到大數(shù)據(jù)等先進(jìn)技術(shù)的有效應(yīng)用與價值。

關(guān)鍵詞:大數(shù)據(jù)時代;數(shù)據(jù)挖掘技術(shù);應(yīng)用

大數(shù)據(jù)時代,信息數(shù)據(jù)處理水平已經(jīng)成為各行業(yè)發(fā)展的核心競爭力與發(fā)展基礎(chǔ)。深入挖掘數(shù)據(jù)信息中存在的價值,合理運用數(shù)據(jù)挖掘技術(shù)提升數(shù)據(jù)價值,不僅能夠及時掌握市場行業(yè)的未來發(fā)展動向,也能夠幫助一些企業(yè)解決當(dāng)前存在的發(fā)展危機。尤其是一些對信息技術(shù)應(yīng)用要求比較高的重要發(fā)展領(lǐng)域,合理運用數(shù)據(jù)挖掘技術(shù),不僅能夠在混亂的信息數(shù)據(jù)中發(fā)現(xiàn)隱藏的商機與未來發(fā)展市場,也能夠直接結(jié)合企業(yè)的實際發(fā)展目標(biāo)與實力,創(chuàng)造出更多的生產(chǎn)價值與自我提升空間。

1數(shù)據(jù)挖掘

1.1概念

數(shù)據(jù)挖掘技術(shù)顧名思義,需要在大量且繁雜的數(shù)據(jù)中挖掘出具有價值意義的數(shù)據(jù)信息。就一般情況來說,數(shù)據(jù)挖掘主要應(yīng)用在文本數(shù)據(jù)以及圖像數(shù)據(jù)中,作為分析、整理或者預(yù)測風(fēng)險的基礎(chǔ)技術(shù)手段,數(shù)據(jù)挖掘技術(shù)能夠在海量的信息數(shù)據(jù)中精確尋找到目標(biāo)數(shù)據(jù)內(nèi)容。當(dāng)然,面對不同的應(yīng)用領(lǐng)域,數(shù)據(jù)挖掘技術(shù)也需要根據(jù)實際情況做好具體的分析,甚至需要配合不同場景情況以及需求進(jìn)行合理升級、轉(zhuǎn)型應(yīng)用。其中,數(shù)據(jù)挖掘技術(shù)在商業(yè)市場的用途相對比較廣泛,一些企業(yè)或者公司為了提升企業(yè)或者品牌的核心競爭力,可能會利用數(shù)據(jù)挖掘處理技術(shù)處理客戶信息,首先可以在客戶數(shù)據(jù)庫中提取眾多目標(biāo)信息類型,然后結(jié)合不同的公式算法分析出適合企業(yè)未來的商業(yè)發(fā)展目標(biāo),根據(jù)用戶的接受程度與營銷業(yè)績進(jìn)行相應(yīng)的技術(shù)創(chuàng)新與管理改革,在有效提升企業(yè)業(yè)績的同時,也能夠拓展市場影響力[1]。

1.2實際過程解析

當(dāng)前社會,利用數(shù)據(jù)信息創(chuàng)造經(jīng)濟價值已經(jīng)比較常見,作為時展的流行趨勢,數(shù)據(jù)挖掘技術(shù)確實展現(xiàn)了比較突出的時展特征。(1)收集并提取信息。想要獲取有價值的信息內(nèi)容,海量的數(shù)據(jù)基礎(chǔ)是實現(xiàn)目標(biāo)的第一步,類似于傳統(tǒng)觀念中的“積累經(jīng)驗”,大量的數(shù)據(jù)信息收集能夠減少眾多“試錯”的成本,比如:商業(yè)營銷項目方案在開始設(shè)計之前可以利用現(xiàn)有的數(shù)據(jù)庫信息整理出適合的目標(biāo)區(qū)域或者客戶群體,在有效提升市場調(diào)查效率與成果質(zhì)量的同時,也能夠保障營銷方案的成功率。相對于傳統(tǒng)時期分發(fā)大量的征集表格,網(wǎng)絡(luò)信息傳播的效率也比較高,而且隱秘性的信息征集模式也能夠提升數(shù)據(jù)信息質(zhì)量。(2)利用合適的數(shù)據(jù)信息處理模型或者公式篩選有價值的信息數(shù)據(jù)。大數(shù)據(jù)時代,信息收集速度確實比較快,且相對應(yīng)的成本也比較低,但是,頻繁地進(jìn)行數(shù)據(jù)收集也存在一些弊端,尤其是在信息質(zhì)量問題上,廣泛的來源可能意味著數(shù)據(jù)信息質(zhì)量也會存在參差不齊等問題,甚至一些數(shù)據(jù)處理模型由于建立初期的方向比較不合適,處理后的信息結(jié)果也可能會存在一定的誤導(dǎo)性,為了避免后期呈現(xiàn)錯誤結(jié)果,項目在初期階段,數(shù)據(jù)整理期間做好篩選工作,避免后期結(jié)果校對期間發(fā)現(xiàn)問題原因,提升數(shù)據(jù)處理成本。(3)分析結(jié)果的處理與改進(jìn)。數(shù)據(jù)挖掘技術(shù)并不是簡單工具,其本身就具有一定的學(xué)習(xí)能力,一些項目在不斷增加數(shù)據(jù)處理量的情況下,數(shù)據(jù)挖掘技術(shù)處理后的數(shù)據(jù)結(jié)果一般具有較高的精確性,但是,數(shù)據(jù)收集期間,系統(tǒng)可能也會由于算法的升級或者自主學(xué)習(xí)能力,運用了一些模塊化的技術(shù)處理方式,忽視了信息數(shù)據(jù)中本身存在的差異性問題,進(jìn)而技術(shù)應(yīng)用期間也需要注意及時維護(hù),不能由于過度依賴數(shù)據(jù)挖掘技術(shù)忽視數(shù)據(jù)信息的發(fā)展規(guī)律??梢远ㄆ谶M(jìn)行數(shù)據(jù)算法的調(diào)整分析,在有效提升數(shù)據(jù)模型準(zhǔn)確性的同時,也能夠避免智能信息處理系統(tǒng)出現(xiàn)問題。

2數(shù)據(jù)挖掘方式

2.1聚類分析

簡化數(shù)據(jù)信息,通過將類似的信息數(shù)據(jù)進(jìn)行整理,能夠獲得具有較多共通性的數(shù)據(jù)信息內(nèi)容。大數(shù)據(jù)時代背景下,利用聚類分析的數(shù)據(jù)挖掘技術(shù)分析目標(biāo)數(shù)據(jù),就會發(fā)現(xiàn)不同信息數(shù)據(jù)存在的共通性特點。這種總結(jié)分析多種數(shù)據(jù)中潛在規(guī)律的方式就被稱作為聚類分析方式。一般來說,聚類分析方式會用于生物學(xué)、應(yīng)用心理學(xué)以及人工智能學(xué)習(xí)等領(lǐng)域,在實際應(yīng)用期間會根據(jù)不同層次或者類型的數(shù)據(jù)信息,進(jìn)行聚類整合分析,不僅能夠有效提升數(shù)據(jù)處理效率,也能夠及時總結(jié)信息數(shù)據(jù)中存在的潛在規(guī)律。

2.2關(guān)聯(lián)性分析

不同事物與信息數(shù)據(jù)中,往往會存在一定的關(guān)聯(lián)性,針對不同信息數(shù)據(jù)中存在的關(guān)聯(lián)性進(jìn)行挖掘,就會發(fā)現(xiàn)其中蘊含的規(guī)律問題,針對該類型的數(shù)據(jù)挖掘分析方式就被稱作為關(guān)聯(lián)性分析法。比如:在超市等大型營銷環(huán)境中,收集用戶信息已經(jīng)成為行業(yè)發(fā)展共識。一般超市會利用后臺數(shù)據(jù)收集用戶的購買數(shù)據(jù),并根據(jù)數(shù)據(jù)發(fā)展趨勢分析出不同年齡或者群體用戶的大概消費習(xí)慣,精確性的營銷方案能夠有效提升營業(yè)業(yè)績。定期開展會員積分兌換、會員日等優(yōu)惠活動,就能夠提升會員用戶的消費積極性,進(jìn)而在數(shù)據(jù)采集期間利用關(guān)聯(lián)性的數(shù)據(jù)分析方式,了解范圍內(nèi)會員的消費習(xí)慣趨勢,通過數(shù)據(jù)信息的深入挖掘與整理,分析出不同商品之間的關(guān)聯(lián)性。其中,一些商超會利用“買一贈一”、高低利潤物品捆綁銷售等營銷方案,激發(fā)消費者的購買欲望,提升營業(yè)業(yè)績,消耗積壓庫存,在不斷提升營業(yè)業(yè)績的同時,也能夠利用數(shù)據(jù)調(diào)查回饋調(diào)整采購方案[2]。

2.3神經(jīng)網(wǎng)絡(luò)模擬分析

相對于其他物種,人類的大腦一直是各種高科技研究領(lǐng)域的核心研究對象,利用數(shù)據(jù)模型模擬人類大腦的神經(jīng)網(wǎng)絡(luò)工作模式,能夠在處理一些精細(xì)化數(shù)據(jù)、非線性數(shù)據(jù)或者特殊性數(shù)據(jù)應(yīng)用情境中發(fā)揮較強的優(yōu)勢。當(dāng)前,比較常見的人工神經(jīng)網(wǎng)絡(luò)的模擬系統(tǒng),一般都是由特殊算法以及反向的傳播網(wǎng)絡(luò)、函數(shù)算法神經(jīng)網(wǎng)絡(luò)等方式組合而成的。

2.4遺傳基因算法分析

遺傳基因與大腦神經(jīng)元網(wǎng)絡(luò)都是大數(shù)據(jù)時代數(shù)據(jù)分析期間主要研究、突破的方向,相對于比較系統(tǒng)化的人工神經(jīng)網(wǎng)絡(luò),遺傳基因具有較多變量特征,對于不同形式的信息數(shù)據(jù)演變變化也具有一定的預(yù)測能力。目前來說,遺傳基因式的算法分析主要應(yīng)用在信息系統(tǒng)中的風(fēng)險評估等領(lǐng)域,在未來發(fā)展期間也具有較為廣闊的市場前景。

3應(yīng)用思考

大數(shù)據(jù)時代,數(shù)據(jù)挖掘技術(shù)的應(yīng)用價值具有較多隱藏的開發(fā)空間,不同的領(lǐng)域與行業(yè)在實際應(yīng)用期間可能會遇到不同的問題情況。針對不同領(lǐng)域的實際應(yīng)用情況進(jìn)行分析,研究數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用方式,不僅能夠有效促進(jìn)各行業(yè)的發(fā)展與進(jìn)步,也能夠根據(jù)時代技術(shù)發(fā)展變化進(jìn)行相應(yīng)的調(diào)整與整理[3]。

3.1商業(yè)市場發(fā)展

數(shù)據(jù)信息技術(shù)的發(fā)展價值起初就已經(jīng)應(yīng)用在市場營銷領(lǐng)域,對于市場行業(yè)來說,商業(yè)價值是數(shù)據(jù)挖掘技術(shù)的主要應(yīng)用方向,眾多商業(yè)企業(yè)與單位想要保障營銷業(yè)績,可以通過加強大數(shù)據(jù)應(yīng)用的方式,分析總結(jié)消費者的消費習(xí)慣、消費水平以及相關(guān)的消費特點。結(jié)合實際的銷售業(yè)績與數(shù)據(jù)分析結(jié)果,選擇合適的營銷策略以及方案,通過營銷業(yè)績的不斷提升與進(jìn)步,推動企業(yè)經(jīng)濟水平與核心競爭力不斷提升與進(jìn)步。另外,關(guān)于商業(yè)投資方面,也可以應(yīng)用數(shù)據(jù)挖掘技術(shù),當(dāng)前信息化大量普及的社會發(fā)展背景下,眾多企業(yè)與經(jīng)營者的信息都會被錄入信息數(shù)據(jù)庫,想要了解投資項目中合作方的經(jīng)濟實力以及多方面信息,不僅可以利用數(shù)據(jù)分析結(jié)果了解,也能夠分析出合作方的未來發(fā)展形式,通過風(fēng)險預(yù)估等方式最大程度減少企業(yè)經(jīng)濟損失風(fēng)險。當(dāng)然,一些小型的金融貸款業(yè)務(wù)也可以利用數(shù)據(jù)分析結(jié)果,判定客戶是否具有經(jīng)濟還款實力,多維度以及高時效性的監(jiān)控管理,不僅能夠及時調(diào)整信貸策略,也能夠避免市場發(fā)展變化影響企業(yè)穩(wěn)定發(fā)展。

3.2科學(xué)項目研究

科學(xué)的發(fā)展與進(jìn)步離不開技術(shù)水平的不斷上升,信息技術(shù)在當(dāng)前的科學(xué)研究領(lǐng)域的應(yīng)用已經(jīng)比較普遍,尤其是一些人工智能科學(xué)技術(shù)的研究,數(shù)據(jù)挖掘技術(shù)不僅能夠通過優(yōu)勢的信息數(shù)據(jù)基礎(chǔ),也能夠通過一些算法公式的優(yōu)化,提升技術(shù)發(fā)展水平。尤其是一些項目類型比較復(fù)雜的科學(xué)實驗,大量的數(shù)據(jù)信息不僅儲存記錄比較費時費力,人工數(shù)據(jù)處理可有力會由于各種不足造成數(shù)據(jù)結(jié)果的偏差,數(shù)據(jù)技術(shù)的應(yīng)用不僅解決了相關(guān)信息儲存問題,也能夠直接處理數(shù)據(jù)信息之間存在的細(xì)微差別,通過對比分析,在有效提升實驗質(zhì)量效率的同時,也能夠為科學(xué)實驗結(jié)果提供一些預(yù)測分析,及時將實驗風(fēng)險進(jìn)行管控[4]。

3.3醫(yī)學(xué)

目前來說,醫(yī)學(xué)領(lǐng)域?qū)τ跀?shù)據(jù)挖掘技術(shù)的應(yīng)用場景比較多,尤其是一線醫(yī)務(wù)人員每天需要面臨大量患者的情況下,醫(yī)療工作者難免會由于工作壓力產(chǎn)生疲勞感,利用數(shù)據(jù)挖掘技術(shù)不僅能夠?qū)颊卟∏檫M(jìn)行多方面的癥狀匹配對比,也能夠緩解醫(yī)療工作者的工作壓力。尤其是一些簡單的圖像處理工作,利用數(shù)據(jù)挖掘技術(shù)不僅能夠提升醫(yī)療行業(yè)的服務(wù)水平,也能夠利用大數(shù)據(jù)分析技術(shù),總結(jié)該地域易感的高發(fā)病癥,通過多元化的考察分析,研究導(dǎo)致該病癥問題的核心元素,多元化的技術(shù)發(fā)展不僅能夠有效減少病癥患者人數(shù),也能夠根據(jù)不同季節(jié)規(guī)律制定相應(yīng)的人員調(diào)整計劃。另外,需要醫(yī)療人員注意的問題是,過度依賴數(shù)據(jù)挖掘技術(shù)也不利于醫(yī)療領(lǐng)域快速發(fā)展,只有在不斷提升自身專業(yè)能力并合理應(yīng)用數(shù)據(jù)挖掘技術(shù)的同時,才能夠不斷推動醫(yī)療服務(wù)行業(yè)的穩(wěn)定發(fā)展與進(jìn)步。

3.4教育

數(shù)據(jù)挖掘技術(shù)不僅能夠應(yīng)用在教育專業(yè)改良方面,也能夠在校園環(huán)境之外為教師與學(xué)生營造良好的教育發(fā)展環(huán)境。尤其是關(guān)于資源配置等方面,一些學(xué)生可能在家長的帶領(lǐng)下,已經(jīng)在線上接觸了課程知識內(nèi)容,對于學(xué)生的自主學(xué)習(xí)教師應(yīng)當(dāng)給予合適的肯定與表揚,但是一些家長與學(xué)生可能由于本身的專業(yè)辨別能力有限,并不能在大量的教育資源中找到合適的學(xué)習(xí)資料。針對該問題現(xiàn)象,作為課程教師以及相關(guān)的從業(yè)人員,可以利用大數(shù)據(jù)挖掘技術(shù),為學(xué)生尋找、匹配一些合適的數(shù)據(jù)信息,利用信息整合、篩選等方式,為學(xué)生篩選適合學(xué)生當(dāng)前學(xué)習(xí)水平的課外閱讀資源以及相關(guān)的習(xí)題資料。

3.5網(wǎng)絡(luò)安全

網(wǎng)絡(luò)安全一直是近年來大家比較關(guān)注的問題,針對不同的網(wǎng)絡(luò)安全問題,數(shù)據(jù)挖掘技術(shù)可以提前進(jìn)行排查,在為普通大眾營造良好網(wǎng)絡(luò)環(huán)境的同時,也能夠及時打擊違法犯罪活動[5]。尤其是一些本身存在安全威脅的流氓軟件或者病毒網(wǎng)站,利用數(shù)據(jù)挖掘技術(shù)手段不僅能夠進(jìn)行防范,也能夠利用追蹤等技術(shù)手段,追蹤一些違法犯罪分子,打擊違法犯罪行為與活動。

4結(jié)語

時代的發(fā)展與進(jìn)步,離不開信息技術(shù)的升級與更新,大數(shù)據(jù)時代,數(shù)據(jù)挖掘技術(shù)已經(jīng)被大眾所認(rèn)知,想要充分發(fā)揮數(shù)據(jù)信息的重要價值,不僅需要為大眾群體營造良好的信息互動環(huán)境,也需要根據(jù)不同領(lǐng)域的實際需求進(jìn)行合理的改良完善,在有效促進(jìn)各行業(yè)穩(wěn)定發(fā)展的同時,也能夠為社會發(fā)展貢獻(xiàn)一份力量。

參考文獻(xiàn)

[1]孫福利.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].電子技術(shù)與軟件工程,2018,123(1):180.

[2]劉銘,呂丹,安永燦.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].科技導(dǎo)報,2018,(9).

[3]周凌.淺析大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].中小企業(yè)管理與科技,2018,540(05):189-190.

[4]葉昱希.關(guān)于大數(shù)據(jù)時代數(shù)據(jù)挖掘在銀行中的應(yīng)用研究[J].現(xiàn)代營銷:信息版,2019.

[5]張澤平.大數(shù)據(jù)時代的數(shù)據(jù)挖掘及應(yīng)用問題分析[J].數(shù)字化用戶,2018,24(48):188.

作者:郭秀峰 單位:河南牧業(yè)經(jīng)濟學(xué)院信息工程學(xué)院