前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)挖掘的應(yīng)用范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。
摘要:大數(shù)據(jù)挖掘已經(jīng)成為了一個(gè)熱門話題,本文介紹了如何更好地收集和處理數(shù)據(jù),如何改變大數(shù)據(jù)的形式來(lái)使其更好地應(yīng)用于文獻(xiàn)檢索與分析.討論了數(shù)據(jù)數(shù)據(jù)存儲(chǔ)和存儲(chǔ)的優(yōu)點(diǎn)和缺點(diǎn).分析了存在的問(wèn)題,并提出了進(jìn)一步研究的基礎(chǔ),對(duì)大數(shù)據(jù)的存儲(chǔ)也進(jìn)行了分析。
關(guān)鍵詞:大數(shù)據(jù);收集;作用
1“大數(shù)據(jù)”的定義
大數(shù)據(jù)(bigdata),是指在一定時(shí)間范圍內(nèi)沒(méi)有辦法用常規(guī)工具能夠進(jìn)行捕捉、管理和加工的數(shù)據(jù)集合,這種巨大數(shù)量而且數(shù)據(jù)呈現(xiàn)多樣化的高速增長(zhǎng)的信息資產(chǎn)需要一種新的處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化的能力。[1]維克托•邁爾-舍恩伯格和肯尼斯•庫(kù)克耶對(duì)于大數(shù)據(jù)有著不同的看法,在《大數(shù)據(jù)時(shí)代》一文中,他們發(fā)現(xiàn)大數(shù)據(jù)的定義是不能夠運(yùn)用像抽樣調(diào)查這種捷徑方法,而采用對(duì)所有數(shù)據(jù)進(jìn)行分析處理。大數(shù)據(jù)具有五個(gè)特點(diǎn),它們分別是:數(shù)量多、傳播速度快、信息多樣化、真實(shí)性高和低價(jià)值密度。在這里舉個(gè)例子,有一家超市,將尿布和啤酒放在一起出售,這是從來(lái)沒(méi)有出現(xiàn)過(guò)的景象,但是這個(gè)措施卻使得啤酒和尿布的銷量提升了許多。這是一個(gè)真實(shí)的故事,而是發(fā)生在美國(guó)沃爾瑪連鎖店超市的真實(shí)案例,這被別的企業(yè)一直作為案例來(lái)進(jìn)行研究。眾所周知,沃爾瑪作為世界上一流的連鎖超市,不是沒(méi)有原因的,它們有著世界上最大的數(shù)據(jù)研究倉(cāng)庫(kù),數(shù)據(jù)研究對(duì)沃爾瑪研究消費(fèi)者的消費(fèi)傾向有著很大的好處。沃爾瑪對(duì)于在其超市購(gòu)物的消費(fèi)者的消費(fèi)原始數(shù)據(jù)進(jìn)行集中,在集中原始數(shù)據(jù)后,對(duì)這些原始數(shù)據(jù)進(jìn)行分析和挖掘,結(jié)果意外的發(fā)現(xiàn),跟尿布一起購(gòu)買最多的商品竟是啤酒!經(jīng)過(guò)實(shí)地調(diào)查和分析,有關(guān)機(jī)構(gòu)發(fā)現(xiàn)了這與美國(guó)人的行為方式有著很大的聯(lián)系。在美國(guó),很多年輕父親為孩子進(jìn)行采購(gòu)尿布時(shí),經(jīng)常會(huì)有一部分的人會(huì)為自己或者家人采購(gòu)啤酒。所以將尿布和啤酒銷量推高的原因是:美國(guó)人的太太催老公為孩子買尿布時(shí),美國(guó)男人會(huì)為自己采購(gòu)一定數(shù)量的啤酒。按照一般人的思維,誰(shuí)也不會(huì)將尿布銷量和啤酒的銷量聯(lián)系到一起,如果不是沃爾瑪超市通過(guò)數(shù)據(jù)分析技術(shù)對(duì)消費(fèi)者的原始數(shù)據(jù)進(jìn)行集中分析挖掘,沃爾瑪是不可能發(fā)現(xiàn)數(shù)據(jù)當(dāng)中存在的秘密。[2]
2大數(shù)據(jù)對(duì)工程項(xiàng)目管理的作用
21世紀(jì)是網(wǎng)絡(luò)時(shí)代,網(wǎng)絡(luò)和信息通訊都得到了快速的發(fā)展,信息數(shù)據(jù)也不甘落后,但這一現(xiàn)象讓各行各業(yè)都面臨著巨大的挑戰(zhàn)和珍貴的機(jī)遇,其中各種行業(yè)的競(jìng)爭(zhēng)主要是在科技管理方面,這同樣是工程中的中心任務(wù),由于依賴著信息技術(shù),將信息與資源作為處理對(duì)象。它提供了一個(gè)網(wǎng)絡(luò)平臺(tái),這個(gè)平臺(tái)可以收集、處理不同的資源?;诳茖W(xué)技術(shù)管理的這些特點(diǎn),我國(guó)相關(guān)的工程項(xiàng)目管理表現(xiàn)出了三種趨勢(shì),這三種趨勢(shì)分別是數(shù)據(jù)多元化、動(dòng)態(tài)化、信息化管理。眾所周知,在傳統(tǒng)的產(chǎn)業(yè)當(dāng)中,工程產(chǎn)業(yè)是規(guī)格最高、規(guī)模最大的產(chǎn)業(yè),主要表現(xiàn)在參與主體多,產(chǎn)業(yè)覆蓋面廣。大數(shù)據(jù)的盛行,肯定會(huì)為工程項(xiàng)目管理帶來(lái)新的發(fā)展機(jī)遇和空間,還可以提高工程項(xiàng)目的效率和質(zhì)量。由于項(xiàng)目本身的特點(diǎn),工程管理可能會(huì)出現(xiàn)效率低下的這一現(xiàn)象,而大數(shù)據(jù)挖掘分析可以為工程管理的效率問(wèn)題找出解決辦法。許多公司對(duì)工程項(xiàng)目管理進(jìn)行評(píng)估時(shí),經(jīng)常會(huì)出現(xiàn)指標(biāo)過(guò)多、評(píng)價(jià)成本較高等問(wèn)題,而大數(shù)據(jù)挖掘?yàn)檫@些問(wèn)題找到了新的解決辦法。將大數(shù)據(jù)挖掘技術(shù)帶入到工程項(xiàng)目管理中去,可以從數(shù)據(jù)庫(kù)當(dāng)中找到與其項(xiàng)目管理最為相符的績(jī)效指標(biāo),這不單單為公司減小了相應(yīng)的工作量,還提高了管理效率,何樂(lè)而不為呢?在大數(shù)據(jù)管理中,數(shù)據(jù)庫(kù)不僅僅可以將歷史數(shù)據(jù)進(jìn)行收集、管理、歸納,還能對(duì)單一數(shù)據(jù)進(jìn)行轉(zhuǎn)換和處理。這些相互關(guān)聯(lián)的統(tǒng)一數(shù)據(jù)集為項(xiàng)目中的每個(gè)數(shù)據(jù)用戶提供透明的信息平臺(tái),以減少信息流中的虛假信息和通信障礙的風(fēng)險(xiǎn)。
3數(shù)據(jù)存儲(chǔ)
在獲得有用的資源之后,有必要選擇合適的數(shù)據(jù)庫(kù)或其他存儲(chǔ)方式,以便于將來(lái)的資源分析?;趥鹘y(tǒng)關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)特性,在獲取數(shù)據(jù)之前,沒(méi)有辦法很好的預(yù)測(cè)大數(shù)據(jù)的組成。現(xiàn)如今的數(shù)據(jù)庫(kù)還不能滿足大數(shù)據(jù)時(shí)代到來(lái)時(shí)對(duì)于數(shù)據(jù)庫(kù)數(shù)據(jù)存儲(chǔ)需求的要求。如今大數(shù)據(jù)處理技術(shù)面臨著許多難題,比如:如何其研究性價(jià)比極高的數(shù)據(jù)存儲(chǔ)軟件,如何降低數(shù)據(jù)誤差,這些問(wèn)題都需要科研人員進(jìn)行研究與解決。
4智能電網(wǎng)
現(xiàn)如今,我國(guó)經(jīng)濟(jì)發(fā)展迅速,我國(guó)的智能電網(wǎng)也不斷完善,它的數(shù)據(jù)資源也在飛速增加。在這新一代的信息科技產(chǎn)業(yè)技術(shù)中,以云計(jì)算為代表,已經(jīng)在電力系統(tǒng)中發(fā)揮了重要作用。智能電網(wǎng)的主旨是使用相關(guān)的信息來(lái)提高對(duì)電能的合理管理,從根本上說(shuō),智能電網(wǎng)的定義就是通過(guò)大數(shù)據(jù)來(lái)對(duì)電力系統(tǒng)進(jìn)行優(yōu)化。智能電網(wǎng)需要不同時(shí)段的全面數(shù)據(jù),這些數(shù)據(jù)存在于智能電網(wǎng)運(yùn)行、檢修和管理等環(huán)節(jié)上,這些環(huán)節(jié)上會(huì)出現(xiàn)大量,不同結(jié)構(gòu)和形態(tài)的數(shù)據(jù),這些數(shù)據(jù)和大數(shù)據(jù)有著相同的特點(diǎn),所以我們可以得出結(jié)論,大數(shù)據(jù)對(duì)于智能電網(wǎng)的發(fā)展有著很大的促進(jìn)作用。我們通過(guò)收集在智能電網(wǎng)數(shù)據(jù)信息平臺(tái)提供的信息和計(jì)算模型,利用大數(shù)據(jù)技術(shù),充分調(diào)動(dòng)先進(jìn)的應(yīng)用,解決檢測(cè)領(lǐng)域所存在的問(wèn)題。大數(shù)據(jù)技術(shù)也被穩(wěn)定計(jì)算和智能報(bào)警充分利用,為它們提供精確的數(shù)據(jù)分析,從而提高效率。如今智能電網(wǎng)仍存在許多的問(wèn)題,沒(méi)有得到解決,與此同時(shí),安全性也有了更高的需要,因此下一個(gè)階段的主要任務(wù)就是加強(qiáng)電網(wǎng)數(shù)據(jù)基礎(chǔ)架構(gòu)和信息安全的建設(shè),但是我們所需要知道的是如何加強(qiáng)。這就要求我們獲取電網(wǎng)運(yùn)行、維護(hù)和處理時(shí)所出現(xiàn)的數(shù)據(jù),從這些數(shù)據(jù)中進(jìn)行分析得出結(jié)論。隨著智能電網(wǎng)的不斷發(fā)展,與智能電網(wǎng)相關(guān)的大數(shù)據(jù)也將呈指數(shù)增長(zhǎng)。如今的電網(wǎng)信息基礎(chǔ)還不能滿足未來(lái)的需要,所以現(xiàn)在科研人員所需要做的就是對(duì)結(jié)構(gòu)進(jìn)行優(yōu)化,滿足未來(lái)的需要,使其的平臺(tái)基礎(chǔ)能夠滿足未來(lái)的發(fā)展需求。
5總結(jié)
隨著時(shí)代的發(fā)展,數(shù)據(jù)的量也迅速增長(zhǎng),我們應(yīng)當(dāng)正確的利用這些數(shù)據(jù),使其發(fā)揮最大的價(jià)值,但總體來(lái)講,大數(shù)據(jù)時(shí)代才剛剛到來(lái),迎面而來(lái)的不僅僅是無(wú)限的可能,也有艱難的挑戰(zhàn),其魅力是無(wú)窮的,正是這樣,我們才會(huì)在時(shí)展的道路上奮勇而前行。
參考文獻(xiàn):
[1]呂竹筠,張興旺,李晨暉,等.信息資源管理與云服務(wù)融合的內(nèi)涵即共性技術(shù)體系研究[J].情報(bào)理論與實(shí)踐,2012,35(09):26-32.
[2]《中國(guó)電子科學(xué)研究院學(xué)報(bào)》編輯部.大數(shù)據(jù)時(shí)代[J].中國(guó)電子科技研究院學(xué)報(bào),2013(01):41-43.
作者:翟天昊 單位:河北省唐山二中
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)