前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數(shù)據(jù)時(shí)代的理解主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代 大數(shù)據(jù)理解
1大數(shù)據(jù)時(shí)代概念的提出
當(dāng)前,大數(shù)據(jù)這一詞匯在各行各業(yè)中出現(xiàn)的頻率越來越高,各種媒體中也經(jīng)常對(duì)這大數(shù)據(jù)這一概念進(jìn)行推廣,大數(shù)據(jù)時(shí)代逐漸成為了一個(gè)社會(huì)熱詞,昭示著大數(shù)據(jù)時(shí)代的來臨。
在學(xué)界中,大數(shù)據(jù)的理論思考與實(shí)踐探索一直在如火如荼的濟(jì)寧這,并與經(jīng)濟(jì)市場(chǎng),政府機(jī)關(guān)形成了良好的合作與互相支持的模式。大數(shù)據(jù)時(shí)代的來臨與當(dāng)前互聯(lián)網(wǎng)時(shí)代的建設(shè)基礎(chǔ)和發(fā)展迅速的信息技術(shù)具有重要聯(lián)系,早在上個(gè)世紀(jì)末就有了關(guān)于大數(shù)據(jù)時(shí)代的理論雛形,對(duì)整合所有數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行加工,分析,處理提出設(shè)想。這一設(shè)想的提出與同一時(shí)期的“商業(yè)智能”的具有密切的聯(lián)系,所謂商業(yè)智能也是指建立數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上挖掘數(shù)據(jù)的深度含義,分析數(shù)據(jù)從而挖掘出數(shù)據(jù)之間的內(nèi)部聯(lián)系性,從而獲取文化公司所需要的信息,為文化公司的發(fā)展提供決策思路和數(shù)據(jù)支持。
直到世紀(jì),信息技術(shù)的發(fā)展導(dǎo)致各種數(shù)據(jù)統(tǒng)計(jì)工作的便捷與高效性,人們逐漸發(fā)現(xiàn)了進(jìn)行大規(guī)模數(shù)據(jù)分析和研究對(duì)文化公司在發(fā)展過程中所能起到的作用,互聯(lián)網(wǎng)的覆蓋范圍越來越廣,在各行業(yè)各的應(yīng)用程度愈來愈高,智能手機(jī)的普及都為大數(shù)據(jù)時(shí)代的來臨打下了堅(jiān)實(shí)的基礎(chǔ),隨后大數(shù)據(jù)的概念在信息技術(shù)行業(yè)中越來越得到認(rèn)可與重視,大數(shù)據(jù)的相關(guān)理論基礎(chǔ)研究與前景展望也越來越多,為大數(shù)據(jù)時(shí)代構(gòu)建了理論結(jié)構(gòu)與應(yīng)用前景。
2012年的達(dá)沃斯世界經(jīng)濟(jì)論壇中將大數(shù)據(jù)作為主題之一進(jìn)行討論,可以說變相確定了大數(shù)據(jù)在未來社會(huì)發(fā)展進(jìn)程中的地位,探究了以信息技術(shù)為依托的大數(shù)據(jù)處理分析如何對(duì)人類社會(huì)的發(fā)展作為貢獻(xiàn)。國(guó)內(nèi)對(duì)大數(shù)據(jù)在未來發(fā)展中將占據(jù)的地位和起到的作用也做出了充分的認(rèn)可,各大企業(yè)與高校對(duì)大數(shù)據(jù)的概念與應(yīng)用已經(jīng)開始進(jìn)行研究與實(shí)踐。
2大數(shù)據(jù)一詞的概念與理解
對(duì)大數(shù)據(jù)時(shí)代的理解離不開對(duì)大數(shù)據(jù)的概念的理解。什么是大數(shù)據(jù)?就當(dāng)下而言,雖然大數(shù)據(jù)一詞的出現(xiàn)的頻率極高,許多媒體,部門,論壇都在使用這一詞語,但是對(duì)大數(shù)據(jù)一詞的核心含義的理解卻并不一定充分。當(dāng)前學(xué)界內(nèi)對(duì)數(shù)據(jù)一詞的定義尚且沒有一個(gè)統(tǒng)一的較為得到廣泛認(rèn)可的定義。對(duì)大數(shù)據(jù)一詞的定義可以分為幾種,例如維基百科上說大數(shù)據(jù)就是指數(shù)量、規(guī)模龐大的數(shù)據(jù)資料,無法利用常見的軟件工具對(duì)其進(jìn)行高效率收集,處理與分析。還有的的說法認(rèn)為大數(shù)據(jù)就是單純指數(shù)據(jù)量足夠大,遠(yuǎn)超常規(guī)水平的數(shù)據(jù)集合。還有的說法主要是認(rèn)為大數(shù)據(jù)進(jìn)行處理的方式才是大數(shù)據(jù)一詞的實(shí)質(zhì),即大數(shù)據(jù)是通過特殊處理模式能提高企業(yè)對(duì)市場(chǎng)形勢(shì)的掌控程度,為決策提供指導(dǎo)的數(shù)據(jù)分析處理方法。
因此來看,大數(shù)據(jù)的特征應(yīng)該包含著兩方面,一是大數(shù)據(jù)處理在技術(shù)層面具有先進(jìn)性,二是大數(shù)據(jù)在社會(huì)性方面具有廣泛性。如上文所述,大數(shù)據(jù)一詞的出現(xiàn)是信息技術(shù)進(jìn)步的結(jié)果。大數(shù)據(jù)最先出現(xiàn)其是存在與IT界的術(shù)語,大數(shù)據(jù)是一個(gè)多項(xiàng)技術(shù)合并在一起的概念,是一個(gè)具有系統(tǒng)性的體系,包括對(duì)數(shù)據(jù)依托信息技術(shù)實(shí)現(xiàn)大規(guī)模儲(chǔ)存與聯(lián)網(wǎng)分享的云技術(shù),對(duì)數(shù)據(jù)進(jìn)行分析處理的分布式處理技術(shù),指紋識(shí)別,虹膜識(shí)別等對(duì)數(shù)據(jù)進(jìn)行保密管理的感知技術(shù)等等,都應(yīng)該包括與大數(shù)據(jù)體系之中。與此同時(shí),大數(shù)據(jù)還具有社會(huì)性。大數(shù)據(jù)這一概念的出現(xiàn)離不開信息爆炸化的時(shí)代特征,大量的信息充斥于社會(huì)的每一個(gè)角落并呈現(xiàn)著井噴式的增長(zhǎng),每一個(gè)人都是數(shù)據(jù)的創(chuàng)造者與傳遞著,國(guó)際化進(jìn)程的加快使人類社會(huì)前所未有的緊密聯(lián)系在一起,在這種時(shí)代背景下醞釀出來的大數(shù)據(jù)概念無法避免的具有人類社會(huì)發(fā)展的特征。
在大數(shù)據(jù)時(shí)代,人們的思維模式必須向大數(shù)據(jù)化的方向靠攏,傳統(tǒng)的思維模式已經(jīng)不適合時(shí)代的發(fā)展。信息技術(shù)的進(jìn)步使我們的思維模式也可以在依托大數(shù)據(jù)提供的信息作出更準(zhǔn)確的決策和判斷。在大數(shù)據(jù)模式下,高效率的數(shù)據(jù)收集與處理是我們可以脫離傳統(tǒng)的抽樣調(diào)查得出結(jié)論的辦法,不用再考慮數(shù)據(jù)模型是否具有科學(xué)性和代表性,也不用考慮抽樣結(jié)果是否具有偶然性,因?yàn)槲覀円呀?jīng)可以立足于全面性的數(shù)據(jù)來對(duì)問題進(jìn)行思考與判斷,同時(shí),對(duì)數(shù)據(jù)的判斷要提高效率,應(yīng)為判斷的本身也是一個(gè)大數(shù)據(jù)的過程,提高判斷的效率再借以數(shù)據(jù)統(tǒng)計(jì)來提高其準(zhǔn)確性。在大數(shù)據(jù)時(shí)代,人們面對(duì)數(shù)據(jù)不需要刨根問底的研究數(shù)據(jù)出現(xiàn)的原因,而是應(yīng)該要考慮數(shù)據(jù)之間的關(guān)聯(lián)性,研究數(shù)據(jù)之間的聯(lián)系,思考關(guān)聯(lián)出現(xiàn)的原因而不是單純研究因果關(guān)系。
大數(shù)據(jù)時(shí)代對(duì)于社會(huì)的改變?cè)谟?,它變革的是人們處理?shù)據(jù)的方式與模式,改變的是人認(rèn)知世界,認(rèn)知事物的方法,在數(shù)據(jù)化的信息處理中提供發(fā)現(xiàn)問題,解決問題,創(chuàng)造價(jià)值的方法。大數(shù)據(jù)作為一個(gè)新生事物能開創(chuàng)出一個(gè)新的時(shí)代,不得不說大數(shù)據(jù)在我們當(dāng)下的社會(huì)發(fā)展進(jìn)程中是極有價(jià)值的。雖然大數(shù)據(jù)的定義及體系,實(shí)踐應(yīng)用方面還存在許多不足,缺少經(jīng)驗(yàn)方面的積累,但是筆者相信隨著時(shí)間的推移大數(shù)據(jù)體系的形成必將越來越完備。我們當(dāng)下所需要做的就是把握住大數(shù)據(jù)時(shí)代的時(shí)代脈搏,必須明確大數(shù)據(jù)時(shí)代的要求:首先,大數(shù)據(jù)時(shí)代必須充分利用信息技術(shù)來提高數(shù)據(jù)的收集與儲(chǔ)存,利用新的數(shù)據(jù)處理模式發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)新,為決策提高科學(xué)性的指導(dǎo)與數(shù)據(jù)支持。然后,大數(shù)據(jù)是技術(shù)屬性與社會(huì)屬性的有機(jī)統(tǒng)一,所以在大數(shù)據(jù)時(shí)代中兩方面工作都要雙管齊下,提高技術(shù)水平的同時(shí)還要注重社會(huì)實(shí)踐應(yīng)用,達(dá)到改變市場(chǎng)運(yùn)作模式,各組織的結(jié)構(gòu)的目的。最后,大數(shù)據(jù)不是一個(gè)高高在上的概念性名詞,而是應(yīng)該作為一種新的思維方式適用于社會(huì)的各個(gè)方面,包括政府行政,企業(yè)運(yùn)營(yíng)和人民生活等等,是新的時(shí)代智慧與時(shí)代氣息,而不是單純的一種技術(shù)或處理數(shù)據(jù)的手段。
必須要明確大數(shù)據(jù)時(shí)代真正的思想內(nèi)涵,才能是我國(guó)在新時(shí)代的發(fā)展過程中不落人后,占據(jù)著有力地位,提高國(guó)家的信息化程度與綜合實(shí)力,對(duì)本論文的命題“大數(shù)據(jù)時(shí)代”對(duì)企業(yè)人力資源管理工作的影響能做出正確的分析探究。
參考文獻(xiàn):
關(guān)鍵詞:大數(shù)據(jù);民辦高校;圖書館員;素養(yǎng)
1 大數(shù)據(jù)的內(nèi)涵
經(jīng)歷了信息爆炸的時(shí)代,伴隨著云計(jì)算、物聯(lián)網(wǎng)的發(fā)展,我們迎來了大數(shù)據(jù)的時(shí)代。2011年5月,美國(guó)麥肯錫全球研究院(McKinsey GlobalInstitute,簡(jiǎn)稱“MGI”)發(fā)表研究報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)與生產(chǎn)力的下一個(gè)前沿》,向世界介紹了大數(shù)據(jù)的重要性,呼吁人們關(guān)注并有效使用大數(shù)據(jù)。[1]2012年2月11日,《紐約時(shí)報(bào)》技術(shù)記者斯蒂夫?洛爾(Steve Lohr)在該雜志發(fā)表《大數(shù)據(jù)時(shí)代》一文,宣告世界已進(jìn)入“大數(shù)據(jù)時(shí)代”。[2]
從直觀上來看,大數(shù)據(jù)就是指非常多的數(shù)據(jù)(BIG DATA)。很多學(xué)者和研究機(jī)構(gòu)對(duì)大數(shù)據(jù)都有不同的理解和定義。綜合多方對(duì)大數(shù)據(jù)的定義,大數(shù)據(jù)的概念更多指一種信息資產(chǎn)。不是關(guān)于如何定義,最重要的是如何使用。[3]“大數(shù)據(jù)”是一個(gè)體量特別大,數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫(kù)工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理。[3]
2 數(shù)據(jù)素養(yǎng)的內(nèi)涵
在大數(shù)據(jù)的時(shí)代背景下,我們被海量數(shù)據(jù)所包圍。一方面,我們?cè)谌粘I钪挟a(chǎn)生了大量的數(shù)據(jù),如記錄于網(wǎng)絡(luò)購(gòu)物平臺(tái)的消費(fèi)記錄,產(chǎn)生于聊天軟件的信息行為等數(shù)據(jù);另一方面,我們也享受到大量的數(shù)據(jù)分析帶給我們的生活便利,如通過分析網(wǎng)絡(luò)購(gòu)物平臺(tái)個(gè)人消費(fèi)記錄,系統(tǒng)自動(dòng)列出符合個(gè)人消費(fèi)喜好和習(xí)慣的物品列表,省去大量的網(wǎng)上瀏覽和搜索時(shí)間。并且數(shù)據(jù)會(huì)隨著消費(fèi)者的消費(fèi)記錄變化自動(dòng)更新。由此,社會(huì)也由此進(jìn)入了一個(gè)數(shù)據(jù)類型豐富、來源多樣、數(shù)量巨大,價(jià)值巨大的大數(shù)據(jù)時(shí)代。在此背景下,如何獲取數(shù)據(jù),管理數(shù)據(jù),應(yīng)用數(shù)據(jù)顯得尤為重要。
隨著時(shí)代的發(fā)展,信息環(huán)境和信息工具有了很大的變化,簡(jiǎn)單的信息獲取和檢索已經(jīng)不能適應(yīng)社會(huì)發(fā)展的需要。在大數(shù)據(jù)時(shí)代,要求具有能對(duì)所獲得信息、數(shù)據(jù)管理和辨別的能力,在這種背景下,數(shù)據(jù)素養(yǎng)的概念被提出。
數(shù)據(jù)素養(yǎng)與大數(shù)據(jù)環(huán)境密不可分,數(shù)據(jù)素養(yǎng)體現(xiàn)了人們?cè)诖髷?shù)據(jù)環(huán)境下對(duì)于數(shù)據(jù)的感知和理解,其內(nèi)容包含5個(gè)維度:對(duì)數(shù)據(jù)的敏感性,數(shù)據(jù)的收集能力,數(shù)據(jù)的分析、處理能力,利用數(shù)據(jù)進(jìn)行決策的能力,對(duì)數(shù)據(jù)的批判性思維。[4]另有一部分學(xué)者認(rèn)為,數(shù)據(jù)素養(yǎng)是一個(gè)具有承繼性的概念,它是基于量化素養(yǎng)、統(tǒng)計(jì)素養(yǎng)、數(shù)字素養(yǎng)所發(fā)展起來的類似于信息素養(yǎng)的用于描述人們大數(shù)據(jù)環(huán)境適應(yīng)能力的概念,[5]但又在統(tǒng)計(jì)素養(yǎng)、數(shù)字素養(yǎng)、信息素養(yǎng)的基礎(chǔ)上有所發(fā)展。
高校圖書館具有教育職能和信息服務(wù)職能。高校圖書館員擔(dān)負(fù)著數(shù)據(jù)資源和科研數(shù)據(jù)的安全保管,同時(shí)也擔(dān)負(fù)著為用戶提供信息服務(wù)的重任,其自身的數(shù)據(jù)素養(yǎng)對(duì)服務(wù)質(zhì)量有決定性影響。因此,對(duì)高校圖書館員數(shù)據(jù)素養(yǎng)及相關(guān)問題有必要進(jìn)行深入研究。
高校圖書館員數(shù)據(jù)素養(yǎng)提升包含以下幾個(gè)部分:
2.1 數(shù)據(jù)意識(shí)的提升
數(shù)據(jù)意識(shí)是指人作為數(shù)據(jù)的主體對(duì)于數(shù)據(jù)客體的自覺心理反應(yīng),是數(shù)據(jù)素養(yǎng)的先決條件。[6]
(1)在海量數(shù)據(jù)資源面前,高校圖書館員要有高度的敏感性,能主動(dòng)甄別并獲取用戶需要的數(shù)據(jù),善于發(fā)現(xiàn)有價(jià)值的數(shù)據(jù)資源。
(2)高校圖書館科研服務(wù)的核心價(jià)值是滿足用戶的科研數(shù)據(jù)續(xù)期,圖書館員不僅要能準(zhǔn)確把握用戶的直接需求,也要能深刻理解用戶的間接需求,并通過各種方式將間接需求直觀表達(dá)出來。
(3)高校圖書館員要有向廣大用戶推廣數(shù)據(jù)管理的有關(guān)知識(shí),推薦及提供與用戶科研相關(guān)的數(shù)據(jù)信息,幫助普及高校圖書館科研數(shù)據(jù)服務(wù)相關(guān)政策法規(guī)。
綜合以上幾點(diǎn),用戶的科研需求是高校圖書館服務(wù)的核心,高校圖書館擁有不斷增長(zhǎng)的龐大數(shù)據(jù)量,圖書館員在面對(duì)海量數(shù)據(jù)時(shí),要有辨別一些“可能有重大價(jià)值的數(shù)據(jù)”的能力,要保持清醒的認(rèn)識(shí),要有將數(shù)據(jù)轉(zhuǎn)換成科學(xué)知識(shí)的思想意識(shí);要有準(zhǔn)確理解、深刻發(fā)掘用戶需求的能力。
隨著移動(dòng)網(wǎng)絡(luò)和各種智能終端設(shè)備的發(fā)展,大量公開的、免費(fèi)的網(wǎng)上數(shù)據(jù)資源給傳統(tǒng)的高校圖書館帶來巨大的壓力,用戶流失現(xiàn)象比較嚴(yán)重,尤其是年輕用戶,他們更能適應(yīng)時(shí)代的發(fā)展。在此背景下,高校圖書館員可以利用大數(shù)據(jù)技術(shù)對(duì)圖書館現(xiàn)有的數(shù)據(jù),如用戶借閱記錄,讀者咨詢記錄等進(jìn)行分析,幫助了解用戶閱讀需求、科研需求以及用戶的知識(shí)層次,深度挖掘用戶在使用圖書館過程中的潛在需求。在此基礎(chǔ)上,圖書館能夠開展有針對(duì)性的特色服務(wù)吸引讀者。延伸圖書館傳統(tǒng)的信息服務(wù),開展各種創(chuàng)新服務(wù)。
高校圖書館應(yīng)用大數(shù)據(jù)具有現(xiàn)實(shí)可行性。讀者在使用圖書館時(shí)會(huì)留下使用痕跡、用戶行為日志等,這就形成了很多有價(jià)值的數(shù)據(jù)。其次,高校作為科研中的重要基地,對(duì)新技術(shù)、新思想的敏感性很強(qiáng),在高校圖書館中使用大數(shù)據(jù)技術(shù)并不是什么難題。此外,大數(shù)據(jù)技術(shù)不是一項(xiàng)具體的技術(shù),而是數(shù)據(jù)采集、數(shù)據(jù)存取、數(shù)據(jù)處理、數(shù)據(jù)挖掘等技術(shù)的整合,這些技術(shù)相對(duì)來說已經(jīng)很成熟。高校圖書館面對(duì)新技術(shù)、新思維的沖擊,要抓住發(fā)展契機(jī),轉(zhuǎn)變服務(wù)模式,實(shí)現(xiàn)可持續(xù)發(fā)展。
2.2 數(shù)據(jù)知識(shí)能力的提升
數(shù)據(jù)知識(shí)指一切與數(shù)據(jù)和數(shù)據(jù)管理有關(guān)的理論、知識(shí)和方法,它構(gòu)成了數(shù)據(jù)素養(yǎng)的理論基礎(chǔ),為有效開展科研數(shù)據(jù)服務(wù)提供知識(shí)儲(chǔ)備。[7]
大數(shù)據(jù)時(shí)代背景下,高校圖書館員不僅要具備計(jì)算機(jī)基礎(chǔ)知識(shí)、網(wǎng)絡(luò)知識(shí),多媒體知識(shí)等基本的信息素養(yǎng)能力,還要掌握數(shù)據(jù)管理基礎(chǔ)知識(shí)。能夠加工、整理既有數(shù)據(jù)并分析提煉轉(zhuǎn)化為用戶需要的信息和知識(shí)。
關(guān)鍵詞:大數(shù)據(jù):統(tǒng)計(jì)學(xué)理論:創(chuàng)新應(yīng)用
顧名思義,統(tǒng)計(jì)學(xué)幾乎是對(duì)所有領(lǐng)域的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與研究、分析篩選,因而統(tǒng)計(jì)學(xué)在如今的大數(shù)據(jù)時(shí)代幾乎涉及到各行各業(yè),其表現(xiàn)方式為,統(tǒng)計(jì)出來的數(shù)據(jù)進(jìn)行科學(xué)的研究與分析,可以有效的幫著企業(yè)獲取有效信息,探索其中數(shù)量規(guī)律行,進(jìn)而企業(yè)可以更高效、更精準(zhǔn)的進(jìn)行工作。而如今隨著現(xiàn)代信息技術(shù)以及數(shù)字科學(xué)技術(shù)的不斷發(fā)展,統(tǒng)計(jì)學(xué)也得到了更多的應(yīng)用,也被人們更加重視,應(yīng)用最多的為企業(yè)管理系統(tǒng)中,統(tǒng)計(jì)學(xué)中的理論及其分析方式幫助企業(yè)進(jìn)行對(duì)數(shù)據(jù)數(shù)量規(guī)律性的探以及定性分析,為企業(yè)尋找自身的管理經(jīng)營(yíng)的基礎(chǔ)進(jìn)行有效地夯實(shí),奠定企業(yè)向更加穩(wěn)定方向進(jìn)行發(fā)展。而如今計(jì)算機(jī)軟件的不斷發(fā)展與更新,大數(shù)據(jù)時(shí)代的到來,統(tǒng)計(jì)學(xué)的應(yīng)用也會(huì)得到更為廣泛的發(fā)展,其中有政府和企業(yè)利用計(jì)算機(jī)對(duì)相關(guān)數(shù)據(jù)的采集、整理、統(tǒng)計(jì)進(jìn)行綜合的分析。統(tǒng)計(jì)學(xué)相關(guān)的軟件開發(fā)商也將軟件設(shè)計(jì)的更為簡(jiǎn)易化、便捷化,使得非統(tǒng)計(jì)學(xué)專業(yè)的人員也可以使用。當(dāng)今社會(huì)經(jīng)濟(jì)高速發(fā)展,統(tǒng)計(jì)學(xué)的應(yīng)用及其發(fā)展趨勢(shì)將會(huì)迎合時(shí)代的到來進(jìn)行改革改變,促進(jìn)社會(huì)經(jīng)濟(jì)的快速提高。
一、大數(shù)據(jù)時(shí)代的內(nèi)涵及其意義
(一)大數(shù)據(jù)時(shí)代的內(nèi)涵
大數(shù)據(jù)是指在一定時(shí)間內(nèi)對(duì)信息的捕捉、管理、處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力、流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。針對(duì)這些信息資產(chǎn),利用統(tǒng)計(jì)學(xué)原理對(duì)其進(jìn)行數(shù)據(jù)分析、提煉、分解。也可以從另一個(gè)方面理解大數(shù)據(jù),它涉及各行各業(yè),是多個(gè)領(lǐng)域數(shù)據(jù)的集中區(qū)域,涉及到的有自然科學(xué)、人文科學(xué)、社會(huì)經(jīng)濟(jì)學(xué)等等相關(guān)的混合數(shù)據(jù),它們之間相互參雜,互相融合,形成非常龐大的數(shù)據(jù)系統(tǒng)。目前傳統(tǒng)統(tǒng)計(jì)學(xué)中的統(tǒng)計(jì)方法是分析單個(gè)計(jì)算機(jī)系統(tǒng)的數(shù)據(jù)儲(chǔ)備,無法分析多臺(tái)計(jì)算機(jī)的數(shù)據(jù),在數(shù)據(jù)統(tǒng)計(jì)中產(chǎn)生了局限性、單一性、不穩(wěn)定性和客觀性等,但是目前大數(shù)據(jù)時(shí)代的到來,改變了如今這一現(xiàn)象,改變了大數(shù)據(jù)環(huán)境下數(shù)據(jù)流、磁盤存儲(chǔ)、分布存儲(chǔ)、多線條等環(huán)境。大數(shù)據(jù)環(huán)境主要起到的作用為,將龐大而復(fù)雜的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換成為簡(jiǎn)單易懂、顯而易見的內(nèi)容,進(jìn)而使工作人員對(duì)數(shù)據(jù)進(jìn)行源頭和機(jī)制的追述,從而研究出適合自身并有效的應(yīng)對(duì)策略。因?qū)?shù)據(jù)轉(zhuǎn)換成需要的知識(shí)需要相對(duì)緩慢的時(shí)間,所以工作人員將當(dāng)前龐大復(fù)雜的數(shù)據(jù)分別存放在不同的儲(chǔ)備空間里,有些工作人員將目前無法分析的或是不需要的數(shù)據(jù)進(jìn)行整體精準(zhǔn)的記錄儲(chǔ)存,記錄成一整套的數(shù)據(jù)發(fā)展史,已供日后應(yīng)用,以備不時(shí)之需,為今后科研做出充分準(zhǔn)備。
(二)大數(shù)據(jù)時(shí)代給社會(huì)帶來的改革
大數(shù)據(jù)在一夜之間成為各大互聯(lián)網(wǎng)上的討論話題,成為一個(gè)包含性非常強(qiáng)的概念,大數(shù)據(jù)時(shí)代也成為人們關(guān)注的話題,它的到來已然成為不爭(zhēng)的事實(shí),從本質(zhì)上來看,它是當(dāng)今中新型的產(chǎn)業(yè),通過對(duì)海量的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析追蹤發(fā)現(xiàn)龐大的市場(chǎng),通過對(duì)人們行為喜好進(jìn)行科學(xué)分析,獲取營(yíng)銷手段。大數(shù)據(jù)使得廣告投放精準(zhǔn)化、醫(yī)療衛(wèi)生體系精密化、社會(huì)安全管理有序化等多方面優(yōu)勢(shì),同時(shí)大數(shù)據(jù)時(shí)代的到來隨著帶來了新的新業(yè)市場(chǎng),大數(shù)據(jù)將為全球帶來440萬個(gè)IT崗位和上千萬個(gè)非IT崗位,提供了更多的就業(yè)崗位。大數(shù)據(jù)時(shí)代到來的變革之大,影響著人們傳統(tǒng)的工作方式,各行各業(yè)的人利用研究問題來驅(qū)動(dòng)收據(jù)數(shù)據(jù),然后再利用收集來的數(shù)據(jù)進(jìn)行分析,從而解決問題,從這一行為來講,人們會(huì)慢慢適應(yīng)通過大數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)的研究分析來解決問題,利用通過統(tǒng)計(jì)學(xué)理論開發(fā)的軟件搜索、分析一些研究性成果。目前統(tǒng)計(jì)學(xué)家通過數(shù)據(jù)的收集、數(shù)據(jù)的處理以及個(gè)人分析能力進(jìn)行科學(xué)探索,如今大數(shù)據(jù)的到來將會(huì)威脅的他們的領(lǐng)域,大數(shù)據(jù)將我們難以理解的內(nèi)容翻譯成我們一看便知的統(tǒng)計(jì)成果,優(yōu)化了人們工作的便捷性、舒適性等。
二、大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)的發(fā)展研究
大數(shù)據(jù)發(fā)展如今,滲透社會(huì)的各個(gè)角落,分析大數(shù)據(jù)需要多個(gè)領(lǐng)域的結(jié)合,它并非單一的科學(xué)領(lǐng)域,自成一體,現(xiàn)如今的統(tǒng)計(jì)學(xué)家不僅需要研究探討計(jì)算機(jī)對(duì)數(shù)據(jù)的實(shí)時(shí)決策,更是要將其與統(tǒng)計(jì)學(xué)理論及其方法相互結(jié)合,同時(shí),計(jì)算機(jī)專家也要不斷學(xué)習(xí)統(tǒng)計(jì)學(xué)的一些知識(shí),統(tǒng)計(jì)學(xué)與大數(shù)據(jù)相互結(jié)合才能順應(yīng)時(shí)代的發(fā)展。獲取大數(shù)據(jù)之后,研究探討大數(shù)據(jù)時(shí),針對(duì)數(shù)據(jù)分析的高難問題,利用統(tǒng)計(jì)學(xué)原理對(duì)其進(jìn)行數(shù)據(jù)分析、提煉、分解時(shí),需創(chuàng)新出新的更便捷更高效的統(tǒng)計(jì)處理方法,在壓縮提煉過程中,解決數(shù)據(jù)混雜的問題,在分解數(shù)據(jù)中,解決精準(zhǔn)問題,使得大數(shù)據(jù)與統(tǒng)計(jì)理論更好的溝通合作,構(gòu)造全局統(tǒng)計(jì)結(jié)果。統(tǒng)計(jì)學(xué)主要是對(duì)海量的數(shù)據(jù)進(jìn)行整理分類,結(jié)合計(jì)算機(jī)進(jìn)行科學(xué)分析,探究出數(shù)據(jù)的數(shù)量規(guī)律性,從而得出結(jié)論,由于目前統(tǒng)計(jì)學(xué)中的統(tǒng)計(jì)學(xué)理論和統(tǒng)計(jì)方法與時(shí)代稍有差距,如今更是大數(shù)據(jù)時(shí)代,而大數(shù)據(jù)隨機(jī)或非隨機(jī)的誤差比較大,所以傳統(tǒng)的統(tǒng)計(jì)學(xué)理論及方法無法滿足如今變革,也無法更好的獲取大數(shù)據(jù)背景下所帶來的各種機(jī)遇?,F(xiàn)在的統(tǒng)計(jì)學(xué)家應(yīng)該更加努力專研統(tǒng)計(jì)學(xué)理論以及對(duì)數(shù)據(jù)壓縮、分解的方法,舍棄無法適應(yīng)當(dāng)前時(shí)代的陳舊理論及方法,必須去學(xué)習(xí)如何迎合新的事物的到來進(jìn)行改革改變,只有這樣才能順勢(shì)而行。
作者:宋瑞雪 周晏羽 黃揚(yáng)藝 單位:沈陽理工大學(xué)
參考文獻(xiàn):
[1]毛江偉.《統(tǒng)計(jì)學(xué)》應(yīng)用及其發(fā)展[J].長(zhǎng)江大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013(12)
信息技術(shù)作為時(shí)代不斷發(fā)展的象征,不管是在我國(guó)行業(yè)的發(fā)展中,還是在人們的日常生活,都起到了重要作用。同時(shí),在信息技術(shù)不斷發(fā)展的過程中,大數(shù)據(jù)時(shí)代的應(yīng)用范圍也在不斷的擴(kuò)大,其來源渠道也非常多,數(shù)量也在不斷增加。在這種情況下,大數(shù)據(jù)時(shí)代的大數(shù)據(jù)信息管理就顯的尤為重要。由于大數(shù)據(jù)的數(shù)量不斷增加,現(xiàn)有的管理形式已經(jīng)無法滿足大數(shù)據(jù)時(shí)代的發(fā)展,并且在利用計(jì)算機(jī)對(duì)大數(shù)據(jù)進(jìn)行全面分析和處理的過程中,也受到了嚴(yán)重的影響,因此,要想有效的對(duì)大數(shù)據(jù)進(jìn)行充分利用,就要對(duì)大數(shù)據(jù)管理形式給予高度重視,采取有效的措施,不斷加強(qiáng)大數(shù)據(jù)的管理形式,最終實(shí)現(xiàn)有效、便捷、安全等管理性能,這也為對(duì)我國(guó)信息技術(shù)提供了重要的發(fā)展方向。
1 大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理發(fā)展歷程
近幾年,在大數(shù)據(jù)管理不斷發(fā)展的過程中,也取得了一定的成績(jī)。但是,大數(shù)據(jù)管理也經(jīng)歷了一個(gè)漫長(zhǎng)的過程,主要經(jīng)歷的人工、文件、數(shù)據(jù)庫(kù)等管理階段。同時(shí),隨著大數(shù)據(jù)時(shí)代的大數(shù)據(jù)不斷增加,所管理的范圍和環(huán)境也在不斷的變化。并且,在大數(shù)據(jù)管理不斷發(fā)展的過程中,一些管理問題逐漸的暴露出來,為大數(shù)據(jù)管理的發(fā)展帶來了新的挑戰(zhàn)和機(jī)遇,下面就大數(shù)據(jù)管理的發(fā)展歷程,管理中存在的不足進(jìn)行簡(jiǎn)要的分析和闡述。
1.1 大數(shù)據(jù)時(shí)代的大數(shù)據(jù)人工管理形式
在20世紀(jì)50年代,計(jì)算機(jī)技術(shù)的形成主要是針對(duì)科學(xué)計(jì)算等形式。同時(shí),根據(jù)當(dāng)時(shí)的發(fā)展技術(shù)來說,并沒有磁盤、U盤等一些先進(jìn)設(shè)備,將其計(jì)算的結(jié)果進(jìn)行去全面的保存和整理,僅僅只是依靠紙帶、卡片等形式,對(duì)大數(shù)據(jù)的進(jìn)行有效的記錄。大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理的人員管理形式,不僅僅對(duì)大數(shù)據(jù)的記錄存在著一定程度上的誤差,并且在保存的過程中,也會(huì)經(jīng)常發(fā)生丟失的現(xiàn)象,對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理形式的發(fā)展,是沒有任何的幫助。但是,依照當(dāng)時(shí)的技術(shù)水平來看,也只能的依靠人工管理的形式了。
1.2 大數(shù)據(jù)時(shí)代的大數(shù)據(jù)的文件管理形式
在大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理的人員管理形式,不斷發(fā)展和改革的過程中,計(jì)算機(jī)的軟件和硬件都得到了有效的提高,磁盤、磁鼓等儲(chǔ)存軟件,得到了全面的普及和發(fā)展。同時(shí),在在不斷發(fā)展的過程中,計(jì)算機(jī)將大數(shù)據(jù)的組成形式,叫做大數(shù)據(jù)文件,并且在大數(shù)據(jù)文件上就可以直接的取名字,直接的進(jìn)行查看,這對(duì)大數(shù)據(jù)的管理,無疑不是一個(gè)新的發(fā)展的起點(diǎn)。在大數(shù)據(jù)時(shí)代的大數(shù)據(jù)文件管理的過程中,由于大數(shù)據(jù)長(zhǎng)期的保存在外面的,這樣在對(duì)的大數(shù)據(jù)處理、分析、查找、刪除、修改等操作的過程中,提供了極大程度上的便利,其對(duì)其操作的程序,也具有特點(diǎn)的要求。但是,在文件管理的過程中,由于共享性能較大,數(shù)據(jù)與數(shù)據(jù)之間缺乏一定的獨(dú)立性,對(duì)其管理和維護(hù)的費(fèi)用和時(shí)間較大,這樣往往工作效率提高,不能被廣泛的使用。
1.3 大數(shù)據(jù)時(shí)代的大數(shù)據(jù)庫(kù)管理形式
數(shù)據(jù)庫(kù)管理形式是大數(shù)據(jù)管理不斷發(fā)展的重要成果,也是到目前為止最后的一個(gè)階段。在計(jì)算機(jī)技術(shù)不斷發(fā)展的過程中,計(jì)算機(jī)內(nèi)部的容量得到了很大程度的提高,并且大數(shù)據(jù)的管理和維護(hù)成本也相應(yīng)的有所下降。同時(shí),在大數(shù)據(jù)管理形式不斷發(fā)展的過程中,對(duì)其系統(tǒng)管理內(nèi)存不足等現(xiàn)象,進(jìn)行了全面的提高,有效的實(shí)現(xiàn)了資源共享,也在最大程度上保證了大數(shù)據(jù)的安全、穩(wěn)定等性能。另外,在大數(shù)據(jù)時(shí)代的大數(shù)據(jù)庫(kù)管理的過程中,不在近幾年只是固定在某一個(gè)計(jì)算技術(shù)應(yīng)用體系,而是面向整個(gè)管理體系,以此在最大程度上提高了大數(shù)據(jù)共享的性能,使大數(shù)據(jù)與大數(shù)據(jù)形成一個(gè)獨(dú)立的個(gè)體,對(duì)其大數(shù)據(jù)進(jìn)行了全面、有效的、統(tǒng)一的管理,為我國(guó)信息技術(shù)的發(fā)展提供了重要方向。
2 大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理策略
2.1 對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理框架進(jìn)行創(chuàng)新
在大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理形式不斷發(fā)展過程中,給企業(yè)發(fā)展帶來沖擊非常巨大。因此,企業(yè)要根據(jù)我國(guó)信息技術(shù)不斷發(fā)展的形式,對(duì)大數(shù)據(jù)管理框架進(jìn)行全面的設(shè)計(jì)和創(chuàng)新,如圖1所示。在大數(shù)據(jù)的處理的過程中,主要是圍繞著數(shù)據(jù)資產(chǎn)進(jìn)行管理的,同時(shí)對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理制度,進(jìn)行全面的規(guī)劃行、設(shè)計(jì)、創(chuàng)新,這樣對(duì)其它信息技術(shù)管理領(lǐng)域,提供了便利的條件。其實(shí),大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理最主要的目的,就是將大數(shù)據(jù)的價(jià)值進(jìn)行充分的展現(xiàn)。另外,在大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理框架不斷創(chuàng)新的過程中,有效的實(shí)現(xiàn)了大數(shù)據(jù)共享等性能,不斷擴(kuò)大了大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理的內(nèi)容,對(duì)我國(guó)現(xiàn)代化信息技術(shù)的發(fā)展,起到了重要的作用和意義。
2.2 開發(fā)與內(nèi)容的管理形式
在不斷提高大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理形式的過程中,可以從兩個(gè)方面進(jìn)行,一是大數(shù)據(jù)開發(fā)管理,二是內(nèi)容管理。其中大數(shù)據(jù)開發(fā)管理注重于大數(shù)據(jù)管理的定義,和管理解決策略,對(duì)其大數(shù)據(jù)的存在價(jià)值,進(jìn)行有效的開發(fā)。換句話說,其實(shí)也就是在大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理的過程中,對(duì)其管理形式的開發(fā),對(duì)大數(shù)據(jù)的功能和價(jià)值,進(jìn)行充分的理解。
大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理中的內(nèi)容管理是指:企業(yè)對(duì)大數(shù)據(jù)進(jìn)行不斷的獲取、使用、存儲(chǔ)、維護(hù)等工作活動(dòng)。因此,傳統(tǒng)的大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理形式,已經(jīng)無法滿足對(duì)這個(gè)時(shí)展需求。因此,在時(shí)代快速發(fā)發(fā)展的推動(dòng)下,要對(duì)開發(fā)管理和內(nèi)容管理,進(jìn)行全面的創(chuàng)新和設(shè)計(jì),對(duì)需要專門設(shè)定的管理形式,要給予高度的重視,可以利用的集合型的保存形式,進(jìn)行全面的保存。
其實(shí),大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理主要是為企業(yè)提供重要的發(fā)展方向,為企業(yè)提供重要的價(jià)值信息。大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理在數(shù)據(jù)應(yīng)用和開發(fā)的過程中,起到了重要的銜接作用,也為我國(guó)信息技術(shù)的發(fā)展,打下了堅(jiān)實(shí)的基礎(chǔ)。
2.3 對(duì)大數(shù)據(jù)架構(gòu)進(jìn)行全面的管理
在大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理的過程中,數(shù)據(jù)框架管理起到了重要的作用,并且與大數(shù)據(jù)開發(fā)的過程中,有很多相似的地方。在傳統(tǒng)的大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理的過程中,對(duì)其數(shù)據(jù)的開發(fā)、處理、保存等形式,都受到了一定程度上的限制。因此,在對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)架構(gòu)管理的過程中,對(duì)其操作形式,進(jìn)行了全面的管理創(chuàng)新,避免受到范圍的限制。另外,隨著大數(shù)據(jù)不斷的增加,大數(shù)據(jù)構(gòu)架管理可以根據(jù)大數(shù)據(jù)的用途,質(zhì)量良好的應(yīng)用形態(tài)。例如:社交網(wǎng)絡(luò)等形式。
與此同時(shí),在最近幾年的發(fā)展中,大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理形式,也面臨著新的挑戰(zhàn)基機(jī)遇。以此,只有對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理形式,對(duì)個(gè)人信息、隱私等進(jìn)行全面的管理,避免個(gè)人信息、隱私等發(fā)生泄露、不對(duì)稱等現(xiàn)象的發(fā)生,這樣不僅僅企業(yè)在發(fā)展的過程中,提供了最大程度上的安全保障,也為大數(shù)據(jù)時(shí)代的發(fā)展,帶來了新的發(fā)展篇章。
3 結(jié)語
綜上所述,大數(shù)據(jù)時(shí)代是信息技術(shù)時(shí)代不斷發(fā)展的產(chǎn)物,不管對(duì)我國(guó)經(jīng)濟(jì)的發(fā)展,還是人們?cè)谌粘9ぷ?、生活的過程中,都起到了重要的作用和意義。因此,本文對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理發(fā)展的歷程進(jìn)行了簡(jiǎn)要的分析,并對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理形式,提出了一些可參考性的建議,只有對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理形式,進(jìn)行不斷的創(chuàng)新,對(duì)大數(shù)據(jù)時(shí)代的大數(shù)據(jù)管理框架,進(jìn)行不斷的構(gòu)建,也只有這樣的才能在最大程度上促進(jìn)了我國(guó)信息技術(shù)的發(fā)展,也為我國(guó)各行各業(yè)的發(fā)展,提供了重要的發(fā)展方向,對(duì)我國(guó)經(jīng)濟(jì)的發(fā)展,也起到了推動(dòng)性的作用。
[關(guān)鍵詞]大數(shù)據(jù) 專利分析 數(shù)據(jù)挖掘 可視化
中圖分類號(hào):TU94 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2017)05-0298-01
一、引言
隨著網(wǎng)絡(luò)、通信、運(yùn)算、存儲(chǔ)技術(shù)的發(fā)展及成本降低,大數(shù)據(jù)在搜索引擎、互聯(lián)網(wǎng)金融、電子商務(wù)、醫(yī)療衛(wèi)生等諸多領(lǐng)域已經(jīng)開始產(chǎn)生重大影響?!按髷?shù)據(jù)”作為當(dāng)前科技關(guān)鍵詞的大熱門之一,截至本文刊發(fā)時(shí),在百度搜索引擎中相關(guān)網(wǎng)頁搜索結(jié)果超過1億個(gè),相關(guān)新聞搜索結(jié)果逾148萬篇。數(shù)據(jù)已經(jīng)成為重要的生產(chǎn)要素之一,相關(guān)組織、機(jī)構(gòu)所掌握的數(shù)據(jù)規(guī)模、對(duì)數(shù)據(jù)的分析運(yùn)用能力已經(jīng)成為考量其綜合實(shí)力的重要因素。專利分析的主要功能在于從孤立的專利文獻(xiàn)中多層次多角度地挖掘信息,并處理成具有預(yù)測(cè)功能的報(bào)告為企業(yè)所用,而對(duì)海量數(shù)據(jù)進(jìn)行挖掘、計(jì)算及可視化,正是大數(shù)據(jù)分析的主要內(nèi)容??梢灶A(yù)見,基于大數(shù)據(jù)的專利分析將成為未來的發(fā)展趨勢(shì)。
二、專利分析現(xiàn)狀
一般認(rèn)為,專利分析發(fā)軔于1949年Seidel所提出的專利引文分析專利文獻(xiàn)重要性的概念,但將其應(yīng)用于企業(yè)的戰(zhàn)略與競(jìng)爭(zhēng)分析,是上世紀(jì)90年代后隨著信息、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)技術(shù)的發(fā)展才得以實(shí)現(xiàn)的。
專利分析通常是指對(duì)專利文獻(xiàn)進(jìn)行數(shù)據(jù)挖掘、加工、統(tǒng)計(jì)處理,進(jìn)而獲取符合分析目標(biāo)要求的有價(jià)值信息,主要應(yīng)用包括專利導(dǎo)航、專利預(yù)警、專利布局、專利評(píng)估、技術(shù)規(guī)避、侵權(quán)分析等。
專利分析的方式方法很多,其過程一般包括數(shù)據(jù)采集處理階段、專利分析階段、報(bào)告形成及成果展示階段。由于專利分析的對(duì)象數(shù)據(jù)規(guī)模龐大,因此通常需要借助計(jì)算機(jī)和分析工具,但是人員的參與仍然必不可少,例如在數(shù)據(jù)采集處理階段,需要完成技術(shù)分解、檢索、數(shù)據(jù)加工、數(shù)據(jù)標(biāo)引等工作,而檢索過程中的檢索策略的制定、檢索要素的篩選、結(jié)果噪聲去除等很大程度上依賴于專利分析人員的經(jīng)驗(yàn)和能力,這也導(dǎo)致了專利分析的高成本、高門檻。另外,由于專利的早期公開延遲審查制度,導(dǎo)致專利分析所針對(duì)的專利文獻(xiàn)都是一至兩年前申請(qǐng)的技術(shù)方案,不能代表最新技術(shù)的發(fā)展現(xiàn)狀。
三、大數(shù)據(jù)時(shí)代
互聯(lián)網(wǎng)用戶對(duì)大數(shù)據(jù)有了越來越多的直觀體驗(yàn),在社交網(wǎng)絡(luò)中被推薦的聯(lián)系人或內(nèi)容,是基于社交網(wǎng)絡(luò)大數(shù)據(jù)得到的用戶之間、用戶與社區(qū)之間的隱含關(guān)系信息;在電商網(wǎng)站被推薦的商品,是基于處理海量的訪問、購(gòu)買、評(píng)論數(shù)據(jù)分析出的消費(fèi)行為信息;在搜索引擎中定向投放的廣告,是通過對(duì)廣告大數(shù)據(jù)的處理分析得到的。
著名管理咨詢公司麥肯錫首先預(yù)言了大數(shù)據(jù)時(shí)代的來臨,“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來”。阿里巴巴董事局主席馬云則直接地指出,雖然阿里巴巴是全球最大的零售平臺(tái),但是阿里巴巴不是一家零售公司,而是一家數(shù)據(jù)公司。
“大數(shù)據(jù)”相對(duì)于傳統(tǒng)“小數(shù)據(jù)”的特點(diǎn),傳播非常廣泛的是Gartner集團(tuán)分析師Laney所總結(jié)出的三個(gè)“V”,即容量(Volume)、種類(Variety)、速度(Velocity)。以此為基礎(chǔ),IBM進(jìn)一步將其擴(kuò)充到四個(gè)“V”,即:1、容量(Volume),大數(shù)據(jù)時(shí)代的數(shù)據(jù)量已達(dá)PB(1024TB)乃至EB(1024PB)級(jí);2、種類(Variety),大數(shù)據(jù)時(shí)代的數(shù)類型龐雜,除結(jié)構(gòu)化數(shù)據(jù),還包括互聯(lián)網(wǎng)自媒體數(shù)據(jù)、圖片、音視頻等非結(jié)構(gòu)化數(shù)據(jù);3、速度(Velocity),大數(shù)據(jù)需要快速的處理才能獲取有價(jià)值的信息;4、真實(shí)(Veracity),需要從大數(shù)據(jù)中篩選真實(shí)數(shù)據(jù)才能得到真實(shí)的信息。維克托?邁爾-舍恩伯格在《大數(shù)據(jù)時(shí)代》中提出,大數(shù)據(jù)時(shí)代帶來的變革主要包括:不是隨機(jī)樣本,而是所有數(shù)據(jù);不是精確性,而是混雜性;不是因果關(guān)系,而是相關(guān)關(guān)系。在大數(shù)據(jù)時(shí)代,不再需要借助隨機(jī)采樣的方法處理數(shù)據(jù),而是對(duì)所有數(shù)據(jù)進(jìn)行處理以分析具體事件;不再需要數(shù)據(jù)的微觀精確性,只需在宏觀上洞悉數(shù)據(jù)的總體方向;不再需要事件與原因之間的因果關(guān)系,而是通過相關(guān)關(guān)系了解事件的發(fā)生進(jìn)程。
四、基于大數(shù)據(jù)的專利分析展望
基于大數(shù)據(jù)分析的主要內(nèi)容以及專利分析的現(xiàn)狀,可以預(yù)測(cè)未來基于大數(shù)據(jù)的專利分析發(fā)展將包括以下幾個(gè)方面。
1、基于語義引擎數(shù)據(jù)采集處理。以往的機(jī)器檢索,計(jì)算機(jī)只能在字符匹配層級(jí)認(rèn)知用戶的輸入信息,不能理解信息的含義,特別是在專利信息的檢索過程中,檢索策略的設(shè)定和調(diào)整都需要借助人工方式。而隨著計(jì)算機(jī)技術(shù)和人工智能的發(fā)展,通過對(duì)網(wǎng)絡(luò)大數(shù)據(jù)的語義標(biāo)注處理,使計(jì)算機(jī)能夠從語義層級(jí)理解輸入信息,例如Apple公司的語音識(shí)別工具Siri、專利檢索系統(tǒng)Patentics等,都采用了語義引擎。在此基礎(chǔ)上發(fā)展專利數(shù)據(jù)采集,例如實(shí)現(xiàn)語義專利信息檢索,可以降低對(duì)專利分析人員個(gè)人能力的依賴,降低專利分析的成本。
2、基于數(shù)據(jù)挖掘算法、預(yù)測(cè)性分析和數(shù)據(jù)質(zhì)量管理的專利分析。大數(shù)據(jù)分析的核心在于數(shù)據(jù)挖掘算法,從大數(shù)據(jù)中挖掘價(jià)值信息并研究對(duì)象之間的相關(guān)性,從而挖掘出對(duì)象間的未知聯(lián)系,利用這種相關(guān)性信息,可以實(shí)現(xiàn)定制化分析,并將專利分析的結(jié)果與企業(yè)需求結(jié)合得更加緊密。通過預(yù)測(cè)性分析模型,從大數(shù)據(jù)中獲得規(guī)律性信息,可以預(yù)測(cè)專利發(fā)展趨勢(shì)、技術(shù)乃至行業(yè)的發(fā)展走向,允許企業(yè)根據(jù)專利分析結(jié)果對(duì)專利布局、技術(shù)發(fā)展路線做出預(yù)先判斷,能夠很大程度地避免由于專利公開滯后對(duì)專利分析準(zhǔn)確性造成的影響。通過數(shù)據(jù)質(zhì)量管理方法,借助標(biāo)準(zhǔn)化數(shù)據(jù)處理流程和質(zhì)量管理方法對(duì)數(shù)據(jù)進(jìn)行處理,可確保獲得的分析結(jié)果具有較高的質(zhì)量和可靠性。
3、基于可視化分析的報(bào)告形成及成果展示。可視化分析能夠自動(dòng)將負(fù)責(zé)數(shù)據(jù)分析結(jié)果轉(zhuǎn)換為圖表,借助圖表簡(jiǎn)單直觀的展示復(fù)雜的大數(shù)據(jù)分析結(jié)果,還能夠針對(duì)不同的分析對(duì)象選擇不同的展示內(nèi)容和展示方式,能夠有效的降低專利分析使用門檻、擴(kuò)大用戶群體。
五、結(jié)語
大數(shù)據(jù)時(shí)代的到來為專利分析提供了新的技術(shù)工具和技術(shù)思想,對(duì)從業(yè)人員來說既是挑戰(zhàn)也是機(jī)遇。將大數(shù)據(jù)分析充分運(yùn)用到專利信息的數(shù)據(jù)挖掘、可視化預(yù)測(cè),改善專利分析的用戶體驗(yàn)將成為專利分析的重要研究發(fā)展方向
參考文獻(xiàn)
[1] 馬天旗.專利分析―方法、圖表解讀與情報(bào)挖掘[M].北京:知識(shí)產(chǎn)權(quán)出版社,2015:1.
[2] 楊鐵軍.專利分析實(shí)務(wù)手冊(cè)[M].北京:知識(shí)產(chǎn)權(quán)出版社,2012:1-10.
除了上帝,任何人都必須用數(shù)據(jù)來說話,我想用這句話來概括我們這個(gè)時(shí)代的行為最為貼切了。大數(shù)據(jù)從概念的形成到技術(shù)落地,已經(jīng)在我們身邊悄然地生根發(fā)芽了。
依稀記得在大數(shù)據(jù)時(shí)代之前,企業(yè)多是采用CRM或BI系統(tǒng)中顧客信息、市場(chǎng)促銷、廣告活動(dòng)、展覽等結(jié)構(gòu)化數(shù)據(jù),以及企業(yè)官網(wǎng)的一些數(shù)據(jù)。但這些信息只能達(dá)到企業(yè)正常營(yíng)銷管理需求的一層,并不能實(shí)現(xiàn)足夠重要的洞察和規(guī)律的發(fā)現(xiàn)。
對(duì)于占據(jù)85%之多的那部分?jǐn)?shù)據(jù),諸如社交媒體、郵件、地理位置、音視頻等信息數(shù)據(jù),以及“微時(shí)代”產(chǎn)生的“微信息”等,在幾年前可能被置之不理?,F(xiàn)在,大數(shù)據(jù)進(jìn)一步提高了算法和機(jī)器分析的作用,這部分的數(shù)據(jù)開始日顯寶貴、作用突出了。這些數(shù)據(jù)即將被大數(shù)據(jù)技術(shù)充分地挖掘和運(yùn)用。
以前一些信息化系統(tǒng),只能促使分析報(bào)告回答:我們干過了什么,出現(xiàn)了什么?,F(xiàn)在一個(gè)優(yōu)秀的大數(shù)據(jù)系統(tǒng)可以回答“會(huì)發(fā)生什么”、“我們?cè)撟鍪裁础?,而且一些關(guān)聯(lián)數(shù)據(jù)庫(kù)還可以給我們指明方向,最終發(fā)展為非?;钴S的數(shù)據(jù)倉(cāng)庫(kù),判斷“客戶想要什么”。
集成整合硬件、軟件服務(wù)技術(shù)建立的大數(shù)據(jù)平臺(tái)已能為用戶提供面向策略級(jí)、未知信息分析預(yù)測(cè)能力和個(gè)性化自助式定制等功能。對(duì)目標(biāo)對(duì)象進(jìn)行更完整的分析、描述,通過獲取更豐富的消費(fèi)者數(shù)據(jù),包括網(wǎng)站瀏覽數(shù)據(jù)、社交數(shù)據(jù)和地理追蹤數(shù)據(jù)等,可以繪制出更完整的消費(fèi)者行為描述。
企業(yè)經(jīng)過長(zhǎng)時(shí)間的信息化建設(shè)已經(jīng)有了較強(qiáng)的整合數(shù)據(jù)的能力,可以整合來自企業(yè)各種不同的數(shù)據(jù)源、各種不同結(jié)構(gòu)的數(shù)據(jù),如客戶關(guān)系管理、搜索、移動(dòng)、社交媒體、網(wǎng)絡(luò)分析工具、普查數(shù)據(jù)以及離線數(shù)據(jù)等,這些整合而得到的數(shù)據(jù)才是定向更大目標(biāo)受眾的基礎(chǔ),分析得出的結(jié)果才是更具有普遍價(jià)值的。
大數(shù)據(jù)使得我們具備了研究探索數(shù)據(jù)背后價(jià)值的能力。未來企業(yè)營(yíng)銷成功的關(guān)鍵必將是取決于如何在大數(shù)據(jù)庫(kù)中挖掘更豐富的營(yíng)銷價(jià)值,比如數(shù)據(jù)整合、多方平臺(tái)的數(shù)據(jù)接軌、結(jié)合人口與行為數(shù)據(jù)去建立優(yōu)化算法等都是未來的發(fā)展重點(diǎn)。探索出來之后給予精確行動(dòng)的營(yíng)銷指導(dǎo)綱領(lǐng),同時(shí)通過此綱領(lǐng)進(jìn)行精確快速實(shí)時(shí)性行動(dòng)?!皼Q勝千里,運(yùn)籌帷幄”就在大數(shù)據(jù)。
大數(shù)據(jù)讓數(shù)據(jù)分析可視化變得更加美麗,大數(shù)據(jù)的爆炸使人們急需展示數(shù)據(jù)、理解數(shù)據(jù)、演繹數(shù)據(jù),這種需求刺激了數(shù)據(jù)可視化專業(yè)市場(chǎng)的形成,從點(diǎn)線圖、直方圖、柱狀圖等簡(jiǎn)單圖標(biāo),發(fā)展到以監(jiān)控為目的的儀表盤、三維地圖等,讓冰冷、枯燥乏味的數(shù)據(jù)開始活動(dòng)起來了。我們深刻理解圖形是解決邏輯問題的視覺方法。
如何改變這種數(shù)據(jù)的分散管理,實(shí)現(xiàn)相對(duì)應(yīng)的經(jīng)濟(jì)效應(yīng)和社會(huì)效應(yīng)?打破企業(yè)陳舊信息化思維,形成大數(shù)據(jù)的概念和應(yīng)用氛圍已經(jīng)迫在眉睫。如何使已知和未來將要發(fā)生的數(shù)據(jù)發(fā)揮更大的作用,提高利用率,為客戶提供更大的方便,為企業(yè)和行業(yè)創(chuàng)造更大的價(jià)值呢?唯有打穿企業(yè)和行業(yè)的禁錮,形成大數(shù)據(jù)統(tǒng)籌,形成聯(lián)動(dòng)才能實(shí)現(xiàn)上述目的。
大數(shù)據(jù)時(shí)代的產(chǎn)生源于資源的繁雜豐富,如果企業(yè)沒有明確的目標(biāo),就算沒有走入迷途至少也會(huì)覺得非常迷茫。企業(yè)要運(yùn)用大數(shù)據(jù)的短中期目標(biāo),來定義企業(yè)的價(jià)值數(shù)據(jù)標(biāo)準(zhǔn),之后再使用那些能夠解決特定領(lǐng)域問題的工具。逐步推廣,步步為營(yíng),不要把理想定得太高,否則會(huì)很失望。
【關(guān)鍵詞】 大數(shù)據(jù)時(shí)代 區(qū)域教育數(shù)據(jù)網(wǎng)絡(luò)建設(shè)、均衡發(fā)展
引言
網(wǎng)絡(luò)科技不斷發(fā)展,人類收集、貯存、分析和運(yùn)用數(shù)據(jù)的能力也得到巨大的提升,尤其借助于網(wǎng)絡(luò)這個(gè)便利的工具,極大便捷了人們生活的各方各面。利用大數(shù)據(jù)的優(yōu)勢(shì)更好地開展教育管理工作,積極解決授課模式單一等弊端,豐富教課方式及內(nèi)容,盡可能促進(jìn)教育事業(yè)的發(fā)展。大數(shù)據(jù)的不斷更新進(jìn)步,促使教育事業(yè)不斷進(jìn)步,不斷豐富多樣化。大數(shù)據(jù)能夠很好的縮短傳統(tǒng)教育的弊端,體現(xiàn)大數(shù)據(jù)教育的優(yōu)勢(shì)。
一、大數(shù)據(jù)時(shí)代是什么
進(jìn)入21世紀(jì)以來,大數(shù)據(jù)不斷被越來越多的人提及,不斷滲透到人們的一行一動(dòng)中。大數(shù)據(jù)時(shí)代已經(jīng)降臨,存在于每個(gè)人的身邊。官方解釋,大數(shù)據(jù)就是數(shù)據(jù),海量的數(shù)據(jù)?,F(xiàn)代社會(huì)是一個(gè)迅速發(fā)展變化的社會(huì),數(shù)據(jù)蓬勃壯大。作為這個(gè)社會(huì)飛速流轉(zhuǎn)的產(chǎn)物,大數(shù)據(jù)也吸引了越來越多人的關(guān)注。大數(shù)據(jù)時(shí)代是依賴于全部數(shù)據(jù)中,提取重要以及針對(duì)性信息。通過大數(shù)據(jù),掌握大體方向,不再瘋狂的執(zhí)著于精確度,把微觀的視角適當(dāng)移到宏觀層面上來。拋棄曾經(jīng)近乎牛角尖的因果,以更開闊的眼光看待事物之間的聯(lián)系。大數(shù)據(jù)不僅豐富了我們的生活,也在不斷提升人們看世界的高度。
大數(shù)據(jù),或稱巨量資料,指的是需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。 “大數(shù)據(jù)”是指以多元形式,自許多來源搜集而來的龐大數(shù)據(jù)組,往往具有實(shí)時(shí)性。大數(shù)據(jù)最核心的價(jià)值就是在于對(duì)于海量數(shù)據(jù)進(jìn)行存儲(chǔ)和分析。相比起現(xiàn)有的其他技術(shù)而言,大數(shù)據(jù)的“廉價(jià)、迅速、優(yōu)化”這三方面的綜合成本是最優(yōu)的。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識(shí)到數(shù)據(jù)爆炸性增長(zhǎng)帶來問題的隱患,但是隨著時(shí)間的推移,人們將越來越多的意識(shí)到數(shù)據(jù)對(duì)企業(yè)的重要性。
最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。阿里巴巴創(chuàng)辦人馬云來臺(tái)演講中就提到,未來的時(shí)代將不是IT時(shí)代,而是DT的時(shí)代,DT就是Data Technology數(shù)據(jù)科技,顯示大數(shù)據(jù)對(duì)于阿里巴巴集團(tuán)來說舉足輕重?;@球比賽當(dāng)中利用大數(shù)據(jù)對(duì)球員的個(gè)人在比賽場(chǎng)上的數(shù)據(jù)分析,可以幫助比賽變得更加精彩。一分鐘內(nèi),微博推特上新發(fā)的數(shù)據(jù)量超過20萬;社交網(wǎng)絡(luò)“臉譜”的瀏覽量超過500萬……這些都是大數(shù)據(jù)在我們身邊的體現(xiàn)。它神圣又親切。滲透了我們身邊的方方面面,我們需要它,離不開它。大數(shù)據(jù)對(duì)我們至關(guān)重要,我們的不斷發(fā)展對(duì)大數(shù)據(jù)也有重大影響。
二、大數(shù)據(jù)時(shí)代區(qū)域網(wǎng)絡(luò)建設(shè)對(duì)教育的意義
教育大數(shù)據(jù)有廣義和狹義之分。廣義的教育大數(shù)據(jù)泛指所有來源于日常教育活動(dòng)中人類的行為數(shù)據(jù);而狹義的教育大數(shù)據(jù)是指學(xué)習(xí)者行為數(shù)據(jù),它主要來源于學(xué)生管理系統(tǒng)、在線學(xué)習(xí)平臺(tái)和課程管理平臺(tái)等。教育的最基礎(chǔ)功能是影響經(jīng)濟(jì)發(fā)展。教育對(duì)人們思想精神狀態(tài)的影響巨大,而大數(shù)據(jù)時(shí)代區(qū)域網(wǎng)絡(luò)建設(shè)可以促進(jìn)教育的實(shí)施,便于人類接受教育。大數(shù)據(jù)時(shí)代區(qū)域網(wǎng)絡(luò)建設(shè)將教育化解為數(shù)據(jù),更加易于理解和吸收。通過數(shù)字、文字、圖片、音頻各種各樣的形式傳遞給人類。相對(duì)于之前枯燥的文字解讀,人類更愿意接受豐富多樣的大數(shù)據(jù)。
大數(shù)據(jù)改變教育。大多數(shù)對(duì)于課堂的評(píng)價(jià),基于課堂的完整性,層層結(jié)合,邏輯清晰等表面的審視。并非從內(nèi)去評(píng)價(jià)這節(jié)課是否起到了它所該起到的效果,是否生動(dòng)活潑,是否被學(xué)生理解接受,被教育者是否從內(nèi)心真正接受教育。聽課果者會(huì)根據(jù)自己的經(jīng)驗(yàn)來假設(shè)學(xué)生的體驗(yàn),而學(xué)生真正的體驗(yàn)如何,卻沒有強(qiáng)大的技術(shù)與數(shù)據(jù)源可提供分析與實(shí)證。傳統(tǒng)的教育研究往往是經(jīng)驗(yàn)式的,總是以第一方的角度去認(rèn)為某些因素對(duì)學(xué)生很重要,對(duì)課堂很重要,比如提問有效性,課堂的節(jié)奏等。這就顯示了傳統(tǒng)教育的弊端,無法很好的落實(shí)事件真正的效應(yīng),這就更加突顯大數(shù)據(jù)教育的便利與平易近人性。
課堂網(wǎng)絡(luò)教育不僅豐富課堂文化,增添課堂樂趣,也加深了師生之間的交流。無論在知識(shí)專業(yè)方面,還是人際關(guān)系方面都起到了極大的促進(jìn)作用。大數(shù)據(jù)的到來,恰恰正是能從技術(shù)層面讓體驗(yàn)者的感受緊以量化與顯現(xiàn)。
迅速發(fā)展的大數(shù)據(jù)技術(shù)已廣泛應(yīng)用于各個(gè)行業(yè),教育行業(yè)更應(yīng)順應(yīng)時(shí)展潮流。隨著教育信息化的不斷推進(jìn),各種教育管理與服務(wù)平臺(tái)的建設(shè)完善,大數(shù)據(jù)無聲無息卻有模有棱的進(jìn)入了教育行業(yè)。各種Office、PPT、Word被輕松的運(yùn)用于課堂,網(wǎng)絡(luò)。學(xué)者不僅可以在課堂接受教育,還可以僅僅通過一張屏幕學(xué)習(xí)知識(shí)。教育的傳播途徑被極大擴(kuò)展,教育事業(yè)將更好的前進(jìn)和發(fā)展。
三、大數(shù)據(jù)時(shí)代區(qū)域教育均衡發(fā)展新思路
大數(shù)據(jù)時(shí)代已經(jīng)到來,大數(shù)據(jù)正在成為推動(dòng)教育系統(tǒng)顛覆性創(chuàng)新與變革的科學(xué)力量。大數(shù)據(jù)所帶來的,并非源于我們電腦的硬盤變大了,CPU處理速度更快了,而是在我們的教育中的地位更在穩(wěn)固了。大數(shù)據(jù)帶給教育的意義是非比尋常的,通過大量數(shù)據(jù)分析與運(yùn)用,使教育形式多樣化,增大被教育者人群,強(qiáng)化教育者能力。時(shí)代在進(jìn)步,時(shí)事新聞,身邊小事乃至國(guó)家大事都在不斷變換著。在風(fēng)云驟變的時(shí)代,不能僅限于傳統(tǒng)教育。
教育大數(shù)據(jù)在輔助科學(xué)制定教育政策、教育均衡發(fā)展、提升教育質(zhì)量、優(yōu)化教學(xué)效果、因材施教等方面的重要作用。目前大數(shù)據(jù)在教育實(shí)踐中仍存在諸多問題。大數(shù)據(jù)的應(yīng)用基礎(chǔ)是對(duì)海量數(shù)據(jù)的擁有,這就涉及數(shù)據(jù)存儲(chǔ)技術(shù)的挑戰(zhàn),以及用于數(shù)據(jù)處理和分析的技術(shù)挑戰(zhàn)。對(duì)于高科技人才以及專業(yè)數(shù)據(jù)人才,我國(guó)仍處于欠缺狀態(tài)。其次,大數(shù)據(jù)的教育應(yīng)用中,數(shù)據(jù)采集和問題解決分析是核心環(huán)節(jié),應(yīng)用開發(fā)者要面對(duì)的就是數(shù)據(jù)采集技術(shù)和問題解決分析技術(shù)的挑戰(zhàn)。這就需要技術(shù)工作者不僅要有強(qiáng)大堅(jiān)實(shí)的專業(yè)基礎(chǔ),還要并存強(qiáng)大的心理。要不斷加大對(duì)專業(yè)人才的培養(yǎng),進(jìn)而促進(jìn)大數(shù)據(jù)的應(yīng)用。
在教學(xué)方面,將從數(shù)字化教學(xué)走向智慧教學(xué)。智慧教學(xué)是教師在智慧教學(xué)環(huán)境下,充分利用各種先進(jìn)信息化技術(shù)和信息資源開展的教學(xué)活動(dòng)。較之傳統(tǒng)的數(shù)字化教學(xué),智慧教學(xué)更加高效、開放和多元,教學(xué)活動(dòng)參與者之間的溝通更加通暢,互動(dòng)更加深入,教師的備課、作業(yè)批改、教學(xué)評(píng)價(jià)等更加智能化。
我們要將大數(shù)據(jù)運(yùn)用到教育中來,但是,在應(yīng)用大數(shù)據(jù)的時(shí)候,要權(quán)衡利弊,用適當(dāng)?shù)姆绞搅芾毂M致的發(fā)揮大數(shù)據(jù)的優(yōu)勢(shì)。使大數(shù)據(jù)能夠發(fā)揮在教育事業(yè)中的巨大能量,豐富教育事業(yè)的同時(shí),不斷創(chuàng)新思路發(fā)展大數(shù)據(jù)。
四、結(jié)論
教育行業(yè)要順應(yīng)時(shí)代,與時(shí)俱進(jìn),教育數(shù)據(jù)網(wǎng)絡(luò)的構(gòu)建常以教育數(shù)據(jù)中心為核心紐帶進(jìn)行整體架構(gòu)。以教育信息化促進(jìn)區(qū)域教育均衡發(fā)展是信息時(shí)代教育發(fā)展的必然選擇在大數(shù)據(jù)時(shí)代,要利用網(wǎng)絡(luò)信息技術(shù)優(yōu)勢(shì)和數(shù)據(jù)量化研究方法,提升高校網(wǎng)絡(luò)意識(shí)形態(tài)建設(shè)科學(xué)化水平。
大數(shù)據(jù)”在經(jīng)濟(jì)發(fā)展中的巨大意義并不代表其能取代一切對(duì)于社會(huì)問題的理性思考,科學(xué)發(fā)展的邏輯不能被湮沒在海量數(shù)據(jù)。在社會(huì)進(jìn)步的洪流中,教育事業(yè)要加快步伐,適當(dāng)?shù)霓饤墏鹘y(tǒng)教育的弊端,利用大數(shù)據(jù)時(shí)代帶來的便利大力發(fā)展教育事業(yè),使教育事業(yè)源源不斷注入新鮮血液,更好的面對(duì)未知的將來。
參 考 文 獻(xiàn)
[1] 楊現(xiàn)民,唐斯斯,李冀紅.教育大數(shù)據(jù)的技術(shù)體系框架與發(fā)展趨勢(shì)-”教育大數(shù)據(jù)研究與實(shí)踐專欄”之整體框架篇[J].現(xiàn)代教育技術(shù),2016-09-11.
[關(guān)鍵詞] 大數(shù)據(jù);審計(jì)工作;挑戰(zhàn)與對(duì)策
[中圖分類號(hào)] F230 [文獻(xiàn)標(biāo)識(shí)碼] B
一、大數(shù)據(jù)的有關(guān)概念與特征
1.“大數(shù)據(jù)時(shí)代”下CPA審計(jì)的概念
大數(shù)據(jù)作為一項(xiàng)新的技術(shù)革命,它給人們帶來了大量的數(shù)據(jù),科學(xué)技術(shù)的創(chuàng)新,是信息產(chǎn)業(yè)的新現(xiàn)象。大數(shù)據(jù)具有大容量、多樣性、速度性和價(jià)值性。大容量指的是數(shù)據(jù)的數(shù)量級(jí)的功能,是一個(gè)收集的大數(shù)據(jù),數(shù)據(jù)的來源是廣泛和大量的。多樣性是指大數(shù)據(jù)的數(shù)據(jù)類型呈現(xiàn)多樣化的特點(diǎn),多樣化指的是數(shù)據(jù)的產(chǎn)生和傳播,因此可以說,在大數(shù)據(jù)時(shí)代,信息的生產(chǎn)者和傳播者是每一個(gè)人的日常。速度特征是指相對(duì)于傳統(tǒng)的數(shù)據(jù)時(shí)效性和數(shù)據(jù)的分析,大數(shù)據(jù)時(shí)代,信息通信速度,數(shù)據(jù)“保存期更短”。價(jià)值特點(diǎn)和前三個(gè)特點(diǎn)不盡相同,它表明了時(shí)代的大數(shù)據(jù)信息和數(shù)據(jù)除了量的優(yōu)勢(shì),而且是一個(gè)質(zhì)的保證,這里指數(shù)據(jù)的價(jià)值性和準(zhǔn)確性?!按髷?shù)據(jù)”概念下數(shù)據(jù)是可以拓展的、可估值的、開放性的,這些特性區(qū)分了大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)。目前我國(guó)互聯(lián)網(wǎng)經(jīng)濟(jì)的快速發(fā)展,大數(shù)據(jù)時(shí)代已涉及到審計(jì)工作的各個(gè)方面。
2.CPA審計(jì)在“大數(shù)據(jù)時(shí)代”下的特征
由于社會(huì)各屆的積極參與,“大數(shù)據(jù)”才可能成為一個(gè)時(shí)代。大數(shù)據(jù)時(shí)代的到來也將代表信息社會(huì)的到來,因此,審計(jì)學(xué)科也要積極參與這一新時(shí)代,以品味時(shí)代的甜蜜,行業(yè)的積極調(diào)整。大數(shù)據(jù)時(shí)代下的注冊(cè)會(huì)計(jì)師審計(jì)主要靠云計(jì)算信息技術(shù)審核,也被稱為云審計(jì)。文峰(2011)指出,當(dāng)越來越多的企業(yè)提供云服務(wù),越來越多的企業(yè)采用云服務(wù)。秦榮盛(2014)指出,“云計(jì)算”或?qū)徲?jì)會(huì)對(duì)審計(jì)產(chǎn)生深遠(yuǎn)影響的大數(shù)據(jù),將逐步改變審計(jì)技術(shù)和方法。因此,作為注冊(cè)會(huì)計(jì)師審計(jì)和認(rèn)證服務(wù)的事務(wù),也應(yīng)該使用云計(jì)算的概念,以提高審計(jì)技術(shù)和方法。
二、大數(shù)據(jù)時(shí)代CPA審計(jì)工作面臨的挑戰(zhàn)
1.大數(shù)據(jù)環(huán)境下審計(jì)工作的有效性和完整性受到挑戰(zhàn)
大數(shù)據(jù)技術(shù)在審計(jì)中逐步應(yīng)用,審計(jì)成果不僅有審計(jì)報(bào)告,還有大量有價(jià)值的信息和數(shù)據(jù),這些都可以提供給被審計(jì)單位完善管理和內(nèi)部控制審計(jì),從而更廣泛的應(yīng)用審計(jì)成果應(yīng)用。審計(jì)工作中獲取的大量數(shù)據(jù)和有關(guān)資料進(jìn)行總結(jié),可以有效地獲取企業(yè)財(cái)務(wù)、經(jīng)營(yíng)管理和制度設(shè)計(jì)等方面的內(nèi)在規(guī)律和發(fā)展方向。通過大數(shù)據(jù)技術(shù),我們可以分析被審計(jì)單位與審計(jì)問題、注冊(cè)會(huì)計(jì)師與審計(jì)成果,進(jìn)一步采用信息技術(shù)數(shù)據(jù)化處理,形成審計(jì)應(yīng)用數(shù)據(jù)庫(kù),在下一次審計(jì)活動(dòng)中,注冊(cè)會(huì)計(jì)師就可以根據(jù)審計(jì)計(jì)劃,通過紀(jì)錄信息有針對(duì)性地按照審計(jì)目標(biāo)進(jìn)行審計(jì)。
2.大數(shù)據(jù)環(huán)境給審計(jì)思維模式帶來挑戰(zhàn)
一些傳統(tǒng)的審計(jì)方法,在大數(shù)據(jù)環(huán)境下不再合適,例如傳統(tǒng)的抽樣審計(jì)。因此審計(jì)抽樣方法應(yīng)該向總體審計(jì)方法轉(zhuǎn)變。之前沒有對(duì)所有數(shù)據(jù)進(jìn)行訪問、處理和分析,審計(jì)方式的思維方式是以小樣本性質(zhì)和隨機(jī)抽樣分析的方式來進(jìn)行,根據(jù)樣本分析結(jié)果來推斷審計(jì)對(duì)象的總體情況,審核過程更依賴審計(jì)抽樣方法。但在大數(shù)據(jù)環(huán)境下,它可以收集和分析整個(gè)領(lǐng)域的數(shù)據(jù),是一種組織和分析所有數(shù)據(jù)的通用審計(jì)方法。因此在大數(shù)據(jù)環(huán)境下,注冊(cè)會(huì)計(jì)師審計(jì)單位要檢查所有相關(guān)數(shù)據(jù),將審計(jì)工作與云審計(jì)有效整合,逐步形成審計(jì)模式的整體思路。這種基于整體審計(jì)模式的思維方式,將為會(huì)計(jì)師事務(wù)所的審計(jì)工作帶來巨大的挑戰(zhàn)。
3.傳統(tǒng)的審計(jì)技術(shù)和審計(jì)方法面臨挑戰(zhàn)
經(jīng)過多年的逐步的創(chuàng)新和多元化發(fā)展,傳統(tǒng)的審計(jì)工作積累了很多有效的審計(jì)手段和審計(jì)技術(shù)。例如,控制測(cè)試常用的觀察,訪談,業(yè)務(wù)流程描述,而且通過測(cè)試,實(shí)質(zhì)性測(cè)試,檢查,庫(kù)存,確認(rèn)等。但是,在大數(shù)據(jù)環(huán)境下,許多傳統(tǒng)的方法都面臨著巨大挑戰(zhàn),審計(jì)技術(shù)和方法必須在技術(shù)創(chuàng)新和變革的不斷進(jìn)步中進(jìn)行。大數(shù)據(jù)環(huán)境下,數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和分析技術(shù)將不斷涌現(xiàn),如果繼續(xù)使用傳統(tǒng)的審計(jì)手段和審計(jì)技術(shù),就會(huì)降低工作效率,如果要有效利用分布式結(jié)構(gòu)、云數(shù)據(jù)庫(kù)、聯(lián)網(wǎng)審計(jì)等多種技術(shù)手段,就需要不斷提高審計(jì)能力。
4.大數(shù)據(jù)時(shí)代基于相關(guān)分析的審計(jì)證據(jù)收集面臨挑戰(zhàn)
在審計(jì)證據(jù)收集中,通過因果關(guān)系分析收集到的審計(jì)證據(jù),傳統(tǒng)的思維方式是建立在因果關(guān)系的基礎(chǔ)上,對(duì)大數(shù)據(jù)的分析更會(huì)利用相關(guān)分析發(fā)現(xiàn)和收集審計(jì)證據(jù)。大數(shù)據(jù)技術(shù)從審計(jì)技術(shù)角度看,提供了一個(gè)從未有過的跨域,可用于量化的相關(guān)審計(jì)信息的維度,可以記錄大量的分析。大數(shù)據(jù)分析也還是沒有改變審計(jì)事項(xiàng)之間的關(guān)系,然而大數(shù)據(jù)分析技術(shù)的關(guān)系開發(fā)與利用,使得數(shù)據(jù)分析的因果關(guān)系減少了,而是更多的傾向于應(yīng)用程序的基礎(chǔ)上的相關(guān)的數(shù)據(jù)分析。大數(shù)據(jù)分析的重要特征是基于相關(guān)性分析的證明。這對(duì)注冊(cè)會(huì)計(jì)師來說,因?yàn)殚L(zhǎng)期依賴因果關(guān)系進(jìn)行審計(jì)證據(jù)的收集和發(fā)現(xiàn),著實(shí)面臨重大的挑戰(zhàn)。
三、大數(shù)據(jù)時(shí)代下CPA審計(jì)工作的應(yīng)對(duì)策略
1.加快大數(shù)據(jù)審計(jì)技術(shù)應(yīng)用的法規(guī)建設(shè)
大數(shù)據(jù)技術(shù)應(yīng)用要成為會(huì)計(jì)師事務(wù)所依法審計(jì)的依據(jù),必須有一個(gè)符合其發(fā)展規(guī)律的法規(guī)支撐。云審計(jì)數(shù)據(jù)采集與存儲(chǔ)系統(tǒng)的標(biāo)準(zhǔn)化和審計(jì)數(shù)據(jù)分析結(jié)果及相關(guān)電子證據(jù)的法律地位,是大數(shù)據(jù)技術(shù)在注冊(cè)會(huì)計(jì)師審計(jì)中必須解決的問題。這是大數(shù)據(jù)技術(shù)充分發(fā)揮其在注冊(cè)會(huì)計(jì)師審計(jì)中的重要作用的前提。目前,云計(jì)算技術(shù)還缺乏相關(guān)的法律法規(guī),大數(shù)據(jù)計(jì)算技術(shù)的合法化是大數(shù)據(jù)面臨的一個(gè)重要而緊迫的問題,尤其是數(shù)據(jù)的安全性和保密性。因此,利用大數(shù)據(jù)進(jìn)行注冊(cè)會(huì)計(jì)師審計(jì)必須建立一個(gè)新的審計(jì)制度或準(zhǔn)則,而且應(yīng)該特別強(qiáng)調(diào)大數(shù)據(jù)審計(jì)中的審計(jì)師的責(zé)任。
2.建立行業(yè)層面大數(shù)據(jù)審計(jì)分析平臺(tái)
如果要在審計(jì)中實(shí)現(xiàn)大數(shù)據(jù)的應(yīng)用,需要建立大數(shù)據(jù)分析平臺(tái)。大數(shù)據(jù)審計(jì)分析平臺(tái)建設(shè)有兩條路徑選擇:一是中國(guó)注冊(cè)會(huì)計(jì)師協(xié)會(huì)審計(jì)數(shù)據(jù)資源的集合,可以滿足注冊(cè)會(huì)計(jì)師的審計(jì)服務(wù)需求,云存儲(chǔ)架構(gòu)和云計(jì)算技術(shù)作為基礎(chǔ),直接構(gòu)建注冊(cè)會(huì)計(jì)師行業(yè)級(jí)數(shù)據(jù)審計(jì)分析平臺(tái);二是建立省級(jí)和市級(jí)的注冊(cè)會(huì)計(jì)師行業(yè)數(shù)據(jù)審計(jì)分析平臺(tái)。在此基礎(chǔ)上,各省、市注冊(cè)會(huì)計(jì)師行業(yè)的大數(shù)據(jù)審計(jì)分析平臺(tái)整合到注冊(cè)會(huì)計(jì)師行業(yè)審計(jì)數(shù)據(jù)分析平臺(tái)。如果沒有行業(yè)監(jiān)管,那么審計(jì)市場(chǎng)將是一個(gè)混亂。因此,加強(qiáng)對(duì)行業(yè)的監(jiān)督管理,也是一項(xiàng)必要性工作,包括行業(yè)協(xié)會(huì)的監(jiān)管和行業(yè)自律監(jiān)管。最好由行業(yè)協(xié)會(huì)或行業(yè)主管部門和領(lǐng)導(dǎo)的創(chuàng)立,聘請(qǐng)第三方進(jìn)行數(shù)據(jù)維護(hù),這樣同時(shí)有利于研發(fā)投入審計(jì)技術(shù)。
3.推動(dòng)大數(shù)據(jù)審計(jì)分析模型和審計(jì)軟件的開發(fā)
行業(yè)不同需要的大數(shù)據(jù)分析模型和發(fā)展環(huán)境也不同,注冊(cè)會(huì)計(jì)師審計(jì)行業(yè)需要加強(qiáng)對(duì)大數(shù)據(jù)分析模型的研究和軟件開發(fā),其中要結(jié)合著自身特點(diǎn)。大數(shù)據(jù)審計(jì)分析平臺(tái)能夠真正發(fā)揮注冊(cè)會(huì)計(jì)師審計(jì)領(lǐng)域的作用,關(guān)鍵是要有多個(gè)可以有效解決實(shí)際問題的數(shù)據(jù)挖掘分析模型或系統(tǒng)審計(jì)軟件。詳細(xì)的合作方式應(yīng)審核實(shí)踐專家提供的審核問題需要解決和明確的前瞻性需求,由專家在學(xué)術(shù)研究中和數(shù)據(jù)分析工作中加強(qiáng)數(shù)據(jù)分析數(shù)學(xué)模型的構(gòu)建和相關(guān)軟件的研發(fā)。
4.加強(qiáng)對(duì)大數(shù)據(jù)的理解和應(yīng)用能力
大數(shù)據(jù)時(shí)代是一個(gè)新的視野,它將轉(zhuǎn)變生活方式,工作和思維方式,在這場(chǎng)巨大的技術(shù)革命中,能夠抓住機(jī)遇的人,就能成為大數(shù)據(jù)或強(qiáng)大的數(shù)據(jù)分析計(jì)算能力的擁有者,就可以在未來的競(jìng)爭(zhēng)中取得勝利。但是,只有審計(jì)經(jīng)驗(yàn)和少量的數(shù)據(jù)信息或簡(jiǎn)單的數(shù)據(jù)來進(jìn)行審核工作,勢(shì)必會(huì)增加審計(jì)風(fēng)險(xiǎn)。因此在大數(shù)據(jù)時(shí)代,會(huì)計(jì)師事務(wù)所必須制定長(zhǎng)期戰(zhàn)略目標(biāo)、加強(qiáng)對(duì)大數(shù)據(jù)的全面認(rèn)知,將云審計(jì)納入事務(wù)所的使命和戰(zhàn)略目標(biāo),從而實(shí)現(xiàn)長(zhǎng)遠(yuǎn)利益。而且可以針對(duì)個(gè)別項(xiàng)目進(jìn)行大數(shù)據(jù)審計(jì)試點(diǎn),以培養(yǎng)出更加具有數(shù)據(jù)分析能力的專業(yè)的審計(jì)人員。
四、結(jié)語
總之,大數(shù)據(jù)技術(shù)的不斷發(fā)展給審計(jì)工作帶來了新的契機(jī),使審計(jì)工作走向精細(xì)、科學(xué)、高效,這就要求審計(jì)人員在面對(duì)新時(shí)期的具體工作時(shí),應(yīng)該樹立持續(xù)發(fā)展的理念,抓住大數(shù)據(jù)技術(shù)對(duì)審計(jì)工作帶來的契機(jī),不斷在審計(jì)思路和審計(jì)方法上進(jìn)行創(chuàng)新,最大限度地利用大數(shù)據(jù)帶來的機(jī)遇,爭(zhēng)取不斷提高注冊(cè)會(huì)計(jì)師在大數(shù)據(jù)時(shí)代的執(zhí)業(yè)能力。
[參 考 文 獻(xiàn)]
[1]文峰.云計(jì)算與云審計(jì)――關(guān)于未來審計(jì)的概念與框架的一些思考[J].中國(guó)注冊(cè)會(huì)計(jì)師,2011(2):34-36
[2]鄧川,楊文鶯.基于云審計(jì)的會(huì)計(jì)師事務(wù)所機(jī)遇、挑戰(zhàn)及對(duì)策[J].財(cái)會(huì)通訊,2012(10):83-84
大數(shù)據(jù),作為一種數(shù)據(jù)管理的理念和方式,其之所以出現(xiàn),是云計(jì)算和物聯(lián)網(wǎng)等信息技術(shù)的發(fā)展,與人類社會(huì)所積累的數(shù)據(jù)高速增長(zhǎng)并海量積累相結(jié)合的結(jié)果。無論是如何定義,從本質(zhì)上,大數(shù)據(jù)是信息管理者在當(dāng)今的信息技術(shù)條件下,為解決新的海量信息處理需求,所提出的解決策略。而作為典型的信息管理活動(dòng)之一的檔案事業(yè),勢(shì)必會(huì)受到大數(shù)據(jù)理念的影響。
大數(shù)據(jù)并不是一個(gè)嚴(yán)謹(jǐn)而完整的學(xué)術(shù)概念,其所包含的內(nèi)容相對(duì)比較抽象,從字面意義上進(jìn)行理解,大數(shù)據(jù)所指的是數(shù)據(jù)規(guī)模的龐大。但從這一意義上來看,顯然無法與傳統(tǒng)的以往一系列概念進(jìn)行區(qū)別,如“海量數(shù)據(jù)”(Massive Data)、“超大規(guī)模數(shù)據(jù)”(Very Large Data)。在學(xué)術(shù)界,對(duì)于大數(shù)據(jù)的定義尚未形成統(tǒng)一的觀點(diǎn),但綜合各種說法,主流的思路是從大數(shù)據(jù)的特征出發(fā),通過歸納的方式,通過對(duì)特征的描述進(jìn)行定義。其中最有代表性的是3V定義[1],即認(rèn)為大數(shù)據(jù)需滿足3個(gè)特點(diǎn):規(guī)模性(Volume)、多樣性(Variety)和高速性(Velocity)。此外在實(shí)踐層面,普遍認(rèn)為大數(shù)據(jù)具有全數(shù)據(jù)規(guī)模、多數(shù)據(jù)類型、低價(jià)值密度、高處理速度的特點(diǎn)。
在數(shù)據(jù)管理理念層面,大數(shù)據(jù)的特點(diǎn)在于全數(shù)據(jù)規(guī)模、豐富的數(shù)據(jù)類型(可能包含半結(jié)構(gòu)化數(shù)據(jù))、全數(shù)據(jù)處理對(duì)象、多數(shù)據(jù)處理工具;在數(shù)據(jù)處理技術(shù)層面,大數(shù)據(jù)體現(xiàn)為對(duì)云計(jì)算和新一代數(shù)據(jù)庫(kù)的應(yīng)用;在操作方式層面,大數(shù)據(jù)體現(xiàn)為對(duì)零散信息價(jià)值的重視及對(duì)數(shù)據(jù)之間相關(guān)而非因果關(guān)系的分析。
二、大數(shù)據(jù)對(duì)檔案工作帶來的機(jī)遇
(一)解決信息化背景下檔案的“脹庫(kù)”問題
近年來,隨著電子文件的理念逐步得到認(rèn)可,以及檔案的單位管理成本的降低,加之人們對(duì)于歸檔保存的重要性的認(rèn)識(shí)的提升,我國(guó)的檔案總量步入了一個(gè)高速增長(zhǎng)的時(shí)期[2],但與此同時(shí),信息化背景下的檔案數(shù)據(jù)庫(kù)脹庫(kù)問題也隨之到來了,其中較為明顯的表現(xiàn)為“新增數(shù)據(jù)失敗”等[3],脹庫(kù)問題帶來的,不僅僅對(duì)新增檔案管理上的難題,同樣重要的是,由于脹庫(kù)現(xiàn)象的出現(xiàn),檔案的服務(wù)利用的效率將大打折扣,其原因在于案卷在出現(xiàn)脹庫(kù)的過程中,無法及時(shí)有效地歸檔并建立索引以提供服務(wù),破壞了檔案案卷之間的連續(xù)性和關(guān)聯(lián)性,降低了檔案中所提供的信息的價(jià)值。信息化背景下檔案的“脹庫(kù)”問題,本質(zhì)上在于存儲(chǔ)和計(jì)算資源分配的不夠合理,傳統(tǒng)的數(shù)據(jù)庫(kù)架構(gòu)在處理新的海量數(shù)據(jù)的過程中,靈活性遠(yuǎn)遠(yuǎn)不夠。解決這一問題,需要求助于大數(shù)據(jù)技術(shù)框架中的云計(jì)算技術(shù)[4],利用云計(jì)算技術(shù)強(qiáng)大的調(diào)配計(jì)算資源的能力,根據(jù)數(shù)據(jù)處理規(guī)模的需要,配置數(shù)字化檔案管理所需要的存儲(chǔ)和計(jì)算資源,保證檔案的服務(wù)利用效率。
(二)有利于推動(dòng)社會(huì)檔案觀的普及
大數(shù)據(jù)的核心在于從海量的數(shù)據(jù)中挖掘價(jià)值[5],這為檔案價(jià)值的進(jìn)一步發(fā)現(xiàn)和提升,提供了一個(gè)新的思路。傳統(tǒng)的檔案服務(wù)利用概念中,檔案的服務(wù)利用對(duì)象是特定并且相對(duì)單一的,原因在于檔案通過卷宗的形式,將一個(gè)相對(duì)完整的信息“包裹”存留,這部分相對(duì)完整的信息最終成為了檔案卷宗的主題。而在服務(wù)利用的過程中,“主題匹配”成為了最為常見的檔案定位方式,而主要來自于政府機(jī)關(guān)、企事業(yè)單位的日常運(yùn)行信息形成的檔案,其主題自然會(huì)牢牢地與其形成機(jī)關(guān)的業(yè)務(wù)活動(dòng)相對(duì)應(yīng),而檔案卷宗中所包含的零散的信息價(jià)值,相對(duì)容易被忽略,如今被公眾廣泛利用的檔案,多數(shù)是民生檔案[6],而其他類型檔案中的零散信息價(jià)值,缺乏有效的挖掘服務(wù)利用手段,這是社會(huì)檔案觀在普及過程中必須解決的問題之一,即如何幫助公眾挖掘他們所關(guān)心的分散于海量檔案中的信息價(jià)值。大數(shù)據(jù)為檔案的服務(wù)利用提供了新的價(jià)值挖掘工具,使得分散在海量數(shù)據(jù)中的零散價(jià)值成為可能,這就意味借助大數(shù)據(jù)的信息分析工具,公眾將能夠從主題上看上去并不相關(guān)的眾多檔案中,發(fā)掘其自身所需要的信息,獲取相應(yīng)的信息價(jià)值,將推動(dòng)公眾逐漸意識(shí)到檔案作為當(dāng)今社會(huì)最重要的信息價(jià)值載體之一的重要意義,而一旦這樣的意識(shí)逐步成型,檔案社會(huì)觀將得到普遍的認(rèn)可。
(三)有利于處理多載體類型的檔案
信息技術(shù)的發(fā)展對(duì)于檔案管理工作的重要影響之一,就是提供了多樣化的信息載體形式,豐富了檔案的類型,從最原始的紙質(zhì)載體的文書檔案,發(fā)展到如今的音像檔案、圖片等等。而隨著電子文件概念不斷獲得認(rèn)可,新的信息載體形式層出不窮,從理論上講,每當(dāng)出現(xiàn)一種新的信息載體形式,就會(huì)相對(duì)應(yīng)地出現(xiàn)該載體形式的檔案。這就意味著未來檔案的管理工作必將是基于多載體的,其載體的豐富程度可能會(huì)遠(yuǎn)遠(yuǎn)超過我們的預(yù)期,而為最大程度保證原始證據(jù)價(jià)值,在技術(shù)條件允許的前提下,未來的檔案管理工作將會(huì)嘗試接受半結(jié)構(gòu)化的數(shù)據(jù)作為檔案,以最大程度地保留證據(jù)價(jià)值[7]。這使得未來的檔案載體形式將呈現(xiàn)數(shù)量多、增長(zhǎng)快的特點(diǎn),這就要求針對(duì)具體檔案類型的管理工具,或者抽象為一類特定的數(shù)據(jù)處理工具,是無法實(shí)現(xiàn)“One size fit all”的,即不再存在能夠完美處理所有的檔案載體類型的管理工具。這一點(diǎn)上與大數(shù)據(jù)對(duì)處理多數(shù)據(jù)類型過程中所提出的數(shù)據(jù)工具組合的理念,是相一致的。未來的檔案服務(wù)利用活動(dòng),由于其面向的檔案對(duì)象的載體是多樣的,對(duì)其進(jìn)行利用的工具也將是多樣的,甚至為處理一些半結(jié)構(gòu)化的數(shù)據(jù)的過程中,可能會(huì)需要多種數(shù)據(jù)處理工具的組合。
(四)有利于電子文件的管理
大數(shù)據(jù)將從真實(shí)性、有效性、及時(shí)性三個(gè)方面提升電子文件的管理水平。首先從真實(shí)性角度考慮,由于電子文件驚人的增長(zhǎng)速度,其真實(shí)性鑒定工作一直是困擾檔案工作者的難題之一,傳統(tǒng)的“直接鑒定法”在實(shí)際操作的過程中所消耗的人力物力成本過于巨大[8],因此鑒定文件的真實(shí)性需要求助于大數(shù)據(jù)技術(shù)處理海量數(shù)據(jù)并分析復(fù)雜數(shù)據(jù)的能力;第二,從有效性角度考慮,電子文件的結(jié)構(gòu)化特征并不明顯,大量的電子文件都是半結(jié)構(gòu)化甚至是非結(jié)構(gòu)化的,在這種數(shù)據(jù)類型情況并不穩(wěn)定的前提下,處理數(shù)據(jù)對(duì)象單一的傳統(tǒng)檔案管理數(shù)據(jù)庫(kù)結(jié)構(gòu)是難于駕馭的,而大數(shù)據(jù)技術(shù)框架下對(duì)于多數(shù)據(jù)結(jié)構(gòu)的兼容性,能夠較好地解決這一問題,提升對(duì)電子文件進(jìn)行管理的有效性;第三,從及時(shí)性的角度考慮,電子文件的指數(shù)增長(zhǎng),使得及時(shí)地對(duì)新增檔案進(jìn)行管理成為了檔案工作者所面臨的一大難題,這樣的海量數(shù)據(jù)的實(shí)時(shí)處理,是檔案管理過程中前所未有的,這需要利用大數(shù)據(jù)技術(shù)框架中通過云計(jì)算的方式提升數(shù)據(jù)處理的及時(shí)性,才能保證電子文件管理的及時(shí)性。
三、大數(shù)據(jù)背景下檔案工作的發(fā)展趨勢(shì)
(一)從數(shù)字化到數(shù)據(jù)化
為應(yīng)對(duì)信息時(shí)代對(duì)于檔案工作新要求,檔案數(shù)字化的工作已經(jīng)進(jìn)行了多年,并在一定程度上解決了傳統(tǒng)檔案利用信息技術(shù)進(jìn)行管理及共享的問題[9],收到了相當(dāng)?shù)某尚А5诖髷?shù)據(jù)時(shí)代背景下,數(shù)字化僅僅是解決了載體形式或者說是信息技術(shù)的應(yīng)用問題,可以理解為檔案工作對(duì)信息技術(shù)的適應(yīng)性應(yīng)用,對(duì)于深入的數(shù)據(jù)挖掘與利用是遠(yuǎn)遠(yuǎn)不夠的。在大數(shù)據(jù)的時(shí)代背景下,信息管理者已經(jīng)不再滿足于更易管理和共享的信息形式,應(yīng)更為關(guān)注信息所能帶來的價(jià)值,這就要求對(duì)于檔案的管理工作框架,需要實(shí)現(xiàn)從數(shù)字化到數(shù)據(jù)化的轉(zhuǎn)變,即不僅僅能夠?qū)崿F(xiàn)對(duì)檔案案卷的數(shù)字化管理,更能夠根據(jù)海量數(shù)據(jù)挖掘利用的需要,對(duì)檔案的管理深入到數(shù)據(jù)層面,這將更為適合大數(shù)據(jù)技術(shù)架構(gòu)下對(duì)數(shù)據(jù)的“流處理”模式。
(二)從信息共享到信息價(jià)值共享
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)入了一個(gè)全新的階段,所有的信息管理者都面臨著同樣一個(gè)問題:將簡(jiǎn)單而直接的信息共享活動(dòng)轉(zhuǎn)換為更為高級(jí)的信息價(jià)值的共享,即需要對(duì)自身所掌握的信息的價(jià)值有清晰的掌握和準(zhǔn)確的理解,對(duì)應(yīng)到檔案工作者的現(xiàn)狀上,即檔案工作者僅僅了解自己在管理哪些檔案并提供服務(wù)利用,已經(jīng)無法適應(yīng)大數(shù)據(jù)時(shí)代對(duì)檔案服務(wù)利用的要求了,而需要能夠了解自己所掌握的檔案能做什么,所提供的檔案利用服務(wù)所實(shí)現(xiàn)的是什么功能,也就是要明確所掌握的檔案的價(jià)值。這需要對(duì)檔案利用服務(wù)的認(rèn)識(shí)有更加深入的認(rèn)識(shí),在大數(shù)據(jù)時(shí)代的背景下,由于對(duì)信息價(jià)值提取效率的提升,對(duì)于信息價(jià)值的共享將成為所有信息服務(wù)利用的主流趨勢(shì),這對(duì)檔案服務(wù)利用工作將是全新的挑戰(zhàn),這不僅僅要求能夠靈活地運(yùn)用大數(shù)據(jù)技術(shù)在整合檔案數(shù)據(jù)的基礎(chǔ)上挖掘其中蘊(yùn)含的價(jià)值,更加需要檔案工作者對(duì)于信息價(jià)值有著更為敏感的“嗅覺”。
四、大數(shù)據(jù)對(duì)檔案工作帶來的挑戰(zhàn)
(一)如何嵌入數(shù)據(jù)挖掘環(huán)節(jié)
傳統(tǒng)的檔案管理活動(dòng),最為通行的說法是包含收集、整理、保管、鑒定、統(tǒng)計(jì)和提供利用六個(gè)主要環(huán)節(jié),這六個(gè)環(huán)節(jié)組成了基本的檔案管理活動(dòng),并組成了一次完整的信息從收集到提供利用的過程。在大數(shù)據(jù)的時(shí)代背景下,對(duì)于檔案管理活動(dòng)提出了新的要求,即主動(dòng)地挖掘其中的價(jià)值并提供利用服務(wù),這就涉及到一個(gè)流程嵌入的問題,即數(shù)據(jù)挖掘環(huán)節(jié)應(yīng)該通過什么樣的方式嵌入到檔案管理活動(dòng)中來,是作為一個(gè)單獨(dú)的環(huán)節(jié)嵌入到檔案的管理流程之中,還是在傳統(tǒng)的檔案管理活動(dòng)的某一環(huán)節(jié)中實(shí)現(xiàn)數(shù)據(jù)挖掘的功能,直接關(guān)系到檔案管理活動(dòng)流程的合理性。數(shù)據(jù)挖掘的嵌入問題,當(dāng)檔案事業(yè)逐步步入電子文件時(shí)代之后,必須要解決的問題。
(二)如何保障檔案信息的安全性
大數(shù)據(jù)對(duì)于檔案信息的共享程度提出了更高的要求,只有在檔案資源高度共享的情況下,大數(shù)據(jù)技術(shù)框架下的云計(jì)算平臺(tái)才能發(fā)揮作用,真正實(shí)現(xiàn)檔案信息價(jià)值的利用。但隨之而來,就是檔案信息的安全性問題,如何解決在多類型、多結(jié)構(gòu)、高共享程度狀態(tài)下的數(shù)據(jù)安全問題,已經(jīng)顯得十分棘手。工作人員操作失誤、設(shè)備及網(wǎng)絡(luò)故障、計(jì)算機(jī)病毒、網(wǎng)絡(luò)黑客攻擊等對(duì)檔案信息安全構(gòu)成威脅的因素,在大數(shù)據(jù)的技術(shù)框架下,所造成的威脅可能會(huì)被相應(yīng)地放大。大數(shù)據(jù)時(shí)代的檔案信息的保密工作,其重心很有可能不再是保密體制的設(shè)計(jì),而更有可能是信息安全技術(shù)的有效應(yīng)用。
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:CSCD期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)