前言:想要寫出一篇引人入勝的文章?我們特意為您整理了淺談網(wǎng)絡(luò)傳播的大數(shù)據(jù)發(fā)展范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:隨著計算機(jī)的普及,依托于計算機(jī)的網(wǎng)絡(luò)傳播成為了主要的信息傳播途徑,與此同時,大數(shù)據(jù)也開始發(fā)展,開始急速的衍生和擴(kuò)散,甚至可以說大數(shù)據(jù)下的計算機(jī)網(wǎng)絡(luò)已經(jīng)成為帶動國民經(jīng)濟(jì)發(fā)展的主體。但大數(shù)據(jù)應(yīng)該如何理解、網(wǎng)絡(luò)傳播下大數(shù)據(jù)又將如何發(fā)展已成為新的研究趨勢。
關(guān)鍵詞:網(wǎng)絡(luò)傳播;大數(shù)據(jù)技術(shù);大數(shù)據(jù)應(yīng)用
一、網(wǎng)絡(luò)傳播下的大數(shù)據(jù)的誕生
自2005年Hadoop項目誕生,大數(shù)據(jù)就進(jìn)入了人們的視野當(dāng)中。大數(shù)據(jù)無疑是在網(wǎng)絡(luò)傳播的基礎(chǔ)上進(jìn)一步衍生出來的“新產(chǎn)品”,想要系統(tǒng)的認(rèn)知大數(shù)據(jù),就必須要全面而細(xì)致的分解它,應(yīng)著手從三個層面來展開:第一層面是理論,理論是認(rèn)知的必經(jīng)途徑,也是被廣泛認(rèn)同和傳播的基線。在這里從大數(shù)據(jù)的定義、特征、問題等方面進(jìn)行剖析。第二層面是技術(shù),技術(shù)是大數(shù)據(jù)價值體現(xiàn)的手段和前進(jìn)的基石。這部分主要是從大數(shù)據(jù)的開源、存儲、分析和展示技術(shù)進(jìn)行詳盡的分析。第三層面是實踐,實踐是大數(shù)據(jù)的最終價值體現(xiàn)。大數(shù)據(jù)目前已被廣泛采用到生活當(dāng)中,此部分主要分析網(wǎng)絡(luò)中的大數(shù)據(jù)應(yīng)用。
二、網(wǎng)絡(luò)傳播下的大數(shù)據(jù)的理論分析
(一)大數(shù)據(jù)之概念及特點
“大數(shù)據(jù)”的概念最早由維克托•邁爾•舍恩伯格和肯尼斯•庫克耶在編寫《大數(shù)據(jù)時代》中提出,又稱為巨量資料,指需要新處理模式才具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。[1]在網(wǎng)絡(luò)傳播時代下,大數(shù)據(jù)主要呈現(xiàn)了以下四方面的特點:1.數(shù)據(jù)體量巨大(Volume)。當(dāng)前,典型個人計算機(jī)硬盤的容量為TB量級,而一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級。[2]2.數(shù)據(jù)類型繁多(Variety)。數(shù)據(jù)也分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化的數(shù)據(jù)即以文字呈現(xiàn)的數(shù)據(jù)結(jié)構(gòu),非結(jié)構(gòu)化的數(shù)據(jù)則包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等類型。3.價值密度低(Value)。海量數(shù)據(jù)并不能充足證明其重要性,換句話說就是,數(shù)據(jù)多并不代表價值高。4.處理速度快(Velocity)。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。
(二)大數(shù)據(jù)之問題所在
大數(shù)據(jù)、網(wǎng)絡(luò)傳播看似是一種簡單的依附與被依附的關(guān)系,二者相互依存、相互發(fā)展,但隨著這種關(guān)系的不斷行進(jìn)和演化,一些問題也開始顯露。1.表面化。盡管大數(shù)據(jù)能夠非常好地檢測相關(guān)性,但是它并不會告訴我們相關(guān)性是如何得出的、得出的合理性以及哪一種相關(guān)性是有意義的。2.輔助化。盡管大數(shù)據(jù)搜集的數(shù)據(jù)是龐大的,有一定的事實證明比例,其可以輔助科學(xué)調(diào)查,但不可能成功地被完全代替。3.理想化。如今的大數(shù)據(jù)為世人展現(xiàn)的都是其不可估量的大好前途,但大數(shù)據(jù)的數(shù)據(jù)缺失、情況偶然、不準(zhǔn)確數(shù)據(jù)不斷地被循環(huán)利用導(dǎo)致了更多問題的出現(xiàn),會引發(fā)更多的以偏概全,會導(dǎo)致思維的引向,甚至結(jié)論的錯誤。
三、網(wǎng)絡(luò)傳播下大數(shù)據(jù)技術(shù)的分析
(一)開源框架
HadoopHDFS,即HadoopFileSystem,是一款典型的開源文件系統(tǒng),其主要面向大文件的文件系統(tǒng),是分布式數(shù)據(jù)庫的基礎(chǔ)。在文件存取方面,HDFS用NameNode存放文件位置信息,用DataNode存放文件數(shù)據(jù)。[3]當(dāng)HDFS中存入大量的數(shù)據(jù)后,需要借助MapReduce完成工作分析。之后再從統(tǒng)計維度列出角度對統(tǒng)計值列出的數(shù)據(jù)進(jìn)行排序,最后通過聚合完成統(tǒng)計維度數(shù)據(jù)項的計算工作。
(二)大數(shù)據(jù)存儲技術(shù)
目前數(shù)據(jù)存儲技術(shù)主要包括以下兩種存儲技術(shù):1.分布式集群存儲技術(shù)。分布式集群存儲技術(shù)通常以大數(shù)據(jù)塊為單位,將數(shù)據(jù)切割存儲在多個節(jié)點,為保證數(shù)據(jù)的可靠性,需要在不同的存儲節(jié)點中保存多個數(shù)據(jù)副本。在分布式數(shù)據(jù)庫設(shè)計時,可以根據(jù)應(yīng)用的特點,采用分別處理增加、刪除、修改、查詢操作的方式進(jìn)行架構(gòu)設(shè)計,既要保證事務(wù)操作的一致性,又要滿足海量數(shù)據(jù)存取的性能要求。2.關(guān)系型數(shù)據(jù)庫存儲技術(shù)。關(guān)系型數(shù)據(jù)庫的操作語言是結(jié)構(gòu)化的查詢語言,包括數(shù)據(jù)定義語言和數(shù)據(jù)操作語言兩部分。DDL完成了數(shù)據(jù)對象和操作過程的定義,包括數(shù)據(jù)表、視圖、存儲過程、觸發(fā)器、主鍵、外鍵、索引、區(qū)分等,DML則完成了數(shù)據(jù)的操作功能,包括增加、刪除、修改、查詢,也就是人們經(jīng)常聽到的數(shù)據(jù)。
(三)大數(shù)據(jù)分析技術(shù)
對大數(shù)據(jù)進(jìn)行建模的目的是便于對數(shù)據(jù)進(jìn)行分析和利用,即對數(shù)據(jù)進(jìn)行多次ETL,經(jīng)過多次ETL之后的數(shù)據(jù)會變得越來越容易理解、使用和個性化,使得分析結(jié)果滿足特殊崗位甚至單個特定人的需求。
四、網(wǎng)絡(luò)傳播下的大數(shù)據(jù)應(yīng)用
實踐是檢驗真理的唯一標(biāo)準(zhǔn),大數(shù)據(jù)服務(wù)能否幫助企業(yè)取得成功,還需要在行業(yè)應(yīng)用實踐中得到答案。
(一)大數(shù)據(jù)在社交網(wǎng)絡(luò)領(lǐng)域的應(yīng)用
1.SNS業(yè)務(wù)應(yīng)用介紹。SNS體現(xiàn)了Web對于人類社會需求的滿足,人們通過Web應(yīng)用滿足了不同的心理需求。SNS不同于支持組織互動和業(yè)務(wù)流程的傳統(tǒng)應(yīng)用,其主要實現(xiàn)了人與人以及由人創(chuàng)建內(nèi)容之間的協(xié)同與共享。2.大數(shù)據(jù)技術(shù)與SNS應(yīng)用。不同的社交網(wǎng)絡(luò)應(yīng)用的特點也是不同的,除了微博的熱點話題,商務(wù)人士在SNS上形成的社會關(guān)系以及留下的溝通、評論等記錄,用戶的通信行為也是反映擁護(hù)社會關(guān)系的重要數(shù)據(jù)基礎(chǔ)。
(二)大數(shù)據(jù)在電子商務(wù)領(lǐng)域的應(yīng)用
大數(shù)據(jù)對電子商務(wù)的主要作用是發(fā)現(xiàn)用戶行為,然后有針對性地為用戶提供產(chǎn)品和服務(wù)。大數(shù)據(jù)可以反映世界萬事萬物之間的聯(lián)系,對于當(dāng)今的網(wǎng)絡(luò)十分重要。但如何利用大數(shù)據(jù)?大數(shù)據(jù)如何管理網(wǎng)絡(luò)的業(yè)務(wù)活動?種種疑問到目前為止還只是簡單的分析描述,希望今后能夠有更多的仁人志士投身于大數(shù)據(jù),挖掘其更大更廣的價值,造福于人類和社會。
參考文獻(xiàn):
[1]李金.快速充電站[J].人民公交,2016(3):108-109.
[2]王春研.大數(shù)據(jù)與計算機(jī)信息處理技術(shù)[J].黑龍江科技信息,2016(3):156.
[3]王魯俊,龍翔,吳興博,王雷.SFFS:低延遲的面向小文件的分布式文件系統(tǒng)[J].計算機(jī)科學(xué)與探索,2014(4):438-445..
作者:吳德勝 孫愷悅 單位:長春工業(yè)大學(xué)