公務(wù)員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)分析平臺(tái)安全問題及建議

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)分析平臺(tái)安全問題及建議范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

大數(shù)據(jù)分析平臺(tái)安全問題及建議

摘要:隨著大數(shù)據(jù)技術(shù)的發(fā)展,大數(shù)據(jù)分析在各領(lǐng)域的作用也越來越重要,隨之而來的安全問題也開始凸顯。大數(shù)據(jù)系統(tǒng)具有服務(wù)分布式、數(shù)據(jù)海量和多樣化等特性,對(duì)傳統(tǒng)數(shù)據(jù)安全和網(wǎng)絡(luò)安全技術(shù)提出了新的要求。本文以人民銀行湖南省大數(shù)據(jù)分析平臺(tái)為例,從系統(tǒng)安全、網(wǎng)絡(luò)安全及數(shù)據(jù)安全三個(gè)方面入手,分析存在的問題,提出措施建議。

關(guān)鍵詞:大數(shù)據(jù);分析平臺(tái);安全

2017年人民銀行科技工作會(huì)議提出:“構(gòu)建以大數(shù)據(jù)為支撐的央行決策平臺(tái)、以分布式系統(tǒng)為核心的央行服務(wù)平臺(tái)、以數(shù)字貨幣探索為龍頭的央行創(chuàng)新平臺(tái)”。人民銀行“長沙中支”迅速行動(dòng),組織開展了人民銀行湖南省大數(shù)據(jù)分析平臺(tái)的建設(shè)工作。加強(qiáng)了大數(shù)據(jù)分析技術(shù)的學(xué)習(xí)和研究,對(duì)大數(shù)據(jù)分析平臺(tái)的可行性進(jìn)行了論證,召開年度信息化項(xiàng)目立項(xiàng)審批會(huì),將“大數(shù)據(jù)分析平臺(tái)”列為年度信息化建設(shè)項(xiàng)目。經(jīng)過多月開發(fā)測(cè)試,人民銀行湖南省大數(shù)據(jù)分析平臺(tái)上線運(yùn)行。2017年11月至今,完成系統(tǒng)生產(chǎn)環(huán)境部署及近3年相關(guān)業(yè)務(wù)數(shù)據(jù)導(dǎo)入,平臺(tái)運(yùn)行情況良好,各項(xiàng)功能達(dá)到或超過設(shè)計(jì)要求。

1應(yīng)用效果

人民銀行湖南省大數(shù)據(jù)分析平臺(tái)采用大數(shù)據(jù)領(lǐng)域的先進(jìn)技術(shù)框架,順應(yīng)大數(shù)據(jù)技術(shù)發(fā)展趨勢(shì),便于技術(shù)的跟蹤、升級(jí)。從目前來看,大數(shù)據(jù)平臺(tái)運(yùn)行效果較好,能夠滿足業(yè)務(wù)數(shù)據(jù)大規(guī)模存儲(chǔ)、分析、挖掘的需要。一是為海量業(yè)務(wù)數(shù)據(jù)提供了存儲(chǔ)空間。該平臺(tái)能夠存儲(chǔ)海量數(shù)據(jù),設(shè)計(jì)存儲(chǔ)量可滿足未來10年幾十億條數(shù)據(jù)的存儲(chǔ)。二是能在海量數(shù)據(jù)下,完成快速計(jì)算、快速統(tǒng)計(jì)。目前數(shù)億數(shù)據(jù)量情況下,根據(jù)任意條件,精確、快速定位到對(duì)應(yīng)記錄,查詢時(shí)間小于5秒。用戶進(jìn)行數(shù)據(jù)統(tǒng)計(jì)生成圖表,相應(yīng)時(shí)間在2秒以下。三是提供了多種數(shù)據(jù)展示手段,讓數(shù)據(jù)可視化。根據(jù)業(yè)務(wù)需求,該平臺(tái)提供對(duì)數(shù)據(jù)的多樣化統(tǒng)計(jì)、分析,以報(bào)表、多維分析、圖表等形式進(jìn)行展現(xiàn),為決策提供可靠的數(shù)據(jù)支持。

2存在問題

人民銀行湖南省大數(shù)據(jù)分析平臺(tái)的成功應(yīng)用,為履職提供了強(qiáng)有力的支撐,但在應(yīng)用過程中,也發(fā)現(xiàn)存在一些安全隱患。下文結(jié)合大數(shù)據(jù)安全和傳統(tǒng)數(shù)據(jù)系統(tǒng)安全之間的差異,分析人民銀行湖南省大數(shù)據(jù)分析平臺(tái)存在的安全問題。(1)缺乏全局的安全防護(hù)體系一是大數(shù)據(jù)環(huán)境下的安全模式發(fā)生改變。在傳統(tǒng)數(shù)據(jù)系統(tǒng)中,數(shù)據(jù)來源及用途,對(duì)于安全維護(hù)人員都是可知可控的,因而可以建立起有針對(duì)性的安全保護(hù)措施。但是在大數(shù)據(jù)系統(tǒng)中,數(shù)據(jù)海量,數(shù)據(jù)來源多種多樣,一些不經(jīng)意的問題可能造成無法預(yù)料的結(jié)果。二是大數(shù)據(jù)系統(tǒng)的應(yīng)用催生了網(wǎng)絡(luò)攻擊的新手段。傳統(tǒng)網(wǎng)絡(luò)攻擊手段,主要以癱瘓數(shù)據(jù)系統(tǒng)或竊取數(shù)據(jù)為主,攻擊方式較為直接,目的性強(qiáng)。而在大數(shù)據(jù)系統(tǒng)中,可持續(xù)攻擊(APT)被運(yùn)用得更為廣泛,攻擊持續(xù)時(shí)間長,攻擊行為也更為隱蔽,給防護(hù)帶來困難。因此,大數(shù)據(jù)安全需要具有全局的思路,綜合考慮數(shù)據(jù)的傳輸、存儲(chǔ)和處理過程的安全,建立多角度的防護(hù)體系。目前人民銀行湖南省大數(shù)據(jù)分析平臺(tái)的安全依賴于傳統(tǒng)的安全防護(hù)策略,尚未建立針對(duì)大數(shù)據(jù)系統(tǒng)的全局安全防護(hù)體系。(2)未實(shí)施有效的網(wǎng)絡(luò)隔離方案大數(shù)據(jù)系統(tǒng)中,網(wǎng)絡(luò)安全防護(hù)體系的建設(shè)難度較傳統(tǒng)數(shù)據(jù)系統(tǒng)高。一是由于分布式的服務(wù)器和離散的數(shù)據(jù)采集,使得訪問控制的配置難度提高,容易出現(xiàn)配置漏洞,造成非授權(quán)數(shù)據(jù)訪問風(fēng)險(xiǎn)。二是數(shù)據(jù)在網(wǎng)絡(luò)中流動(dòng)非常頻繁,而傳統(tǒng)網(wǎng)絡(luò)保護(hù)的方式對(duì)于較大較復(fù)雜的網(wǎng)絡(luò)往往力不從心,無法將監(jiān)控和保護(hù)部署到每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn),數(shù)據(jù)在流動(dòng)中被竊取的可能性大大提高。目前人民銀行湖南省大數(shù)據(jù)分析平臺(tái)部署集中在省級(jí)數(shù)據(jù)中心,但是為了快速提供對(duì)外服務(wù)和同原有數(shù)據(jù)系統(tǒng)進(jìn)行數(shù)據(jù)交換,大數(shù)據(jù)系統(tǒng)未同原有數(shù)據(jù)系統(tǒng)之間采取隔離措施,大數(shù)據(jù)系統(tǒng)復(fù)用了現(xiàn)有的存儲(chǔ)網(wǎng)絡(luò)和應(yīng)用網(wǎng)絡(luò),未使用獨(dú)立的安全域,這給大數(shù)據(jù)系統(tǒng)帶來了網(wǎng)絡(luò)方面的安全隱患。(3)數(shù)據(jù)泄露風(fēng)險(xiǎn)大、溯源難度高大數(shù)據(jù)系統(tǒng)中各種數(shù)據(jù)存儲(chǔ)在一起,如果未采取相應(yīng)的措施進(jìn)行安全等級(jí)分類,可能出現(xiàn)違規(guī)獲取的情況。另外,進(jìn)行數(shù)據(jù)分析時(shí),由于未進(jìn)行數(shù)據(jù)細(xì)粒度權(quán)限控制,可能出現(xiàn)數(shù)據(jù)無法按需調(diào)用的情況。數(shù)據(jù)出現(xiàn)泄露情況后,由于數(shù)據(jù)來源復(fù)雜,使用量大,數(shù)據(jù)泄露的追蹤和溯源難度高。目前人民銀行湖南省大數(shù)據(jù)分析平臺(tái)數(shù)據(jù)來源于單一業(yè)務(wù),使用人員也集中在單一部門,數(shù)據(jù)安全風(fēng)險(xiǎn)較低。平臺(tái)擴(kuò)展后,數(shù)據(jù)來源廣,人員復(fù)雜,數(shù)據(jù)安全風(fēng)險(xiǎn)激增,勢(shì)必需要將數(shù)據(jù)安全防護(hù)體系與大數(shù)據(jù)系統(tǒng)同步規(guī)劃、同步建設(shè)、同步使用。

3加強(qiáng)大數(shù)據(jù)平臺(tái)數(shù)據(jù)安全的措施建議

3.1加強(qiáng)大數(shù)據(jù)系統(tǒng)本身的安全防護(hù)水平

(1)建立集中審計(jì)系統(tǒng),對(duì)Hadoop的數(shù)據(jù)訪問和使用進(jìn)行安全審計(jì)。由于Hadoop自身沒有審計(jì)系統(tǒng),同時(shí)各組件的日志和審計(jì)記錄都分別存儲(chǔ)于組件內(nèi)部,想通過Hadoop自身完成全范圍的安全審計(jì)幾乎不可能??梢酝ㄟ^建立一個(gè)集中審計(jì)系統(tǒng),從各組件中收集日志及審計(jì)記錄,進(jìn)而集中存儲(chǔ)、分析,完成全系統(tǒng)安全審計(jì)。通過審計(jì)系統(tǒng)加強(qiáng)大數(shù)據(jù)系統(tǒng)責(zé)任管理,將數(shù)據(jù)安全責(zé)任落實(shí)到每個(gè)使用人身上。(2)使用加密認(rèn)證機(jī)制替代簡(jiǎn)單認(rèn)證機(jī)制。Hadoop中簡(jiǎn)單機(jī)制是默認(rèn)設(shè)置,根據(jù)客戶進(jìn)程的有效UID確定用戶名,只能避免內(nèi)部人員的誤操作。使用加密認(rèn)證機(jī)制替代簡(jiǎn)單認(rèn)證機(jī)制,可更好地確保Hadoop集群的可靠性、安全性。目前,普遍采用的較為安全可靠的是Kerberos認(rèn)證機(jī)制。Kerberos認(rèn)證機(jī)制支持集群中服務(wù)器間的認(rèn)證和Client到服務(wù)器的認(rèn)證。Kerberos可以將認(rèn)證的密鑰在集群部署時(shí)事先放到可靠的節(jié)點(diǎn)上,集群運(yùn)行時(shí),集群內(nèi)的節(jié)點(diǎn)使用密鑰得到認(rèn)證,認(rèn)證通過后的節(jié)點(diǎn)才能提供服務(wù),企圖冒充的節(jié)點(diǎn)由于沒有事先得到密鑰信息,無法與集群內(nèi)部的節(jié)點(diǎn)通信,無法非授權(quán)使用或篡改Hadoop集群。

3.2建立有效的網(wǎng)絡(luò)隔離機(jī)制

(1)建立獨(dú)立的網(wǎng)絡(luò)安全域供大數(shù)據(jù)平臺(tái)使用。通過使用網(wǎng)絡(luò)防火墻和交換機(jī)ACL策略,結(jié)合主機(jī)自身防火墻和遠(yuǎn)程登錄配置,限制大數(shù)據(jù)平臺(tái)的外部訪問。通過防火墻映射等方式,保護(hù)大數(shù)據(jù)應(yīng)用WEB服務(wù)。(2)通過流量分析系統(tǒng)等網(wǎng)絡(luò)安全設(shè)備,建立針對(duì)大數(shù)據(jù)系統(tǒng)的網(wǎng)絡(luò)數(shù)據(jù)分析報(bào)告。通過對(duì)日志信息、流量數(shù)據(jù)等的采集、分析,可以對(duì)大數(shù)據(jù)系統(tǒng)的網(wǎng)絡(luò)流量、網(wǎng)絡(luò)行為等信息有整體的了解,從而制定針對(duì)性的網(wǎng)絡(luò)安全防護(hù)策略。

3.3對(duì)敏感數(shù)據(jù)進(jìn)行隔離監(jiān)控

(1)建立敏感數(shù)據(jù)保護(hù)視圖,加強(qiáng)數(shù)據(jù)分級(jí)??筛鶕?jù)數(shù)據(jù)的不同來源,在大數(shù)據(jù)平臺(tái)中建立數(shù)據(jù)保護(hù)視圖。根據(jù)用戶的等級(jí)權(quán)限和業(yè)務(wù)需求,采用分級(jí)別保護(hù)的方式讓用戶接觸不到業(yè)務(wù)需求之外的數(shù)據(jù),當(dāng)數(shù)據(jù)使用者使用敏感數(shù)據(jù)時(shí)應(yīng)有提醒。(2)建立數(shù)字水印機(jī)制,使泄密數(shù)據(jù)可以溯源。數(shù)字水印是指將一些標(biāo)識(shí)信息直接嵌入數(shù)字載體(包括多媒體、文檔、軟件等)當(dāng)中,且不影響原載體的使用價(jià)值,也不容易被探知和再次修改。但生產(chǎn)方可以探查并通過這些標(biāo)識(shí)信息確認(rèn)數(shù)據(jù)來源。數(shù)字水印機(jī)制在數(shù)字版權(quán)保護(hù)系統(tǒng)中被廣泛使用,并被認(rèn)為是有效的。數(shù)字水印在大數(shù)據(jù)中的應(yīng)用,主要在于兩個(gè)方面:一是利用數(shù)字水印隱蔽和不可篡改的特性,判斷數(shù)據(jù)傳輸過程中是否遭到篡改;二是通過數(shù)據(jù)水印探測(cè),對(duì)數(shù)據(jù)泄露進(jìn)行溯源?;鶎友胄写髷?shù)據(jù)平臺(tái)可在數(shù)據(jù)源和數(shù)據(jù)分析結(jié)果中使用數(shù)字水印機(jī)制,一方面保證數(shù)據(jù)源的可用性;另一方面保障數(shù)據(jù)分析結(jié)果安全,當(dāng)數(shù)據(jù)出現(xiàn)泄漏時(shí),可及時(shí)發(fā)現(xiàn)并溯源。(3)對(duì)敏感數(shù)據(jù)進(jìn)行脫敏處理。數(shù)據(jù)脫敏是指對(duì)敏感信息通過脫敏規(guī)則對(duì)數(shù)據(jù)進(jìn)行變形,實(shí)現(xiàn)敏感數(shù)據(jù)的保護(hù)。數(shù)據(jù)脫敏的主要方法有:一是加密方法,采用標(biāo)準(zhǔn)的加密算法,加密后完全失去業(yè)務(wù)屬性;二是基于數(shù)據(jù)失真的技術(shù),使用隨機(jī)干擾、“亂序”等方式,不可逆的打亂數(shù)據(jù),通過這種算法可以生成“看起來很真實(shí)的假數(shù)據(jù)”;三是可逆的置換算法,兼具可逆和保證業(yè)務(wù)屬性的特征,可以通過位置變換、表映射、算法映射等方式實(shí)現(xiàn)。脫敏后的數(shù)據(jù),既不影響大數(shù)據(jù)的分析、挖掘,又可有效地保護(hù)數(shù)據(jù)安全。當(dāng)用戶使用央行大數(shù)據(jù)平臺(tái)中的數(shù)據(jù)時(shí),應(yīng)根據(jù)用戶權(quán)限和數(shù)據(jù)用途等,對(duì)調(diào)用的數(shù)據(jù)進(jìn)行脫敏處理,既可保證大數(shù)據(jù)的充分使用,又可防止敏感數(shù)據(jù)泄漏。

參考文獻(xiàn):

[1]何利文,李杰,陳向東.面向大數(shù)據(jù)的軟件定義安全服務(wù)[C].第二屆CCF大數(shù)據(jù)學(xué)術(shù)會(huì)議論文集,2018.

[2]中國信息通信研究院安全研究所.大數(shù)據(jù)安全白皮書(2018).

[3]朱建波,李萍,于炯,廖彬.改進(jìn)的kerberos協(xié)議在HDFS環(huán)境下的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2014(10).

[4]朱倩,李雪燕.數(shù)字水印技術(shù)在大數(shù)據(jù)安全保護(hù)中的應(yīng)用[J].軟件導(dǎo)刊,2016(15).

作者:譚旺 單位:中國人民銀行長沙中心支行