公務員期刊網(wǎng) 精選范文 大數(shù)據(jù)遷移方案范文

大數(shù)據(jù)遷移方案精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數(shù)據(jù)遷移方案主題范文,僅供參考,歡迎閱讀并收藏。

大數(shù)據(jù)遷移方案

第1篇:大數(shù)據(jù)遷移方案范文

迎接大數(shù)據(jù)時代

惠普在大數(shù)據(jù)市場的戰(zhàn)略是分別從產(chǎn)品和服務兩個方面幫助客戶迎接大數(shù)據(jù)帶來的挑戰(zhàn)。

在產(chǎn)品方面,主要通過業(yè)界熟知的自然語言分析平臺Autonomy IDOL、高性能數(shù)據(jù)分析平臺Vertica、通用日志管理平臺ArcSight等組成。而在服務方面,惠普推出了大數(shù)據(jù)咨詢服務。這些咨詢服務包括:為大數(shù)據(jù)管理制定整合IT戰(zhàn)略的惠普大數(shù)據(jù)基礎設施變革經(jīng)驗研討會;規(guī)劃并部署大數(shù)據(jù)系統(tǒng)基礎設施的Hadoop企業(yè)規(guī)劃服務、實施服務以及參考架構(gòu)實施服務;幫助客戶應對大數(shù)據(jù)中的風險和挑戰(zhàn),以及其對安全、合規(guī)以及業(yè)務連續(xù)性造成影響的惠普大數(shù)據(jù)保護與合規(guī)分析等。

簡化云部署和云管理

云計算是惠普所說的IT新型態(tài)之一,也是惠普重點投資領域,惠普推出的基于OpenStack技術的HP Cloud OS就是惠普在云計算領域的最新動作。這一開放且可擴展的云技術平臺將為惠普融合云通用架構(gòu)奠定基礎,將使企業(yè)客戶能夠在私有云、公有云和混合云環(huán)境中提高負載遷移能力,簡化安裝并提升生命周期管理水平。

惠普的私有云整合解決方案CloudSystem和登月系列服務器(MoonShot服務器)將首先內(nèi)置HP Cloud OS技術,來為客戶提供包括橫跨混合云基礎設施的突發(fā)功能在內(nèi)的更優(yōu)部署選擇。此外,惠普還計劃將HP Cloud OS技術集成到面向混合云的云管理平臺——惠普云服務自動化中。

惠普還推出了Sandbox版HP Cloud OS,使客戶能夠評估并了解OpenStack的使用方法。這將有助于開發(fā)新負載,并將當前負載遷移到云環(huán)境中。

推動存儲轉(zhuǎn)型

基于統(tǒng)一的技術平臺來支持存儲、備份以及歸檔,惠普推出了一體化的存儲架構(gòu)。在惠普世界之旅上新亮相的固態(tài)優(yōu)化全閃存惠普3PAR StoreServ系統(tǒng),主打在確保企業(yè)彈性且不增加數(shù)據(jù)中心復雜性的前提下,提供高性能和低延遲的產(chǎn)品表現(xiàn);惠普StoreOnce虛擬存儲設備(惠普StoreOnce VSA)更是一款惠普在軟件定義存儲領域的創(chuàng)新之作,它能讓小型站點縮減高達65%的備份成本。

此外,惠普還推出磁帶庫新產(chǎn)品StoreEver MSL6480,該產(chǎn)品能以適中的價格提供用于長期數(shù)據(jù)保護的企業(yè)級功能,它可以從小規(guī)模開始自如擴展,提供行業(yè)領先的性能、可擴展性和密度,實現(xiàn)3.5 PB的單個庫容量及高達每小時60.4 TB的性能。

打印及移動產(chǎn)品亟待重振雄風

從全球看,PC市場的萎靡不振給IT廠商帶來太多挑戰(zhàn),業(yè)內(nèi)努力尋找創(chuàng)新?;萜盏淖龇ㄊ?,新推出的產(chǎn)品和解決方案立足在“可幫助企業(yè)節(jié)省時間和資源,從而提升生產(chǎn)效率”。

惠普正式了兩款全新的PC/平板二合一產(chǎn)品—— HP SlateBook x2和HP Split x2;在“智”觸控產(chǎn)品方面,惠普全新的一體電腦和消費類筆記本電腦產(chǎn)品皆采用了智能十點觸控顯示技術,此次全新亮相的HP Pavilion11 TouchSmart 是惠普第一款小尺寸、全性能的觸控筆記本產(chǎn)品;針對倡導的“多”系統(tǒng)理念,惠普新一代產(chǎn)品采用了Windows、Android等不同操作平臺,使消費者可以根據(jù)個人實際應用特點從中挑選最貼切自身需求的產(chǎn)品。

第2篇:大數(shù)據(jù)遷移方案范文

EMC Isilon:橫向擴展 性能突出

大數(shù)據(jù)存儲不是一類單獨的產(chǎn)品,它有很多實現(xiàn)方式。EMC Isilon存儲事業(yè)部總經(jīng)理楊蘭江概括說,大數(shù)據(jù)存儲應該具有以下一些特性:海量數(shù)據(jù)存儲能力,可輕松管理PB級乃至數(shù)十PB的存儲容量;具有全局命名空間,所有應用可以看到統(tǒng)一的文件系統(tǒng)視圖;支持標準接口,應用無需修改可直接運行,并提供API接口進行面向?qū)ο蟮墓芾?;讀寫性能優(yōu)異,聚合帶寬高達數(shù)GB乃至數(shù)十GB;易于管理維護,無需中斷業(yè)務即可輕松實現(xiàn)動態(tài)擴展;基于開放架構(gòu),可以運行于任何開放架構(gòu)的硬件之上;具有多級數(shù)據(jù)冗余,支持硬件與軟件冗余保護,數(shù)據(jù)具有高可靠性;采用多級存儲備份,可靈活支持SSD、SAS、SATA和磁帶庫的統(tǒng)一管理。

通過與中國用戶的接觸,楊蘭江認為,當前中國用戶最迫切需要了解的是大數(shù)據(jù)存儲有哪些分類,而在大數(shù)據(jù)應用方面面臨的最大障礙就是如何在眾多平臺中找到適合自己的解決方案。

EMC針對不同的應用需求可以提供不同的解決方案:對于能源、媒體、生命科學、醫(yī)療影像、GIS、視頻監(jiān)控、HPC應用、某些歸檔應用等,EMC會首推以Isilon存儲為核心的大數(shù)據(jù)存儲解決方案;對于虛擬化以及具有很多小文件的應用,EMC將首推以VNX、XtremIO為核心的大數(shù)據(jù)存儲解決方案;對于大數(shù)據(jù)分析一類的應用需求,EMC會綜合考慮客戶的具體需求,推薦Pivotal、Isilon等一體化的解決方案。在此,具體介紹一下EMC用于大數(shù)據(jù)的橫向擴展NAS解決方案——EMC Isilon,其設計目標是簡化對大數(shù)據(jù)存儲基礎架構(gòu)的管理,為大數(shù)據(jù)提供靈活的可擴展平臺,進一步提高大數(shù)據(jù)存儲的效率,降低成本。

EMC Isilon存儲解決方案主要包括三部分:EMC Isilon平臺節(jié)點和加速器,可從單個文件系統(tǒng)進行大數(shù)據(jù)存儲,從而服務于 I/O 密集型應用程序、存儲和近線歸檔;EMC Isilon基礎架構(gòu)軟件是一個強大的工具,可幫助用戶在大數(shù)據(jù)環(huán)境中保護數(shù)據(jù)、控制成本并優(yōu)化存儲資源和系統(tǒng)性能;EMC Isilon OneFS操作系統(tǒng)可在集群中跨節(jié)點智能地整合文件系統(tǒng)、卷管理器和數(shù)據(jù)保護功能。

楊蘭江表示,企業(yè)用戶選擇EMC Isilon的理由可以歸納為以下幾點。第一,簡化管理,增強易用性。與傳統(tǒng)NAS相比,無論未來存儲容量、性能增加到何種程度,EMC Isilon的安裝、管理和擴展都會保持其簡單性。第二,強大的可擴展性。EMC Isilon可以滿足非結(jié)構(gòu)化數(shù)據(jù)的存儲和分析需求,單個文件系統(tǒng)和卷中每個集群的容量為18TB~15PB。第三,更高的處理效率,更低的成本。EMC Isilon在單個共享存儲池中的利用率超過80%,而EMC Isilon SmartPools軟件可進一步優(yōu)化資源,提供自動存儲分層,保證存儲的高性能、經(jīng)濟性。第四,靈活的互操作性。EMC Isilon支持眾多行業(yè)標準,簡化工作流。它還提供了API可以向客戶和ISV提供OneFS控制接口,提供Isilon集群的自動化、協(xié)調(diào)和資源調(diào)配能力。

EMC Isilon大數(shù)據(jù)存儲解決方案已經(jīng)在醫(yī)療、制造、高校和科研機構(gòu)中有了許多成功應用。

方案點評

EMC Isilon是一個強大但簡單的橫向擴展NAS方案,適用于希望投資數(shù)據(jù)管理而不是單純存儲的企業(yè)。當初,EMC將收購來的分布式數(shù)據(jù)倉庫軟件廠商Greenplum的軟件與Isilon存儲組合成了EMC最早的大數(shù)據(jù)解決方案。用戶既可以分開選擇Greenplum軟件或Isilon存儲,也可以選擇由Greenplum軟件和Isilon存儲組成的一體機解決方案?,F(xiàn)在,Greenplum軟件雖然已歸Pivotal公司,但EMC是Pivotal的經(jīng)銷商與合作伙伴,Greenplum與Isilon存儲的組合方案并不會因此受到影響。

HDS UCP:統(tǒng)一平臺 應用優(yōu)化

HDS中國區(qū)解決方案與專業(yè)服務事業(yè)部總監(jiān)陳戈認為,大數(shù)據(jù)存儲應該是一個解決方案:“大數(shù)據(jù)解決方案是由基礎架構(gòu)的各部件組成的,包含數(shù)據(jù)存儲、計算和分析,而存儲是此架構(gòu)中的一部分?!?/p>

大數(shù)據(jù)的存儲類型與傳統(tǒng)的存儲類型有一定區(qū)別:在大數(shù)據(jù)存儲中,更多的應用是一次寫、多次讀,讀得更多是大數(shù)據(jù)存儲的一個特點,而在傳統(tǒng)的數(shù)據(jù)存儲中,讀寫是隨機的,由于每個應用不同,其讀寫的比例也是隨機的;大數(shù)據(jù)存儲需要具有橫向的可擴展性,并可支持多種接口、多種數(shù)據(jù)訪問協(xié)議,便于不同數(shù)據(jù)進入這個大數(shù)據(jù)平臺。

談到中國用戶在大數(shù)據(jù)存儲應用中最迫切的需求是什么,陳戈認為,中國用戶最迫切的需求是如何逐步實現(xiàn)大數(shù)據(jù)應用,即用戶從現(xiàn)有的模式如何過渡到大數(shù)據(jù),如何更好地利用大數(shù)據(jù)進行經(jīng)營分析。

大數(shù)據(jù)的經(jīng)典定義可以歸納為四個“V”,但企業(yè)不可能一步到位實現(xiàn)四個“V”,這需要一個循序漸進的過程。海量的、多種類型的數(shù)據(jù)是一次性全部載入到大數(shù)據(jù)中,還是通過現(xiàn)有的平臺進行數(shù)據(jù)初選,再導入到大數(shù)據(jù)平臺中,是兩種不同的實現(xiàn)途徑。“先通過現(xiàn)有平臺進行數(shù)據(jù)初選,再導入到大數(shù)據(jù)平臺,這種方式更適合于客戶逐漸實現(xiàn)大數(shù)據(jù),可以縮短用戶實現(xiàn)大數(shù)據(jù)應用的時間?!标惛瓯硎?,“大數(shù)據(jù)主要是非結(jié)構(gòu)化數(shù)據(jù)。用戶可以使用基于對象數(shù)據(jù)存儲的HCP,利用其獨特的元數(shù)據(jù)采集和智能工具,對非結(jié)構(gòu)化文件數(shù)據(jù)進行管理,實現(xiàn)智能的自動化,這有助于對數(shù)據(jù)進行深度分析,幫助客戶從單一系統(tǒng)中存儲、共享、同步、保護、保存、分析和檢索文件數(shù)據(jù),減少垃圾數(shù)據(jù),進而為大數(shù)據(jù)分析建立一個良好的基礎?!?/p>

談到用戶在大數(shù)據(jù)應用中遇到的主要障礙,陳戈表示,一方面,應用軟件本身的智能程度是否能滿足行業(yè)應用需求,應用軟件是否已經(jīng)成型,大數(shù)據(jù)人才是否具備等,是讓大數(shù)據(jù)應用落地的關鍵;另一方面,如何抽取數(shù)據(jù),放在大數(shù)據(jù)平臺中進行相應的計算是另一個關鍵問題。

HDS可為所有數(shù)據(jù)提供單一、可擴展的虛擬化集成平臺。HDS推出了“三步”云戰(zhàn)略,從基礎架構(gòu)、內(nèi)容和信息三個層面幫助客戶解決目前所遇到的問題。具體來看,通過“基礎架構(gòu)云”,HDS可以幫助客戶進行虛擬化和集成管理,實現(xiàn)數(shù)據(jù)中心的整合;在第二層的“內(nèi)容云”當中,HDS可以按需提供內(nèi)容,更可以不受應用限制地進行數(shù)據(jù)搜索和集成;在第三層的“信息云”中,針對所有數(shù)據(jù)類型,HDS在其存儲平臺中融入了分析功能,使客戶可以從數(shù)據(jù)信息中獲取洞察力。

HDS提供的UCP for SAP HANA集成了基于大量數(shù)據(jù)集的創(chuàng)新和內(nèi)存分析技術,并提供實時的洞察力,從而使當前的信息驅(qū)動型企業(yè)可以加快其商業(yè)決策的速度。陳戈介紹說,UCP for SAP HANA解決方案結(jié)合了HDS刀片服務器技術、企業(yè)級存儲系統(tǒng)和業(yè)內(nèi)領先的網(wǎng)絡組件,在這樣一個集成的、高性能的硬件平臺上可以快速交付SAP下一代內(nèi)存計算技術。全球已有超過200家客戶在使用HDS和SAP的大數(shù)據(jù)解決方案。

方案點評

其實,HDS的“三步”云戰(zhàn)略也可以看成是其大數(shù)據(jù)戰(zhàn)略。HDS借助以UCP為核心的大數(shù)據(jù)平臺,可以幫助企業(yè)用戶構(gòu)建從基礎架構(gòu)到內(nèi)容歸檔和搜索,直至信息提取和分析的全面、高效的大數(shù)據(jù)解決方案。HDS的“信息云”直接與大數(shù)據(jù)相關。UCP是一個集成了計算、存儲與網(wǎng)絡的一體化平臺,它既可以提供像一體機一樣的整合性、簡單性,又可以提供靈活的選擇,連接第三方的設備組件。HDS還通過與包括SAP在內(nèi)的眾多大數(shù)據(jù)分析類的合作伙伴合作,針對行業(yè)定制優(yōu)質(zhì)的大數(shù)據(jù)解決方案。

HP StoreAll :快速部署 極速搜索

中國惠普有限公司企業(yè)集團存儲產(chǎn)品部存儲架構(gòu)師張楠向記者表示,大數(shù)據(jù)存儲是一套解決方案,應該能夠?qū)Υ髷?shù)據(jù)的Volume、Velocity、Variety和Value四個方面提供全面的支持。

第一,大數(shù)據(jù)存儲要支持海量級的數(shù)據(jù)存儲,比如具有PB級的存儲能力。第二,大數(shù)據(jù)存儲要支持更高的存儲速度,支持10Gb甚至更高的網(wǎng)絡連接。第三,大數(shù)據(jù)存儲要支持數(shù)據(jù)的多樣性,如圖片、文本、視頻、音頻等。第四,大數(shù)據(jù)最重要的是價值的體現(xiàn),而為了實現(xiàn)這一點,存儲本身應該具備快速、智能的數(shù)據(jù)檢索能力?!霸诖鎯Φ淖畹讓犹峁┳钪苯印⒖旖莸臄?shù)據(jù)檢索。這一過程簡單說就是,將上層的數(shù)據(jù)挖掘工作下移,充分利用存儲強大的處理能力和數(shù)據(jù)識別能力。”張楠舉例說,“比如,在秒級的單位內(nèi)對數(shù)據(jù)進行極速的搜索, 從幾千萬甚至上億個文件中找到目標數(shù)據(jù)?!?/p>

另外,模糊查詢能力也是大數(shù)據(jù)存儲不可缺少的功能。智能的模糊查詢將為大數(shù)據(jù)平臺提供更加便捷的存儲服務能力,使得存儲更像一臺智能的高速計算設備。

目前,很多中國用戶在存儲廠商的引導下,片面追求存儲的大容量和高性能,而忽略了大數(shù)據(jù)存儲本身應該提供的其他額外屬性。中國用戶在實施大數(shù)據(jù)的過程中經(jīng)常遇到的障礙有以下兩方面:第一,無法將存儲與大數(shù)據(jù)平臺進行對接;第二,無法充分利用大數(shù)據(jù)存儲的價值,也很難將其運用到實際的業(yè)務中。張楠表示,究其原因,主要在于有些大數(shù)據(jù)存儲產(chǎn)品沒有開放的接口協(xié)議,或沒有針對用戶的大數(shù)據(jù)場景進行特別優(yōu)化,也沒有用戶容易接受的易用的管理方式等。

惠普在大數(shù)據(jù)方面可以提供軟硬結(jié)合的解決方案?;萜赵谑召廇utonomy公司之后,將其軟件與惠普的硬件平臺進行了整合, 形成了一套完整的大數(shù)據(jù)解決方案。張楠介紹說,在存儲方面,惠普擁有像StoreAll這樣的大數(shù)據(jù)存儲平臺。借助HP StoreAll硬件平臺,用戶除了可以實現(xiàn)海量數(shù)據(jù)的存儲和高速數(shù)據(jù)訪問以外,還能實現(xiàn)高級的數(shù)據(jù)檢索功能,對特殊文件進行快速定位。同時,結(jié)合HP Autonomy軟件的特性,惠普還引入了模糊查詢、智能語義庫等概念,可以幫助企業(yè)用戶通過存儲底層為上層業(yè)務帶來所需的大數(shù)據(jù)業(yè)務價值。

如今,閃存不僅在大數(shù)據(jù)領域,而且在Tier 1存儲市場同樣占據(jù)著十分重要的地位。對于大數(shù)據(jù)平臺來說,閃存可用來提升存儲的存取速度,降低I/O的響應時間等。針對那些I/O壓力十分明確的大數(shù)據(jù)平臺, SSD可以發(fā)揮其效果, 提升存儲的整體性能。但是,SSD并不是萬能的。因為大部分的數(shù)據(jù)都是非結(jié)構(gòu)化的,而非結(jié)構(gòu)化數(shù)據(jù)對I/O的響應要求遠遠沒有對帶寬的需求大,所以,讓用戶花數(shù)倍的價格購買SSD存儲在目前來看還是比較困難的。從目前情況看,引入閃存的大數(shù)據(jù)解決方案還不是很普遍。

方案點評

惠普在大數(shù)據(jù)方面收購了兩個軟件公司Vertica與Autonomy,然后將它們的軟件與原有的硬件平臺進行整合,針對結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)都可以提供針對性的解決方案?;萜赵趯⒋髷?shù)據(jù)軟件與存儲硬件結(jié)合上也進行了嘗試,其中一個成功的例子就是HP StoreAll大數(shù)據(jù)存儲平臺。HP StoreAll具有以下特點:橫向擴展,最大可以擴展到16TB;集成HP Autonomy搜索引擎,可以快速搜索,實現(xiàn)實時大數(shù)據(jù)的價值;內(nèi)置對OpenStack的支持,可快速部署;支持文件和對象類型的數(shù)據(jù)存儲。

NetApp:統(tǒng)一架構(gòu) 無限擴展

如今,企業(yè)若想獲得成功,就必須想方設法應對具有前所未有的復雜性、高性能的海量數(shù)據(jù),并盡可能地管理這些數(shù)據(jù),從中發(fā)掘更大的商業(yè)價值。

對于國內(nèi)用戶來說,無論企業(yè)的規(guī)模和數(shù)據(jù)量大小如何,運用大數(shù)據(jù)的關鍵在于,企業(yè)是否把大數(shù)據(jù)作為一個真正的工具,去體現(xiàn)企業(yè)的差異化,從而提升競爭力。隨著越來越智慧的企業(yè)信息化的發(fā)展,IT不再是束縛企業(yè)發(fā)展的瓶頸,而是真正地融入了企業(yè)自身的業(yè)務中。越來越多的公司將大數(shù)據(jù)成功地運用于企業(yè)的商業(yè)模式。例如,在歐美,很多企業(yè)已經(jīng)著手將大量資源投放在大數(shù)據(jù)領域。反觀國內(nèi),在金融領域,有為數(shù)不少的企業(yè)通過大數(shù)據(jù)的分析工具來分析金融的走勢,實現(xiàn)風險管理,進行信用卡的追蹤等。此外,像零售、制造、電信等行業(yè)也已在嘗試利用大數(shù)據(jù)分析工具為企業(yè)營銷和決策提供支撐。

無論企業(yè)現(xiàn)在是否正在使用大數(shù)據(jù)工具,企業(yè)都應全面地考慮自身未來發(fā)展的需求,選擇一個廠家的平臺與之共同發(fā)展,這可以有效避免因數(shù)據(jù)和應用遷移帶來的麻煩。

在大數(shù)據(jù)方面,NetApp能夠幫助企業(yè)實現(xiàn)數(shù)據(jù)管理,應對業(yè)務挑戰(zhàn)的極限,將以數(shù)據(jù)為導向的洞察轉(zhuǎn)化為有效行動。若想將數(shù)據(jù)轉(zhuǎn)化為商機,僅僅提升管理能力是不夠的,需要徹底轉(zhuǎn)變數(shù)據(jù)和業(yè)務之間的聯(lián)系模式。NetApp可以幫助企業(yè)用戶持續(xù)管理數(shù)據(jù),迅速把握意料之外的新商機,永久保存所有數(shù)據(jù),并在靈活、開放的存儲平臺之上打造屬于企業(yè)自己的大數(shù)據(jù)解決方案。

NetApp提供了可高效處理、分析、管理和訪問大規(guī)模數(shù)據(jù)的大數(shù)據(jù)解決方案。NetApp的解決方案組合可劃分為分析、帶寬和內(nèi)容三個主要用例,這被稱之為大數(shù)據(jù)的“ABC”基本要素。

具體來看,分析(Analysis)是指針對極大數(shù)據(jù)集的高效分析。NetApp分析解決方案就是幫助用戶深入了解和利用數(shù)字世界,將數(shù)據(jù)轉(zhuǎn)化為高質(zhì)量的信息,以及提供關于業(yè)務的更深入見解,從而幫助企業(yè)做出更好的決策。

帶寬(Bandwidth)是指適用于數(shù)據(jù)密集型工作負載的性能。此類解決方案著重于為速度非??斓墓ぷ髫撦d提供更高的性能。高帶寬應用包括高性能計算(能以極快的速度執(zhí)行復雜的分析)、用于監(jiān)控和任務規(guī)劃的高性能視頻流、媒體和娛樂領域中的視頻剪輯和播放。

內(nèi)容(Content)是指無限的安全數(shù)據(jù)存儲。此類解決方案著重于滿足可擴展的安全數(shù)據(jù)存儲需求。內(nèi)容解決方案必須支持存儲的無限擴展能力,以便企業(yè)可以根據(jù)需要存儲任意多的數(shù)據(jù),并能在需要時找到所需的數(shù)據(jù)。

NetApp致力于通過一系列解決方案來提供高性能的運算和大數(shù)據(jù)的應用。2013年11月,NetApp再次更新了E系列家族產(chǎn)品,推出E2700和E5500。該系列產(chǎn)品采用可輕松擴展的設計,適用于要求99.999%的可靠性且穩(wěn)定、高性能的工作負載。

用戶在采購大數(shù)據(jù)存儲產(chǎn)品時,需要注意以下五個方面的問題:大數(shù)據(jù)存儲必須具有向上擴展與向外擴展的能力;架構(gòu)必須是針對工作負載進行優(yōu)化的,具有實時處理能力;具有整合的數(shù)據(jù)保護功能;保證7×24小時運行不中斷,可在線進行容量擴展,實施數(shù)據(jù)遷移等;可以實現(xiàn)服務的自動化。

方案點評

NetApp的技術優(yōu)勢集中體現(xiàn)在其統(tǒng)一存儲平臺上,從入門級產(chǎn)品到企業(yè)級產(chǎn)品,全部基于同一個體系架構(gòu)和操作系統(tǒng),不僅部署和使用方便,而且升級和擴展非常簡單。當初,NetApp收購LSI Engenio,其中一個重要的原因就是為了大數(shù)據(jù)。2013年,NetApp不斷更新E系列產(chǎn)品線,推出E2700和E5500等。E5500可以支持高IOPS混合工作負載和數(shù)據(jù)庫、高性能文件系統(tǒng)和帶寬密集型流等應用,可確保數(shù)據(jù)的高可用性、完整性和安全性。

曙光XData:高度集成 貼近行業(yè)

關于大數(shù)據(jù)存儲,目前業(yè)界沒有一個通用的定義。曙光信息產(chǎn)業(yè)股份有限公司總裁助理兼存儲產(chǎn)品線產(chǎn)品總監(jiān)惠潤海從曙光大數(shù)據(jù)平臺和解決方案角度,概括出大數(shù)據(jù)存儲的主要特征。

首先,大數(shù)據(jù)存儲必須支持全類型數(shù)據(jù), 包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)數(shù)據(jù),實現(xiàn)統(tǒng)一數(shù)據(jù)支持。

其次,存儲性能上,一方面,大數(shù)據(jù)存儲要支持海量數(shù)據(jù),并且要在保證數(shù)據(jù)可靠性的基礎之上,實現(xiàn)容量與性能的線性擴展;另一方面,為了實現(xiàn)大數(shù)據(jù)的價值,批處理和實時處理兩種措施都需要高性能的數(shù)據(jù)訪問獲取能力。

最后,在系統(tǒng)達到一定規(guī)模之后,系統(tǒng)的易用性和可管理性也是不可或缺的。

從應用角度來說,目前中國用戶在大數(shù)據(jù)存儲應用中最迫切的需求,是如何真正實現(xiàn)用戶數(shù)據(jù)的價值,如何驅(qū)動業(yè)務發(fā)展,實現(xiàn)決策和運營?!皬南到y(tǒng)構(gòu)建層面說,要實現(xiàn)數(shù)據(jù)高性價比的存儲和管理,同時滿足數(shù)據(jù)服務的相關需求?!被轁櫤1硎尽?/p>

針對用戶對大數(shù)據(jù)存儲的需求, 曙光推出了像大數(shù)據(jù)一體機這樣的全類型數(shù)據(jù)分析型產(chǎn)品,同時還基于該產(chǎn)品構(gòu)建了基于行業(yè)的解決方案,以幫助用戶實現(xiàn)大數(shù)據(jù)落地。

“除此之外, 我們還提供了大數(shù)據(jù)統(tǒng)一數(shù)據(jù)中心解決方案, 涵蓋了像主攻事物處理的DS900、DS800,以及針對文件存儲的Parastor等存儲產(chǎn)品。我們基于這些存儲產(chǎn)品構(gòu)建了大數(shù)據(jù)運營管理平臺?!被轁櫤=榻B說,“曙光的優(yōu)勢不僅在于可以提供全面的產(chǎn)品支撐,更重要的是能夠提供數(shù)據(jù)生命周期過程服務支持。目前,我們提供的免費維保期限為5年?!?/p>

曙光開發(fā)了針對不同行業(yè)和應用場景的大數(shù)據(jù)存儲解決方案。以金融行業(yè)為例,目前國內(nèi)四大行的應用系統(tǒng)每年產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)量已達到PB級,結(jié)構(gòu)化數(shù)據(jù)也以百TB計。面對如此大量的數(shù)據(jù),如何存儲、管理、利用和盤活它們呢?惠潤海認為,只有通過商業(yè)智能和高級分析應用解決方案才能將數(shù)據(jù)的價值最大程度地發(fā)揮出來。

針對金融行業(yè)用戶的需求,曙光開發(fā)的XData大數(shù)據(jù)解決方案利用優(yōu)化的大數(shù)據(jù)處理技術,對文件管理、歷史數(shù)據(jù)查詢和數(shù)據(jù)分析類應用等進行深入研究,為數(shù)據(jù)爆炸式增長帶來的海量數(shù)據(jù)存儲及分析應用提供高可靠的解決方案。

曙光金融行業(yè)XData大數(shù)據(jù)解決方案采用曙光自主研發(fā)的SN-MPP并行數(shù)據(jù)庫,同時結(jié)合大數(shù)據(jù)處理事實標準Hadoop,并充分考慮了多方面的數(shù)據(jù)收集,加入ETL工具和連接驅(qū)動器,提供了類SQL的接口,還和現(xiàn)有金融業(yè)務系統(tǒng)進行對接。

針對金融行業(yè)歷史數(shù)據(jù),XData大數(shù)據(jù)解決方案在方案設計上主要考慮了數(shù)據(jù)的安全性、歷史數(shù)據(jù)高效導入、快速訪問與分析報表。曙光金融行業(yè)大數(shù)據(jù)解決方案立足于基礎平臺建設,同時切實貼合金融行業(yè)用戶需求,提供了優(yōu)質(zhì)的軟硬一體化解決方案,為用戶一攬子解決了部署、業(yè)務移植開發(fā)等技術難題,幫助用戶跨過應用門檻。

第3篇:大數(shù)據(jù)遷移方案范文

云計算IT行業(yè)的大趨勢,越來越的企業(yè)開始考慮或者著手部署云計算。不過,業(yè)內(nèi)人士提醒,作為一種新的部署和利用IT技術的方式,云計算對數(shù)據(jù)中心的基礎設施有著較高的要求,換而言之,如果還是采用傳統(tǒng)的數(shù)據(jù)中心基礎設施,是很難滿足部署云計算的要求的。

“云計算的典型特點是高密度負載以及靈活地動態(tài)調(diào)度,這就要求數(shù)據(jù)中心的基礎設施能承受這種高密度負載的靈活遷移?!笔┠偷码姎釯T事業(yè)部全球數(shù)據(jù)中心副總裁Paul-Francois Cattier告訴記者,傳統(tǒng)數(shù)據(jù)中心由于沒有考慮這么高密度的負載,所以在供電能力和制冷能力上常常難以滿足需求;同時,在管理手段上也不支持負載在數(shù)據(jù)中心范圍內(nèi)自由調(diào)度。

另外,傳統(tǒng)數(shù)據(jù)中心在電能利用效率過低,通常PUE值會在2.2,而一個設計良好的數(shù)據(jù)中心其PUE值可以降到1.3,甚至1.1。

“降低電能消耗,提高用電效率,是對新一代數(shù)據(jù)中心或者說云時代數(shù)據(jù)中心的基本要求。這既是社會責任,也是降低數(shù)據(jù)中心運營成本的必然選擇?!盤aul-Francois Cattier說,相關研究表明,在數(shù)據(jù)中心的整體運營成本中,電力成本可能占到40%-50%,如此之高的占比提醒我們降低電能消耗的重要性。

什么樣的數(shù)據(jù)中心可以滿足云計算的要求?對此Paul-Francois Cattier認為,數(shù)據(jù)中心必須具有如下特征:

1. 標準化。新一代的數(shù)據(jù)中心一定是采用各種標準化的組件,符合各種國際標準。只有這樣才能保證快速部署,比如,集裝箱式數(shù)據(jù)中心只要幾周就可以快速構(gòu)建起來。

2. 高密度。云計算是一種集中化的部署方式,要在有限空間內(nèi)支持高負載,刀片式服務器等高密度設備是必然選擇。

3. 模塊化。數(shù)據(jù)中心要滿足動態(tài)的需求,必須具有一定伸縮性。同時,為了節(jié)省投資,最好能邊成長邊投資,而模塊化就是最好的選擇。另外,模塊化還能提高可靠性和節(jié)電。

4. 集中化的管理。傳統(tǒng)數(shù)據(jù)中心IT設備與基礎設施是由不同的人分開管理的,通常,IT設備由IT部門管理,而基礎設施則由基建部門負責。以虛擬機在不同機柜中的遷移為例,傳統(tǒng)的IT管理工具通常只關心那個機柜中是否有合適的IT資源,而實際上,如果某個機柜中如果制冷能力不夠,即使它還有冗余的計算能力也不適合增加新的負載。

“如今,這個問題已經(jīng)引起了廠商的關注,包括施耐德電氣旗下的APC在內(nèi)一些廠商已經(jīng)推出了集成化的管理工具,為云環(huán)境的管理提供了很大的方便。”Paul-Francois Cattier說。

====以下簡訊===

首款本土化設計桌面虛擬化產(chǎn)品面世

10月27日,在VMware公司主辦的VMware中國用戶大會上,福建升騰資訊有限公司與VMware正式聯(lián)合業(yè)內(nèi)首款專為中國客戶量身定制的桌面虛擬化解決方案——升騰CT Vision,全面滿足本土市場虛擬化桌面終端管理需求。升騰CT Vision是雙方自2010年10月達成戰(zhàn)略合作伙伴關系以來,充分利用各自在瘦客戶機產(chǎn)品研發(fā)、桌面虛擬化方面的優(yōu)勢,共同推出第一款專為中國用戶設計的桌面虛擬化產(chǎn)品,也是目前業(yè)內(nèi)外設支持最好的桌面虛擬化產(chǎn)品。

Sybase ASE 15.7正式上市

日前,SAP旗下的Sybase公司的全新版本的企業(yè)數(shù)據(jù)管理解決方案Sybase ASE 15.7正式上市。作為SAP Business Suite商務套件的基礎,ASE 15.7不僅為SAP客戶提供了一個強大的數(shù)據(jù)庫支持,也可以讓現(xiàn)有的Sybase ASE客戶方便地采用最新功能和優(yōu)化特性,而不需要升級數(shù)據(jù)庫。更為重要的是,具有全新先進壓縮功能的ASE 15.7還可以節(jié)省磁盤空間、提高并行硬件的性能和可擴展性,有效管理非結(jié)構(gòu)化數(shù)據(jù)。強大的功能足以應對大數(shù)據(jù)時代對數(shù)據(jù)處理性能、類型、安全等方面的挑戰(zhàn)。新版ASE有5大重大改進,包括面向存儲的優(yōu)化、應用程序開發(fā)效率提升、診斷與監(jiān)測的提升、增強的安全管理和性能提升。

Oracle NoSQL數(shù)據(jù)庫支持大數(shù)據(jù)應用

甲骨文公司日前宣布,Oracle NoSQL數(shù)據(jù)庫即日起可以在Oracle技術網(wǎng)下載。Oracle NoSQL數(shù)據(jù)庫是Oracle大數(shù)據(jù)產(chǎn)品線的關鍵組成產(chǎn)品之一。Oracle NoSQL數(shù)據(jù)庫能夠幫助客戶以動態(tài)架構(gòu)輕松管理大量數(shù)據(jù),例如博客數(shù)據(jù)、傳感器和智能電表數(shù)據(jù)、個性化數(shù)據(jù)收集以及社交網(wǎng)絡存留的數(shù)據(jù)。此外,甲骨文公司還將提供一款新型集成設計系統(tǒng),即Oracle大數(shù)據(jù)機(Oracle Big Data Appliance),該系統(tǒng)可以對Oracle NoSQL數(shù)據(jù)庫以及其它Oracle大數(shù)據(jù)產(chǎn)品進行優(yōu)化。Oracle大數(shù)據(jù)機將于2012年第一季度面市。

Infor 10 為企業(yè)軟件注入新體驗

Infor日前宣布推出Infor10和Infor10 ION軟件套件。Infor10具有消費者級用戶體驗和完整行業(yè)應用特性,Infor10 Workspace是Infor10的前端,旨在提供一個消費者級用戶體驗并改變普通企業(yè)用戶的工作方式;而Infor10 ION軟件套件是一個能夠改變企業(yè)軟件管理方式的輕量、中間件技術,作為Infor10的核心,ION連接并集成了Infor和非Infor的應用程序,并在一個常見的格式和庫里存儲信息。

SUSE基于OpenStack的云基礎設施解決方案

SUSE公司于近日宣布,其開源、云基礎設施解決方案的初步開發(fā)快照已。SUSE公司正在通過增加在商業(yè)上得到支持的工具,幫助客戶快速輕松地構(gòu)建私有云基礎設施來擴展其解決方案產(chǎn)品包。該公司的SUSE Cloud是業(yè)界第一個經(jīng)過充分配置的、基于OpenStack Diablo的可供公眾使用的軟件設備。它還是SUSE開源、開放標準、廠商無關的云基礎設施解決方案首個快照。依靠SUSE Enterprise Cloud Infrastructure這樣的開放解決方案,客戶可在私有云基礎設施的跨物理和虛擬環(huán)境中具有更強大的視程,從而使資源得到更好的利用、使業(yè)務更加高效。

Nimsoft服務臺提供托管的IT服務管理

Nimsoft日前宣布,Nimsoft服務臺作為一款基于SaaS模式的創(chuàng)新型解決方案,在亞太市場中被客戶廣泛采用。這款獨創(chuàng)的SaaS解決方案自推出伊始,來自服務提供商和企業(yè)客戶的需求持續(xù)顯著增長。

Nimsoft服務臺是一個純粹的SaaS多租戶解決方案,用戶可通過一個自助服務門戶獲得廣泛的能力,包括提交變更請求、請求服務、報告事件,并利用一款知識管理引擎來立即解決各種常見問題。同時,這種可按需定制的解決方案提供了基于ITIL的工作流程,以及多年的最佳實踐知識。 2010年3月,CA Technologies收購了Nimsoft。

百年伊頓創(chuàng)新為本

第4篇:大數(shù)據(jù)遷移方案范文

端到端的云計算解決方案

福建工程學院的目標是搭建一個支持大數(shù)據(jù)應用的云平臺。福建工程學院信息科學與工程學院副院長鄒復民說:“云平臺會更加易于管理,可以提高硬件的利用率和可靠性。云計算更富有彈性,使得CPU、內(nèi)存和整個處理集群得以即時擴展。我們面臨的挑戰(zhàn)是,要創(chuàng)建一個既可靠又易于管理的云平臺?!?/p>

福建工程學院考慮了眾多廠商的方案?!按鳡柕慕鉀Q方案具有很好的性價比?!编u復民介紹說,“經(jīng)過測試,戴爾的解決方案能夠可靠地支持VMware vCloud Suite軟件,確保云計算解決方案的穩(wěn)定和高性能。”

福建工程學院最終采用了端到端的戴爾整合云平臺,包括服務器和交換機。借助戴爾企業(yè)部署服務團隊的支持,福建工程學院部署了采用英特爾至強處理器的戴爾 PowerEdge M620刀片式服務器,每臺服務器配置128 GB內(nèi)存,運行VMwarevSphere Hypervisor 5.5。這些刀片服務器和戴爾網(wǎng)絡MXL10/40GbE交換機同時配置在戴爾PowerEdge M1000e模塊化刀片柜內(nèi)。戴爾交換機可以支持云環(huán)境中每臺物理服務器上的大量虛擬機。借助10/40GbE網(wǎng)絡進行連接,數(shù)據(jù)移動得更快。

福建工程學院一開始就看到了戴爾整合解決方案的優(yōu)勢。鄒復民說:“戴爾網(wǎng)絡MXL交換機使用10GbE鏈路進行連接,性能相當出色。選擇戴爾網(wǎng)絡MXL交換機的一大好處是,可以減少連接到核心交換機的接口數(shù)量。MXL交換機提供了更大的帶寬和更高的可靠性。未來,我們還可以輕而易舉地基于戴爾網(wǎng)絡MXL交換機的結(jié)構(gòu)進行擴展。”

在存儲方面,福建工程學院部署了具有數(shù)據(jù)分層功能的、采用英特爾Xeon處理器的戴爾Compellent SC8000存儲陣列,其性能和無縫擴展能力可以滿足福建工程學院的應用需求。鄒復民介紹說:“未來,我們還可以在Compellent SC8000中增加一個優(yōu)化的閃存層。戴爾Compellent解決方案的靈活性可以滿足我們長期存儲的需求?!睘榱耸乖苹A架構(gòu)變得更完善,福建工程學院還部署了采用英特爾至強處理器的戴爾PowerEdgeR730和R720服務器,用來支撐網(wǎng)站和一個獨立的校園信息云計算平臺。

實時分析交通信息,減少擁堵

如今,福建省政府和居民擁有出行的實時數(shù)據(jù),政府部門可以使用這些信息來改善交通管理。福建省大約有12萬輛汽車安裝了GPS裝置,平均每30秒就上傳一次車輛的位置、速度等數(shù)據(jù)。這些數(shù)據(jù)連同主要交通路口的視頻監(jiān)控數(shù)據(jù),源源不斷地進入云平臺。該云平臺通過研究前一天的數(shù)據(jù)來分析公眾的駕駛模式,比如分析出租車的行程和最受歡迎的路線等。鄒復民說:“我們通過戴爾端到端云平臺,正在幫助福建省制定其智慧城市的交通策略。這些數(shù)據(jù)展示了人們使用道路的方式,有助于政府制定相應的交通政策,從而解決車輛急速增長的難題?!?/p>

云平臺的數(shù)據(jù)主要通過兩個計算集群進行分析和處理:其中一個集群運行ApacheSpark開源軟件,是一個可以對大型數(shù)據(jù)集群進行復雜分析的計算框架;另一個集群則運行創(chuàng)建內(nèi)存數(shù)據(jù)池的Pivotal GemFire。兩個集群均運行在云平臺的虛擬機上。Apache Spark軟件每天處理大型數(shù)據(jù)集群的信息,ArcGIS軟件管理地理信息數(shù)據(jù)。這些服務器每30秒便對海量數(shù)據(jù)流進行一次處理。服務器內(nèi)存數(shù)據(jù)庫存儲的數(shù)據(jù)不超過10分鐘,一旦超過10分鐘,數(shù)據(jù)便會被遷移到戴爾Compellent陣列。Compellent陣列的可用容量為83TB,目前已經(jīng)使用了40TB。鄒復民表示:“校園網(wǎng)中的大多數(shù)應用程序已經(jīng)遷移到云平臺上。學校只剩下幾臺物理服務器,主要運行Oracle數(shù)庫?!?/p>

更好地支持智慧城市建設

第5篇:大數(shù)據(jù)遷移方案范文

關鍵詞:經(jīng)營分析;數(shù)據(jù)倉庫;大數(shù)據(jù);云計算

中圖分類號:TP311.13

1 研究背景和意義

隨著移動互聯(lián)網(wǎng)時代的到來,三大運營商的業(yè)務重點正在從話音、數(shù)據(jù)業(yè)務向互聯(lián)網(wǎng)業(yè)務轉(zhuǎn)變。這種轉(zhuǎn)變將對經(jīng)營分析系統(tǒng)帶來迫切的需求。一方面,日益嚴峻的競爭環(huán)境要求經(jīng)營分析系統(tǒng)分析粒度更加細化,為前臺客戶發(fā)展、客戶保留提供更為細致的分析結(jié)果;另一方面,隨著業(yè)務模式的轉(zhuǎn)變,海量的互聯(lián)網(wǎng)數(shù)據(jù)需要納入分析范圍,這兩方面的因素決定了未來幾年經(jīng)營分析系統(tǒng)的規(guī)模和處理性能將超常規(guī)發(fā)展。因此,經(jīng)營分析系統(tǒng)傳統(tǒng)的高端小型機+磁盤陣列的建設模式已難以適應移動互聯(lián)網(wǎng)時代企業(yè)發(fā)展的要求,亟需尋找低成本、高性能的演進方案。

2 云計算與大數(shù)據(jù)

自Google提出云計算概念以來,已使得IT行業(yè)發(fā)生了巨變。最近一年來,大數(shù)據(jù)概念迅速興起。大數(shù)據(jù)的興起說明數(shù)據(jù)已成為重要的資產(chǎn),誰擁有更多數(shù)據(jù)、更善于使用數(shù)據(jù),就能吸引用戶、產(chǎn)生價值,在未來IT行業(yè)發(fā)展中占據(jù)競爭的主動。

大數(shù)據(jù)技術與云計算的發(fā)展密切相關,大數(shù)據(jù)技術是云計算技術的延伸。大數(shù)據(jù)技術涵蓋了從數(shù)據(jù)的海量存儲、處理到應用多方面的技術,包括海量分布式文件系統(tǒng)、并行計算框架、NoSQL數(shù)據(jù)庫、實時流數(shù)據(jù)處理以及智能分析技術等。云計算為大數(shù)據(jù)提供了發(fā)展的可能,大數(shù)據(jù)是云計算絕佳的業(yè)務領域。

大數(shù)據(jù)技術為運營商帶來絕佳的轉(zhuǎn)型機會。除應用于傳統(tǒng)企業(yè)運營管理分析外(如戰(zhàn)略分析、競爭分析、運營分析、流量經(jīng)營分析、網(wǎng)絡管理維護優(yōu)化、營銷分析),還可利用積累的數(shù)據(jù),為用戶提供內(nèi)容服務,例如根據(jù)對用戶上網(wǎng)行為的分析,為用戶推薦應用商店軟件、IPTV視頻節(jié)目等。因此三大運營商應抓住機會,發(fā)力完善擴充運營分析系統(tǒng),盤活龐大的數(shù)據(jù)資產(chǎn),拓展業(yè)務領域。而這種轉(zhuǎn)型,需要現(xiàn)有的數(shù)據(jù)倉庫向云計算架構(gòu)演進。

而就技術來說,目前應用與大數(shù)據(jù)領域的云計算技術主要包括MPP(大規(guī)模并行處理)數(shù)據(jù)庫與Hadoop技術。

3 云計算MPP數(shù)據(jù)倉庫關鍵技術分析

隨著大數(shù)據(jù)時代的到來,傳統(tǒng)的數(shù)據(jù)倉庫系統(tǒng)已無法滿足性能和成本兩方面的挑戰(zhàn)。而廉價的x86設備通過分布式并行處理軟件集群實現(xiàn)了低成本、高性能的解決方案。雖然傳統(tǒng)交易型數(shù)據(jù)庫在向x86云平臺遷移過程中仍有許多問題難以解決,但在分析型數(shù)據(jù)領域,由于其數(shù)據(jù)操作多為連續(xù)讀寫,業(yè)界已有較多x86云計算MPP數(shù)據(jù)庫解決方案,構(gòu)建價格低廉的基于x86平臺的云數(shù)據(jù)倉庫已成為現(xiàn)實。MPP云計算數(shù)據(jù)倉庫關鍵技術如下所述。

3.1 數(shù)據(jù)庫SharedNothing集群架構(gòu)

面對大數(shù)據(jù)量的處理,MPP是數(shù)據(jù)倉庫的必然演進方向。并行數(shù)據(jù)庫架構(gòu)方式主要包括SharedDisk和SharedNothing兩種。

SharedDisk架構(gòu)指數(shù)據(jù)庫集群中每一個CPU使用自己的私有內(nèi)存區(qū)域,通過內(nèi)部通訊機制直接訪問所有磁盤系統(tǒng)。其主要特點為高并發(fā)、高可用性。但其存在資源爭用問題,當為大數(shù)據(jù)量處理增加更多的CPU時,因為增加了對內(nèi)存訪問和網(wǎng)絡帶寬的競爭,系統(tǒng)反而有可能減慢。

而在SharedNothing集群中,每一個CPU都有私有內(nèi)存區(qū)域和私有磁盤空間,而且2個CPU不能訪問相同磁盤空間,CPU之間的通訊通過網(wǎng)絡連接。其主要特點為,支持大數(shù)據(jù)量處理高并行、低并發(fā)、低可用性。當事務數(shù)量不斷增加時,SharedNothing體系可通過增加額外的CPU和內(nèi)存來數(shù)據(jù)庫穩(wěn)定增長,從而可以保證每個事務處理時間不變。同時,SharedNothing在運行過程中降低了競爭資源的等待時間,從而提高了性能。

就其適用場景而言,當應用代碼量很大、相關數(shù)據(jù)量比較小時,SharedDisk更加適合這種典型的OLTP應用;如計費系統(tǒng)。而當相關數(shù)據(jù)量很大、而應用代碼并發(fā)量很小時,由于SharedNothing架構(gòu)可將單一大任務分解為多個小任務、同時在多個節(jié)點處理,通過并行縮短任務處理時間,從而大大提升系統(tǒng)性能。因此SharedNothing架構(gòu)是云計算數(shù)據(jù)倉庫的必然選擇。

3.2 列式數(shù)據(jù)庫

列式數(shù)據(jù)庫是以列相關存儲架構(gòu)進行數(shù)據(jù)存儲的數(shù)據(jù)庫,主要適合于批量數(shù)據(jù)處理和即席查詢。相對應的是行式數(shù)據(jù)庫,數(shù)據(jù)以行相關的存儲體系架構(gòu)進行空間分配,主要適合小批量的數(shù)據(jù)處理,常用于聯(lián)機事務型數(shù)據(jù)處理。

列數(shù)據(jù)庫在數(shù)據(jù)倉庫、商務智能領域應用中有著先天的優(yōu)勢:獨特的存儲方式,能夠迅速的執(zhí)行復雜查詢;列數(shù)據(jù)庫的壓縮技術,更是能為數(shù)據(jù)倉庫、商務智能應用中巨大的數(shù)據(jù)量節(jié)約存儲成本;列數(shù)據(jù)庫先進的索引技術也大大提高了數(shù)據(jù)庫的管理,其優(yōu)勢詳見下表,可見列式數(shù)據(jù)庫是云計算數(shù)據(jù)倉庫的不二選擇。

4 運營商經(jīng)營分析系統(tǒng)演進方式探討

如前所述,隨著移動互聯(lián)網(wǎng)的快速發(fā)展,三大運營商如想在競爭中占據(jù)鰲頭,則其經(jīng)營分析系統(tǒng)應快速跟進,提升性能、擴大容量,抓住行業(yè)變革的機遇,采用云計算技術構(gòu)建海量數(shù)據(jù)分析平臺,實現(xiàn)數(shù)據(jù)的價值化。因此,經(jīng)營分析系統(tǒng)應在近期快速搭建企業(yè)統(tǒng)一云計算分析平臺。

就平臺搭建方式而言,可采用MPP數(shù)據(jù)庫與Hadoop技術結(jié)合的方式。MPP數(shù)據(jù)庫用于處理結(jié)構(gòu)化數(shù)據(jù)和大批量分析任務,實現(xiàn)對經(jīng)營分析系統(tǒng)核心數(shù)據(jù)倉庫的接管和替代;而Hadoop適合處理非結(jié)構(gòu)化數(shù)據(jù)與NoSQL數(shù)據(jù),適應小粒度高并發(fā)數(shù)據(jù)處理場景,應用于ETL等子系統(tǒng),與云計算MPP數(shù)據(jù)倉庫形成互補,充分提升數(shù)據(jù)倉庫的處理能力。

4.1 MPP數(shù)據(jù)庫建設方式建議

從業(yè)界主流的兩種云數(shù)據(jù)倉庫技術路線來看,一體機方案雖然性能較高,但其無法支持在線平滑擴展,在業(yè)務靈活性方面受限;且其硬件為專有硬件,容易形成對特定廠家的綁定;產(chǎn)品價格普遍較高,較傳統(tǒng)建設方式優(yōu)勢不明顯,隨著未來數(shù)據(jù)量的激增,必將對企業(yè)產(chǎn)生較大的成本壓力。

而軟件數(shù)據(jù)庫管理系統(tǒng)技術路線則在靈活性方面占據(jù)優(yōu)勢,可隨著未來業(yè)務的變化在線擴展系統(tǒng);其硬件支持標準x86設備,未來建設選型空間較大,系統(tǒng)總體投資較低;在未來使用大云HugeTable時,標準的x86硬件也可平滑利舊。因此,運營商應盡早引入基于軟件數(shù)據(jù)庫管理系統(tǒng)的云計算數(shù)據(jù)倉庫產(chǎn)品,一方面降低系統(tǒng)建設成本,另一方面通過系統(tǒng)遷移部署及早積累經(jīng)驗,規(guī)范應用軟件,為未來全面轉(zhuǎn)向云計算數(shù)據(jù)倉庫做好準備。

4.2 落地實施建議原則

由于云計算數(shù)據(jù)倉庫技術較為前沿,在通信行業(yè)落地案例極少,缺乏可借鑒的建設經(jīng)驗;而經(jīng)營分析系統(tǒng)已逐漸由后臺決策支持系統(tǒng)轉(zhuǎn)變?yōu)橹吻芭_業(yè)務發(fā)展的生產(chǎn)系統(tǒng),出于保證系統(tǒng)穩(wěn)定性考慮,在從現(xiàn)有經(jīng)營分析系統(tǒng)向云平臺遷移時,應審慎、分階段實施。

另一方面,現(xiàn)有經(jīng)分系統(tǒng)運行壓力已非常大,新業(yè)務需求層出不窮,系統(tǒng)能力擴容迫在眉睫。結(jié)合兩方面考慮,云計算數(shù)據(jù)倉庫落地建議以“分流減壓、可用驗證、漸次替換”分步實施方式進行。

5 結(jié)束語

云計算技術在大數(shù)據(jù)處理方面已具備較好的實踐基礎,可滿足運營商經(jīng)營分析系統(tǒng)低成本、高性能建設的需求,及早探索云數(shù)據(jù)倉庫的建設,近期將有助于其在移動互聯(lián)網(wǎng)時代占據(jù)競爭優(yōu)勢。遠期則可以在經(jīng)營分析系統(tǒng)基礎上,搭建大數(shù)據(jù)分析平臺,通過自己采集、第三方提供等方式匯聚數(shù)據(jù),并對數(shù)據(jù)進行分析,滿足在線廣告、電子商務等行業(yè)的數(shù)據(jù)分析需求。

參考文獻:

第6篇:大數(shù)據(jù)遷移方案范文

目前,客戶正在迅速部署分析應用來提高業(yè)務洞察力,并將ERP、分析和數(shù)據(jù)庫等關鍵工作負載向云計算平臺遷移,而x86系統(tǒng)是許多企業(yè)的第一選擇。X6 架構(gòu)對于內(nèi)存需求較大的應用來說,能夠提供三倍的可擴展內(nèi)存容量(與其他x86系統(tǒng)相比),以支持云計算和大數(shù)據(jù)分析。新一代X6 架構(gòu)具備以下特性:

X6采用 eXFlash 內(nèi)存通道存儲。這種存儲安裝在非??拷麮PU的內(nèi)存插槽上,能夠提供 12.8 TB的極速閃存容量,從而縮短延遲,提高以大數(shù)據(jù)分析為代表的應用性能。X6 可縮短數(shù)據(jù)庫操作的延遲時間,還可以通過減少或取消所需的外部 SAN/NAS 存儲單元而減少存儲成本;

X6采用模塊化、可擴展的設計,是能夠支持多代 CPU的x86架構(gòu),可以降低采購成本。X6 具有適應未來技術發(fā)展的穩(wěn)定性和靈活性,用戶可基于當前系統(tǒng)進行靈活擴展,并在日后進行升級,快速裝機和配置模式能夠簡化部署和生命周期管理。

X6能夠幫助客戶把基于云的交付模式擴展到關鍵業(yè)務領域。X6的內(nèi)存和存儲特性能夠提高虛擬機性能,支持應用的SaaS交付。具備自主自愈功能的 CPU 和內(nèi)存系統(tǒng)能夠主動識別潛在故障并采取修復措施,旨在保證應用正常運行時間。此外,向上集成的模塊設計便于系統(tǒng)管理員利用虛擬化工具執(zhí)行管理任務,從而降低系統(tǒng)管理成本和復雜性。

第7篇:大數(shù)據(jù)遷移方案范文

湖北聯(lián)通IT系統(tǒng)的演進就頗有代表性。湖北聯(lián)通的核心BSS系統(tǒng)從聯(lián)通創(chuàng)建至今一直沿襲著傳統(tǒng)的架構(gòu)模式:Unix小機加高端存儲陣列。為了滿足業(yè)務增長需求每年不斷地擴容改造,但在當前架構(gòu)下的擴容總是屬于被動地滿足應用升級的需求,即便如此,依然會在高峰時感覺緊張。

在云計算浪潮襲來,湖北聯(lián)通注意到云計算的優(yōu)勢開始嘗新求變。湖北聯(lián)通從2010年開始探索云架構(gòu),去年上半年基本完成了對整體系統(tǒng)平臺和應用進行了充分改造,初步構(gòu)建了基于IaaS架構(gòu)的BSS核心系統(tǒng)。同時,湖北聯(lián)通還做了一個大膽嘗試,基于x86服務器加開源kvm構(gòu)建資源池來支持其Web業(yè)務。

湖北聯(lián)通的這段經(jīng)歷其實江西電信也經(jīng)歷過。作為中國電信最早進行云計算項目試點之一,江西電信在更早些時候就已經(jīng)建起了一個有2臺大型主機、數(shù)十臺x86服務器構(gòu)成的IaaS云,在這個云平臺上,江西電信建起了橫跨三個數(shù)據(jù)中心的兩朵云(即公共云和業(yè)務云)。

江西電信云計算項目主要負責人柳立峰博士告訴本報記者,其嘗試云計算的一個目的,解決服務器和存儲設備利用率低的問題,提高IT系統(tǒng)靈活性,另一個更長遠的目的是為電信企業(yè)找到新的“錢途”?!氨热?,手機搜索、計算資源出租以及一些智能化應用等新業(yè)務形式都需要云計算平臺來支撐?!彼f。

江西電信和湖北聯(lián)通商在IT建設上的這些變化正是整個電信運營IT變化的一個縮影。近年來,云計算以及以通用服務器取代傳統(tǒng)高端小機成為很多電信運營商和大型企業(yè)非常關注的話題,而敏感的IT廠商顯然已經(jīng)注意到這種變化,推出了自己對應的服務和解決方案。

“今年1月份,我們了Symantec 4.0戰(zhàn)略,其核心之一是我們會把自己的技術重新整合來去推動整個的IT架構(gòu)的變革,即推動IT行業(yè)從傳統(tǒng)的IT架構(gòu)向云計算、移動化等新的IT架構(gòu)遷移?!辟愰T鐵克大中華區(qū)技術支持部總監(jiān)李剛告訴計算機世界記者。

很顯然,在移動化、大數(shù)據(jù)、云計算等新技術的推動下,IT行業(yè)向一個全新的架構(gòu)演變:移動終端成為用戶訪問企業(yè)信息重要的信息入口,改變了很多新的業(yè)務模式,直接推動IT系統(tǒng)的變化;大數(shù)據(jù)系統(tǒng)的出現(xiàn)使得原來的架構(gòu)成本太高、靈活性不夠的弱點越來越明顯。在這種背景之下,人們開始探索新的解決方案,而像x86服務器、通用的存儲設備等通用硬件和開源軟件由于成本優(yōu)勢,也開始進入規(guī)劃者的視野。

第8篇:大數(shù)據(jù)遷移方案范文

今年年初,EMC重新調(diào)整了管理團隊,任命了一位新的全球CIO Vic Bhagat,而原來的CIO Sanjay Mirchandani則被調(diào)到EMC新成立的公司Pivotal Initiativ,同時繼續(xù)支持EMC快速增長市場。有趣的是,Vic Bhagat來自通用電氣并在那里工作了20多年的時間,而通用電氣正是Pivotal的股東之一。

對于EMC這樣靠云計算與虛擬化解決方案每年收入上百億美元的公司來說,它的全球CIO從來都不僅僅負責傳統(tǒng)CIO的工作。作為新CIO,Bhagat同時還是企業(yè)服務業(yè)務執(zhí)行副總裁,其職責涉及EMC的信息技術、全球卓越中心、全球企業(yè)服務(GBS)以及間接采購組織。

“如果要把這四個層面的工作按照關注度進行排序的話,我首要關注的肯定是全球卓越研發(fā)中心,通過對組織架構(gòu)的重新調(diào)整,讓全球研發(fā)中心變得真正全球化,能夠?qū)WMC的核心研發(fā);其次是EMC的內(nèi)部IT架構(gòu),讓現(xiàn)有架構(gòu)跟上新的技術浪潮,并且成為EMC最新技術優(yōu)秀樣板;第三個是全球客戶服務,第四是采購?!盉hagat強調(diào),在這四項工作當中,重要的是找到其中重復或者效率不高的地方加以優(yōu)化和自動化,提高整個組織架構(gòu)的效率。

以EMC全球研發(fā)體系為例。Bhagat認為過去每個研發(fā)中心從某個角度講都各自為戰(zhàn),也存在著一定的競爭關系。這半年來他聽到不少業(yè)務開發(fā)部門強調(diào)“我主要是跟中國合作”、“我主要是跟以色列合作”或者“我主要是跟印度合作”之類的話。

“當然,這種模式也還可以?!盉hagat停頓了一下說,“但這樣會影響EMC真正從全球?qū)用婵创约旱难邪l(fā)體系――每個國家研發(fā)中心的知識產(chǎn)權以及他們的核心技術。所以我將把EMC所有的研發(fā)中心塑造成一個整體團隊進行合作,讓所有EMC的業(yè)務部門、開發(fā)部門和整體的卓越研發(fā)中心,形成一個長期、良好的模式?!?/p>

說到EMC的四大卓越研發(fā)體系――中國、愛爾蘭、以色列和印度,總會提到每個國家研發(fā)團隊獨特的價值和特性,而針對每個團隊的工作特點給他們布置不一樣的工作。如今,Bhagat更強調(diào)的研發(fā)體系的全球性工作網(wǎng)絡,“除了原來主要關注的國家之外,讓不同的研發(fā)中心之間也能互相進行支持與合作。這更多的是一個合作的平臺,而不是競爭的平臺?!?/p>

Bhagat認為自己在四個領域都接收了非常優(yōu)秀的團隊,但挑戰(zhàn)主要來自于人才。“我希望在我周圍都是一些比我更聰明、更優(yōu)秀的人才,只有這樣,才能把我的工作做得更好。但是怎么去找到這些聰明又優(yōu)秀的人才,對我來講還真是一個非常大的挑戰(zhàn)?!盉hagat認為工作當中的熱情很重要,“如果員工真的很有激情,對公司的各種戰(zhàn)略方向都很認同的話,不僅會給管理層帶來很大信心,客戶和整個市場對公司的信心也會大增。我最愿意跟團隊講的一句話就是――當你每天早上醒來的時候,應該感到非常興奮地去工作,因為你知道每天跟你一起工作的人都是一樣聰明、熱情的一群人?!?/p>

過去幾年,EMC原有的基礎架構(gòu)在云計算以及虛擬化方面得到了很大的提高,包括以服務的方式提高IT的價值,對整個IT架構(gòu)進行虛擬化,以及將分布在世界各地的數(shù)據(jù)中心進行整合以提高效率。比如,EMC公司內(nèi)部是EMC私有云產(chǎn)品的第一個用戶,在自己公司獲得成功后,EMC也將這些經(jīng)驗和產(chǎn)品推廣到全球客戶?!霸谕ㄓ秒姎?,我作為CIO更多是做后臺的工作――提供應用、IT架構(gòu)、支持業(yè)務系統(tǒng),更多是公司內(nèi)部層面上。但在EMC,CIO有兩個很重要的職責,除了保證整個公司內(nèi)部的IT基礎架構(gòu)能夠滿足業(yè)務的需求外,還要在外面真正面對客戶,讓客戶了解EMC的產(chǎn)品,我們自己是怎么使用自己的產(chǎn)品的?!?/p>

第9篇:大數(shù)據(jù)遷移方案范文

對非結(jié)構(gòu)化數(shù)據(jù)進行存儲,除了考慮易用性、性能和安全因素以外,還要考慮與智能挖掘相關技術相結(jié)合。

大數(shù)據(jù)要求用戶不僅要對傳統(tǒng)商業(yè)智能軟件進行改造,還要對企業(yè)已有的業(yè)務系統(tǒng)基礎架構(gòu)進行改造。

大數(shù)據(jù)面臨的最大挑戰(zhàn)是大規(guī)模、實時的關聯(lián)性分析。對于存儲來說,高吞吐、低延遲的要求會越來越高,內(nèi)存、閃存的重要性也會越來越高。

中國石油研究院總工程師賴能和表示:“我們擁有9萬個CPU、25PB存儲。在油氣勘探數(shù)據(jù)處理方面,我們面臨的主要挑戰(zhàn)是數(shù)據(jù)量和計算量非常大,數(shù)據(jù)來源單一,處理流程非常復雜,單個文件的容量就達100TB。我們對存儲的投資已超過了服務器?!?/p>

中國的大數(shù)據(jù)應用已經(jīng)起步。記者采訪了金融、互聯(lián)網(wǎng)、教育、制造等行業(yè)的一些敢于“吃螃蟹”的用戶。

精準營銷效果佳

大數(shù)據(jù)最先從互聯(lián)網(wǎng)行業(yè)興起,互聯(lián)網(wǎng)企業(yè)在大數(shù)據(jù)應用方面的一些成功經(jīng)驗值得其他行業(yè)借鑒。以攜程旅行網(wǎng)(CTRIP)為例,它的大數(shù)據(jù)應用目前正處于快速發(fā)展階段,已經(jīng)在很多方面進行了有益嘗試,包括細化網(wǎng)站平臺的流程,優(yōu)化業(yè)務運營,支持業(yè)務成長的決策,解決部分傳統(tǒng)方法難以解決的具體問題。攜程旅行網(wǎng)高級副總裁、研發(fā)中心總經(jīng)理葉亞明(Eric Ye)給記者舉了兩個例子:在飯店推薦和航班查詢方面,攜程就利用其數(shù)據(jù)精細化工具來計算業(yè)務的投資回報率(ROI);攜程還通過機器學習的方法識別用戶,進一步改善針對用戶的推薦結(jié)果,解決“查詢不到匹配酒店”等難題。

利用大數(shù)據(jù)為企業(yè)決策提供支持或者實現(xiàn)精準營銷是企業(yè)中常見的大數(shù)據(jù)應用。東方航空公司就是一例,它開展大數(shù)據(jù)研究和應用已經(jīng)有很長時間,并且采購了大數(shù)據(jù)一體機專門解決大數(shù)據(jù)的相關問題。目前,東方航空公司的大數(shù)據(jù)應用主要集中在營銷業(yè)務領域,包括渠道分析、航線分析、航班后期走勢分析、航線上客速度分析等。在東方航空公司,大數(shù)據(jù)處理和分析的益處顯而易見,它能提供更準確、更實用、更全面的數(shù)據(jù)分析和展現(xiàn),形成統(tǒng)一的營銷數(shù)據(jù)分析門戶,更好地為東方航空公司營銷的各個環(huán)節(jié)提供決策支持,使精準營銷成為可能。

中國傳媒大學高性能計算中心主任魯永泉博士和他的團隊近年來一直致力于打造中國首個動漫產(chǎn)業(yè)的云平臺,并且已經(jīng)了VSO虛擬工作室平臺。此平臺集虛擬工作室、動漫渲染、在線交易等眾多功能于一身,是真正能夠落地的動漫云平臺。據(jù)魯永泉介紹,他們已經(jīng)將大數(shù)據(jù)用于動漫云平臺,平臺的主要功能是對動漫云的用戶行為進行分析,為運營人員制定更加精確的營銷和服務策略提供支持。

追求高性價比

為滿足大數(shù)據(jù)的應用需求,存儲平臺究竟應該如何搭建呢?不同行業(yè)的用戶針對不同應用會進行不同的搭配。攜程已經(jīng)建立了一個具有一定規(guī)模的Hadoop集群,其大數(shù)據(jù)應用就基于此集群?!盀檫@個集群選擇相應的存儲方案時,我們綜合考慮了I/O吞吐性能、性價比、計算密集型還是存儲密集應用型等諸多因素?!比~亞明介紹說,“目前,我們標準的存儲配置是基于SATA硬盤,配合JBOD、數(shù)據(jù)傾斜調(diào)整、機架感知等可靠技術的應用,實現(xiàn)存儲和計算的優(yōu)化。面對一些特殊應用,我們還會采用不同的內(nèi)存存儲,如HBase節(jié)點中的內(nèi)存比例會稍高,而Hive/PIG等節(jié)點中的內(nèi)存比例則有所調(diào)整?!?/p>

東方航空公司對于大數(shù)據(jù)存儲的要求很明確,不僅要性能卓越,可擴展性強,還要實現(xiàn)安全保護,能夠?qū)崟r響應,實現(xiàn)負載均衡等。東方航空公司下一步將考慮引入對非結(jié)構(gòu)化數(shù)據(jù)的處理。針對非結(jié)構(gòu)化數(shù)據(jù)的存儲,東方航空公司除了會考慮易用性、性能和安全性等因素以外,對于與智能挖掘相關的技術也十分關注。東方航空公司選擇大數(shù)據(jù)解決方案秉承的原則是:業(yè)務驅(qū)動,信息技術引領,追求更高性價比。

目前,南華期貨股份有限公司在大數(shù)據(jù)方面的應用還不夠深入,但數(shù)據(jù)的采集和積累是其一直堅持在做的重要工作。南華期貨積累的數(shù)據(jù)主要包括兩年以上的全市場逐筆Tick行情數(shù)據(jù)、近10年的主力合約分鐘數(shù)據(jù)、全部客戶的交易和結(jié)算數(shù)據(jù)、詳細的網(wǎng)絡訪問日志等?!拔覀兊拇髷?shù)據(jù)應用主要集中在針對高端客戶的數(shù)據(jù)服務和有針對性的交易指導方面。接下來,我們還會依托實時交易數(shù)據(jù)分析,向客戶推送有針對性的咨詢服務等。”南華期貨股份有限公司總經(jīng)理助理顧松表示。

談到大數(shù)據(jù)對存儲的需求,顧松表示,核心需求主要體現(xiàn)在容量、可靠性和速度三方面。針對不同的應用,上述三個需求重要性的排序也會有所變化:比如在逐筆Tick行情數(shù)據(jù)處理中,重要性的排序是可靠性、容量、速度;在網(wǎng)絡訪問日志中,重要性的排序為容量、速度、可靠性。顧松特意強調(diào)了存儲可擴展的重要性:“當前,我們?yōu)槊總€應用都估算了具有一定冗余的存儲容量,所以可擴展性的重要性并沒有凸顯出來。不過隨著應用的發(fā)展和后續(xù)數(shù)據(jù)遷移、備份需求的增加,存儲的可擴展性和重復數(shù)據(jù)刪除等技術就會顯得更加重要和必要?!?/p>

長安汽車股份有限公司副總裁馬軍最想找的是懂算法的人,希望依靠更先進的算法實現(xiàn)數(shù)據(jù)的自動抽取,從而提升數(shù)據(jù)采集和分析的效率。他認為,公司現(xiàn)有的存儲平臺不會成為瓶頸。

魯永泉也表示,其動漫云平臺對存儲沒有特別的要求:“大數(shù)據(jù)意味著大存儲,而能夠滿足大數(shù)據(jù)需求的存儲,比如HDFS等的設計理念不再強調(diào)單個存儲的可靠性,而是強調(diào)利用建立副本等軟件的方式來確保數(shù)據(jù)的安全。至于性能方面,大型分布式系統(tǒng)的單個存儲節(jié)點的性能高一點固然很好,但其實對整體性能的影響不大,反而需要在網(wǎng)絡優(yōu)化方面多下些功夫?!?/p>

容量、性能同步擴

華為跨界到IT領域,其重要的資本就是在網(wǎng)絡領域多年積累的自主研發(fā)能力和過硬的產(chǎn)品品質(zhì),而華為最擅長的無阻塞交換網(wǎng)絡技術也讓華為在服務器、存儲和大數(shù)據(jù)解決方案的開發(fā)中顯得游刃有余且特色鮮明。華為OceanStor 9000大數(shù)據(jù)存儲系統(tǒng)在標準性能評估機構(gòu)SPEC的SPECsfs2008基準測試中再次刷新記錄,其性能領先友商產(chǎn)品3倍多。參與測試的華為OceanStor 9000的配置為100個節(jié)點,在NFS網(wǎng)絡共享協(xié)議環(huán)境下的性能達到5030264 IOPS,位居業(yè)界第一。同時,OceanStor 9000的橫向擴展架構(gòu)保證了系統(tǒng)的線性擴展能力,在不中斷業(yè)務的情況下,每增加一個新節(jié)點,容量和性能即可線性增長。