公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘技術(shù)下數(shù)字化油氣藏研究

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術(shù)下數(shù)字化油氣藏研究范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

數(shù)據(jù)挖掘技術(shù)下數(shù)字化油氣藏研究

摘要:油氣藏在勘探開發(fā)及其研究與決策過(guò)程中,形成巨量的成果及數(shù)據(jù)。為了更加科學(xué)開發(fā)與管理油氣藏,充分運(yùn)用和發(fā)揮好這些巨量數(shù)據(jù)的信息作用成為關(guān)鍵,數(shù)據(jù)挖掘作為一種有效的信息處理技術(shù),可以在海量數(shù)據(jù)中快速找出有用信息,為研究與決策提供強(qiáng)有力的數(shù)據(jù)支持。長(zhǎng)慶油田在油氣藏研究與決策支持系統(tǒng)(RDMS)建設(shè)中充分利用各專業(yè)數(shù)據(jù)庫(kù)及多種數(shù)據(jù)挖掘方法,構(gòu)建了一個(gè)滿足勘探、開發(fā)、儲(chǔ)量管理、評(píng)價(jià)等綜合應(yīng)用的數(shù)據(jù)管理、數(shù)據(jù)操作及可視化展示的一體化平臺(tái),為油氣藏研究與決策人員提供全方位的數(shù)據(jù)處理與可靠決策,極大地提升了油氣藏的研究效率和決策質(zhì)量。

關(guān)鍵詞:數(shù)字化油氣藏;研究與決策;數(shù)據(jù)挖掘

油氣藏研究包含了從地質(zhì)勘查到石油產(chǎn)品最終用戶的復(fù)雜工藝流程,傳統(tǒng)的油氣藏研究方法存在工作效率低、準(zhǔn)確性不高、過(guò)度依賴人工經(jīng)驗(yàn)等問(wèn)題。決策者需要從海量的數(shù)據(jù)中找出有用的關(guān)鍵信息;論證現(xiàn)場(chǎng)中研究人員攜帶和使用的各類圖件無(wú)法充分展示其研究成果,也不能在論證現(xiàn)場(chǎng)短時(shí)間內(nèi)消化大量資料并做出正確的決策,更不能使信息資源的共享和成果的交互上得到充分實(shí)現(xiàn)。信息落后的信息處理方法與單一的研究手段不但花費(fèi)大量的精力與時(shí)間,更是造成大量寶貴的研究成果無(wú)法應(yīng)用與共享。近年信息技術(shù)的快速發(fā)展,催生了數(shù)字化油藏,促進(jìn)了數(shù)字油田的發(fā)展產(chǎn),數(shù)據(jù)挖掘等信息技術(shù)與油氣勘探開發(fā)數(shù)據(jù)資源的融合不斷加深,能夠提供更智能化的數(shù)據(jù)分析功能,更好地支持油氣藏勘探開發(fā)決策,開創(chuàng)了一種全新的油氣藏研究工作模式,降低了決策風(fēng)險(xiǎn),提升開發(fā)決策水平。長(zhǎng)慶油田針對(duì)具有數(shù)量龐大的、結(jié)構(gòu)不完整的、內(nèi)容不清晰且含有干擾信息的油氣藏研究工作數(shù)據(jù),開發(fā)了包括特征提取、規(guī)則劃分分類分析、關(guān)聯(lián)規(guī)則挖掘、聚類分析、模式分析及生成趨勢(shì)分析等[1-2]系列數(shù)據(jù)挖掘技術(shù),從中提取出包含在內(nèi)部的、不被人們知曉的、卻又含有有用的、重要的信息和知識(shí)[3-4],為長(zhǎng)慶油田的高效開發(fā)、快速發(fā)展提供了有效的數(shù)據(jù)信息支持。

一、油氣藏研究與決策支持系統(tǒng)

通過(guò)借鑒國(guó)內(nèi)外著名油氣公司在油氣勘探計(jì)算機(jī)軟件研發(fā)方面的經(jīng)驗(yàn)[5-6],依托長(zhǎng)慶油田豐富的數(shù)據(jù)資源,利用先進(jìn)的軟件研發(fā)技術(shù),長(zhǎng)慶油田研發(fā)出了一套數(shù)字化油氣藏研究(RDMS)系統(tǒng)。它以油氣藏研究為主線,業(yè)務(wù)驅(qū)動(dòng),數(shù)據(jù)鏈為手段,由協(xié)同工作平臺(tái)、數(shù)據(jù)整合平臺(tái)、數(shù)據(jù)可視化平臺(tái)等組成的一體化多學(xué)科協(xié)同工作環(huán)境。數(shù)字化油氣藏研究系統(tǒng)從功能架構(gòu)上可劃分為數(shù)據(jù)服務(wù)、基礎(chǔ)工作、協(xié)同研究、決策支持和云軟件五大平臺(tái)?;A(chǔ)工作平臺(tái)是以油氣藏?cái)?shù)據(jù)鏈技術(shù)為基礎(chǔ)建立的系統(tǒng)底層框架,為各應(yīng)用場(chǎng)景的協(xié)同工作提供基礎(chǔ)環(huán)境;協(xié)同研究平臺(tái)面向科研人員,通過(guò)對(duì)不同業(yè)務(wù)崗位定制不同工作場(chǎng)景和工作內(nèi)容,為研究人員提供便捷的數(shù)據(jù)組織、共享和知識(shí)應(yīng)用平臺(tái);決策支持平臺(tái)面向技術(shù)主管和普通技術(shù)人員,為一體化技術(shù)交流及方案決策提供環(huán)境,并實(shí)現(xiàn)遠(yuǎn)程異地協(xié)同決策;云軟件平臺(tái)基于虛擬存儲(chǔ)技術(shù)將勘探開發(fā)主流軟件統(tǒng)一部署在云中心服務(wù)器,實(shí)現(xiàn)專業(yè)軟件接口統(tǒng)一升級(jí)、許可動(dòng)態(tài)調(diào)度和集中維護(hù)管理。目前,基礎(chǔ)工作平臺(tái)、研究工作平臺(tái)(29個(gè)研究主題)和決策支持平臺(tái)(16個(gè)決策主題)已基本開發(fā)完成,在勘探開發(fā)研究院、油氣工藝研究院、采油(氣)廠已推廣運(yùn)行。圖1展示了數(shù)字化油氣藏研究與決策支持系統(tǒng)功能模塊的細(xì)分情況。

二、數(shù)字化油氣藏的數(shù)據(jù)挖掘技術(shù)

長(zhǎng)慶油田建設(shè)的數(shù)字化油氣藏研究與決策支持系統(tǒng),為油田生產(chǎn)的勘探部署、產(chǎn)能建設(shè)等決策提供輔助。在決策支持系統(tǒng)的建設(shè)中采用了數(shù)據(jù)挖掘技術(shù),在數(shù)據(jù)分類的過(guò)程中使用了神經(jīng)網(wǎng)絡(luò)技術(shù),在數(shù)據(jù)關(guān)聯(lián)過(guò)程中使用了決策樹方法,在預(yù)測(cè)過(guò)程中使用了回歸分析和貝葉斯網(wǎng)絡(luò)。由勘探井的數(shù)據(jù)結(jié)合模型庫(kù)系統(tǒng)和數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),為井位部署、產(chǎn)能預(yù)測(cè)、生產(chǎn)方法等決策提供支持。在圖2的結(jié)構(gòu)中有一個(gè)模型庫(kù)系統(tǒng),它由模型庫(kù)、方法庫(kù)、數(shù)據(jù)庫(kù)、格式庫(kù)、衍生數(shù)據(jù)庫(kù)及其管理系統(tǒng)組成。該系統(tǒng)可被抽象為六元結(jié)構(gòu),即S={ModelD,methodD,F(xiàn)ormD,ParaD,D,DeriveD}。其中,ModelD={model1,model2,…,modeln},它是模型庫(kù),用于集成各種模型。模型庫(kù)為整個(gè)系統(tǒng)提供支撐。它有包含模型庫(kù)管理子系統(tǒng)(MDBMS)對(duì)模型庫(kù)進(jìn)行統(tǒng)一的管理,具有對(duì)模型定義、建立、存儲(chǔ)、查詢等功能。模型庫(kù)是系統(tǒng)的核心結(jié)構(gòu)。用于油氣藏研究的各種數(shù)據(jù)庫(kù)在模型庫(kù)中統(tǒng)一管理、調(diào)用;MethodD={method1,method2,…,methodn},它是方法庫(kù),集成各模型計(jì)算的參數(shù)獲取方法。方法庫(kù)系統(tǒng)為系統(tǒng)提供算法模型支撐,它包含方法庫(kù)管理子系統(tǒng)(ADBMS)對(duì)方法庫(kù)進(jìn)行統(tǒng)一的管理;FormD為數(shù)據(jù)格式庫(kù),定義了每個(gè)數(shù)據(jù)的數(shù)據(jù)類型,數(shù)據(jù)格式;ParaD為參數(shù)庫(kù),用于存放各種油氣藏分析程序運(yùn)轉(zhuǎn)的各種參數(shù);D為數(shù)據(jù)庫(kù),用于存放計(jì)算數(shù)學(xué)模型所需的各種數(shù)據(jù);DevriveD為衍生數(shù)據(jù)庫(kù),存放油氣藏研究過(guò)程中產(chǎn)生的新數(shù)據(jù)。

三、油氣藏?cái)?shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)

1.建立數(shù)據(jù)倉(cāng)庫(kù)建立數(shù)據(jù)倉(cāng)庫(kù)是實(shí)現(xiàn)數(shù)據(jù)挖掘的基礎(chǔ)。本系統(tǒng)中使用的是原型法,快速的實(shí)現(xiàn)數(shù)據(jù)倉(cāng),并根據(jù)反饋信息修改油氣藏決策步驟中不合理的需求分析和主題情況,為后面的決策工作提供技術(shù)基礎(chǔ)和經(jīng)驗(yàn)積累。本系統(tǒng)主題是油田勘探井位布置位置、測(cè)井實(shí)時(shí)數(shù)據(jù)、產(chǎn)能分析、儲(chǔ)量管理等主題。在對(duì)油氣藏決策系統(tǒng)進(jìn)行分析之后,根據(jù)油氣藏決策系統(tǒng)中包含的油氣藏?cái)?shù)據(jù)、決策內(nèi)容進(jìn)行邏輯分類。針對(duì)各個(gè)的分析主題,在油氣藏?cái)?shù)據(jù)倉(cāng)庫(kù)中建立關(guān)系表,用來(lái)描述與決策結(jié)果相關(guān)的各種信息,關(guān)系表主要從油氣藏系統(tǒng)數(shù)據(jù)庫(kù)中的流程表中提取數(shù)據(jù),包括地質(zhì)圖、地理圖、地震數(shù)據(jù)等。在數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)過(guò)程中,對(duì)油田的盆地、各級(jí)構(gòu)造、圈閉、地震工區(qū)、勘探沉積相、各級(jí)儲(chǔ)量區(qū)塊、油田各類開發(fā)生產(chǎn)單元、井等勘探開發(fā)圖形對(duì)象的轉(zhuǎn)換、加載入庫(kù),建立完成地質(zhì)信息庫(kù)。2.油氣藏研究工作數(shù)據(jù)抽象和總結(jié)技術(shù)數(shù)據(jù)總結(jié)的最終結(jié)果是對(duì)油氣藏研究數(shù)據(jù)進(jìn)行抽象模型化,給出油氣藏研究決策工作流程的總體綜合描述。通過(guò)對(duì)油氣藏?cái)?shù)據(jù)的歸納抽象,數(shù)據(jù)挖掘方法能夠?qū)?shù)據(jù)庫(kù)中的所有數(shù)據(jù)從較低的個(gè)體層次抽象總結(jié)到較高的總體層次上,從而實(shí)現(xiàn)對(duì)原始基本數(shù)據(jù)的總體把握。在本系統(tǒng)中使用的數(shù)據(jù)總結(jié)方法是目前最為成熟的數(shù)學(xué)方法,也就是利用數(shù)學(xué)方法計(jì)算出數(shù)據(jù)庫(kù)的各個(gè)數(shù)據(jù)項(xiàng)的統(tǒng)計(jì)學(xué)特征,如總和、方差、最大值、平均、最小值等;或者通過(guò)利用數(shù)學(xué)中的統(tǒng)計(jì)圖形工具,對(duì)數(shù)據(jù)制作統(tǒng)計(jì)圖形,如直方圖、餅狀圖等。長(zhǎng)慶油田的數(shù)字化油氣藏研究系統(tǒng)中利用了OLAP技術(shù)實(shí)現(xiàn)對(duì)油田井位的地質(zhì)圖、地理圖、地震數(shù)據(jù)的多維查詢,分析了多種數(shù)據(jù)的統(tǒng)計(jì)特征,同時(shí)用多個(gè)統(tǒng)計(jì)圖形描述了數(shù)據(jù)間的聯(lián)系。最后對(duì)多個(gè)數(shù)據(jù)進(jìn)行歸納,提取統(tǒng)計(jì)信息。3.?dāng)?shù)據(jù)分類數(shù)據(jù)挖掘中的分類是建立需要的分類函數(shù)或分類模型。通過(guò)這個(gè)分類模型可以將數(shù)據(jù)劃分到不同的組中。它的實(shí)現(xiàn)步驟一般是:首先分析工作數(shù)據(jù)的各種特征,并找出或者建立出工作數(shù)據(jù)的屬性模型,確定數(shù)據(jù)的歸屬組別,然后利用這些模型來(lái)分析工作數(shù)據(jù),最后預(yù)測(cè)后面的工作數(shù)據(jù)可能會(huì)屬的分組。分類應(yīng)用的實(shí)例很多,本系統(tǒng)的采油井中,將油田井位出油量分為好、一般和較差三種類型,以此分析這三種類型井位的各種屬性,特別是位置、地質(zhì)等屬性,并決定它們分類的關(guān)鍵屬性及相互間關(guān)系。此后就可以根據(jù)這些關(guān)鍵屬性對(duì)每一個(gè)預(yù)期的井位進(jìn)行分析,以便決定預(yù)期井位屬于哪一種類型。4.關(guān)聯(lián)分析原始數(shù)據(jù)庫(kù)中各個(gè)工作數(shù)據(jù)都存在相互關(guān)聯(lián)、相互影響的聯(lián)系。兩個(gè)或多個(gè)工作數(shù)據(jù)的取值之間存在某種邏輯聯(lián)系。這種關(guān)聯(lián)關(guān)系主要有簡(jiǎn)單關(guān)聯(lián)和時(shí)間關(guān)聯(lián)兩種。比如油田井位中的地質(zhì)環(huán)境、地震數(shù)據(jù)和出油量存在關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出工作數(shù)據(jù)中隱藏的關(guān)聯(lián)網(wǎng),描述眾多數(shù)據(jù)項(xiàng)目的密切度或關(guān)聯(lián)關(guān)系。由于事先往往并不知道工作數(shù)據(jù)的關(guān)聯(lián)是否存在,或者是否可以用精確的關(guān)聯(lián)函數(shù)描述。因此,關(guān)聯(lián)分析生成的規(guī)則通常都帶有置信度,置信度級(jí)別描述了關(guān)聯(lián)規(guī)則的強(qiáng)度。5.聚類與分析油藏工作數(shù)據(jù)往往缺少比較詳細(xì)的描述信息,甚至是無(wú)法組織成任何分類模式時(shí),通??梢圆捎镁垲惙治觥Mㄟ^(guò)聚類分析,按照約定的相近程度度量方法或者其他的標(biāo)準(zhǔn),將工作數(shù)據(jù)分成許多有意義的子集合;每一個(gè)集合中的數(shù)據(jù)特征相近甚至相同,不同數(shù)據(jù)集合之間的數(shù)據(jù)性質(zhì)差異較大,容易區(qū)分。長(zhǎng)慶油田的數(shù)字化油氣藏研究在實(shí)現(xiàn)過(guò)程中,使用了Fayyad過(guò)程模型,如圖3所示。在數(shù)據(jù)挖掘的過(guò)程中,系統(tǒng)執(zhí)行一個(gè)循環(huán)迭代過(guò)程。在每一步的執(zhí)行中,從油田的盆地、各級(jí)構(gòu)造、圈閉、地震工區(qū)、勘探沉積相、各級(jí)儲(chǔ)量區(qū)塊、油田各類開發(fā)生產(chǎn)單元等數(shù)據(jù)中,分析出勘探井位的位置信息,如果發(fā)現(xiàn)某個(gè)階段產(chǎn)生的結(jié)果和預(yù)想的內(nèi)容有出入。則重復(fù)前面階段步驟。

四、結(jié)束語(yǔ)

長(zhǎng)慶油田針對(duì)油氣藏研究數(shù)據(jù)量大、信息隱晦的技術(shù)現(xiàn)狀,建立了油氣藏研究與決策支持系統(tǒng)[7-10],并在其中開發(fā)和應(yīng)用了系列數(shù)據(jù)挖掘技術(shù),取得了較大進(jìn)展:(1)與眾多學(xué)科及技術(shù)相融合,形成了包括人工智能、統(tǒng)計(jì)學(xué)、數(shù)據(jù)倉(cāng)庫(kù)、在線分析處理、專家系統(tǒng)、數(shù)據(jù)可視化、高性能計(jì)算等數(shù)據(jù)挖掘技術(shù),將原始數(shù)據(jù)庫(kù)轉(zhuǎn)化為有用的研究知識(shí),為油氣藏決策了有力支持。(2)海量數(shù)據(jù)及其挖掘技術(shù)的開發(fā)為油氣藏研究與決策支持系統(tǒng)的高效應(yīng)用打下了基礎(chǔ),極大地提高了油氣藏的研究與決策水平,為長(zhǎng)慶油田快速發(fā)展提供了強(qiáng)有力的技術(shù)支持。

參考文獻(xiàn)

[1]郭萌,王玨.?dāng)?shù)據(jù)挖掘與數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn):綜述[J].模式識(shí)別與人工智能,1998,11(03):292-299.

[2]胡侃,夏紹瑋.基于大型數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)采掘:研究綜述[J].軟件學(xué)報(bào),1998(01):54-64.

[3]GrossmanR,KasifS,MooreR,etal.Dataminingresearch:Op-portunitiesandchallenges[C].AreportofthreeNSFworkshopsonmininglarge,massive,anddistributeddata,1999.

[4]DeogunJS,RaghavanVV,SarkarA,etal.Datamining:Re-searchtrends,challenges,andapplications[J].RoughsSetsandDataMining:AnalysisofImpreciseData,1997:9-45.

[5]王宏琳.油氣勘探計(jì)算機(jī)軟件:平臺(tái)•體系結(jié)構(gòu)•框架[J].石油工業(yè)計(jì)算機(jī)應(yīng)用,2004(02):3-8.

[6](美)HohmannL著.藍(lán)莉,曾永和譯.超越軟件架構(gòu)創(chuàng)建和維護(hù)優(yōu)秀解決方案[M].北京:中國(guó)電力出版社,2005.

[7]石玉江.?dāng)?shù)字油田中的勘探井位快速部署技術(shù)[J].石油工業(yè)計(jì)算機(jī)應(yīng)用,2016(12):11-16.

[8]王娟.?dāng)?shù)字油氣藏?cái)?shù)據(jù)中心建設(shè)的關(guān)鍵技術(shù)[J].石油工業(yè)計(jì)算機(jī)應(yīng)用,2016(1):16-18.

[9]付金華,石玉江,王娟,等.長(zhǎng)慶油田勘探開發(fā)服務(wù)型共享數(shù)據(jù)中心構(gòu)建研究[J].中國(guó)石油勘探,2017,22(6):1-8.

[10]王娟,姚衛(wèi)華,石玉江,等.基于云架構(gòu)的油氣藏?cái)?shù)據(jù)智能管理技術(shù)[J].天然氣工業(yè),2014,34(3):137-141.

作者:王娟 梁立星 武璠 孫亞莉 孫學(xué)萌 單位:中國(guó)石油長(zhǎng)慶油田分公司勘探開發(fā)研究院 中國(guó)石油長(zhǎng)慶油田分公司油氣工藝研究院 中石油川慶鉆探工程有限公司鉆采工程技術(shù)研究院長(zhǎng)慶分院