前言:想要寫出一篇引人入勝的文章?我們特意為您整理了知識服務下的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:隨著技術的發(fā)展,海量地質資料數(shù)字資源中蘊含的地學知識與日俱增,地質資料知識服務的時代來臨。傳統(tǒng)的地學數(shù)據(jù)庫產(chǎn)品的開發(fā)模式難以滿足用戶的需求,地學數(shù)據(jù)庫產(chǎn)品的開發(fā)向以知識服務核心,利用地質資料開發(fā)數(shù)據(jù)庫產(chǎn)品的模式升級轉型。本文分析了基于知識服務的地學數(shù)據(jù)庫產(chǎn)品開發(fā)的理念與模式,提出了基于知識服務的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式,列舉了開發(fā)應用實例,從多個角度對利用地質資料知識服務開發(fā)地學數(shù)據(jù)庫產(chǎn)品提出了建議。
關鍵詞:知識服務;地質資料;地學數(shù)據(jù)庫;產(chǎn)品開發(fā)
地質資料的本質屬性是提供社會化服務,為國家重大工程、基礎設施規(guī)劃與建設和地質調查工作等提供精準化的地質信息產(chǎn)品服務[1]。近些年,社會各界對地學數(shù)據(jù)庫產(chǎn)品的需求持續(xù)上漲,傳統(tǒng)以項目建設地學數(shù)據(jù)庫的方式很難滿足社會發(fā)展的需求,利用地質資料數(shù)字資源,從中挖掘出地學知識匯聚并形成數(shù)據(jù)庫產(chǎn)品成為現(xiàn)今地質資料精準化服務的研究熱點之一。地質資料作為一種專業(yè)類科技檔案,同時也是地學知識的集合體,其中蘊含著海量的地學知識信息,易于開展地質資料的深入分析和知識的提煉聚合,具有利用知識服務開展地學知識匯聚并建庫的良好基礎[2]。本研究基于地質資料數(shù)字資源,以提升地質資料精準服務質量為目標,貫徹社會各界用戶對地學數(shù)據(jù)庫產(chǎn)品的切實需求,融入知識建庫核心過程,提出基于知識服務的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式及發(fā)展建議,帶動地學數(shù)據(jù)庫產(chǎn)品開發(fā)與建設的發(fā)展。
1基于知識服務的地學數(shù)據(jù)庫產(chǎn)品開發(fā)理念與意義
1.1理念
以往利用地質資料建設地學數(shù)據(jù)庫,往往是利用分散在各個地質資料中一件資料,提取并集成整合建設地學數(shù)據(jù)庫。例如國家地質圖數(shù)據(jù)庫,是從區(qū)域調查地質資料中提取出標準分幅的地質圖,集成整合并匯聚,形成國家地質圖數(shù)據(jù)庫。隨著大數(shù)據(jù)時代的來臨,提取出地質資料中蘊含的地學知識,開發(fā)利用并建設地學數(shù)據(jù)庫產(chǎn)品成為當今地質資料發(fā)展的重要方向。地質資料是地學知識的集合體,地學知識往往蘊含在各種地質報告、附圖、附表和附件中。目前,各級地質資料館藏機構管理的基本單位是“件”,而一件地質資料中蘊含的地學知識很難被用戶發(fā)現(xiàn)并利用[3],而用戶需求的往往是地質資料中蘊含的這些地學知識。將海量地質資料作為數(shù)據(jù)源,從中提取相關地學知識,集成整合后匯聚形成地學數(shù)據(jù)庫產(chǎn)品是當今地質資料重要的發(fā)展趨勢。
1.2意義
1)提升地質資料開發(fā)利用價值。地質資料具有深度的開發(fā)利用價值,目前有大量利用地質資料深層開發(fā)找礦的成功案例[4-6]。從地質資料中提取地學知識,形成地學數(shù)據(jù)庫產(chǎn)品是對地質資料的深層開發(fā)利用,可以提升地質資料開發(fā)利用價值。2)提升地質資料精準服務水平。地質資料的本質屬性是服務利用,而大量用戶的需求是賦存在地質資料中的地學知識。從地質資料中挖掘地學知識并建庫,是地質資料產(chǎn)品開發(fā)的新形式,有助于提升地質資料精準服務的水平。3)有助于數(shù)據(jù)庫持續(xù)更新維護。傳統(tǒng)的地學數(shù)據(jù)庫建設工作需要以項目的形式,項目結束后,不再有經(jīng)費的支持下,地學數(shù)據(jù)庫的更新維護面臨極大的挑戰(zhàn)。而地質資料具有持續(xù)匯交性,每年均有大量的地質資料匯交至館藏機構,以全國地質資料館為例,每年要接收地質資料近5000檔,30萬件。這些新匯交的地質資料是地學數(shù)據(jù)庫的重要更新數(shù)據(jù)源,因此利用地質資料建設地學數(shù)據(jù)庫產(chǎn)品,有助于對地學數(shù)據(jù)庫的持續(xù)更新與維護。4)縮短建庫時間,節(jié)約建庫成本。以往項目建設地學數(shù)據(jù)庫的形式,投入大量的人力、物力和財力,匯集形成地學數(shù)據(jù)庫。隨著信息技術的發(fā)展,大量的地學數(shù)據(jù)庫所需地學知識蘊含在地質資料中,通過技術手段提取地學知識,集成整合后匯聚并建庫,將大大縮短地學數(shù)據(jù)庫產(chǎn)品建設時間,節(jié)約建庫成本。
2基于知識服務的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式
2.1地學數(shù)據(jù)庫產(chǎn)品開發(fā)策略
1)以需求為導向的地學數(shù)據(jù)庫產(chǎn)品構建。地學數(shù)據(jù)庫產(chǎn)品建設的目的是開展精準化的地學知識服務,提升地質資料深層開發(fā)利用價值。因此,地學數(shù)據(jù)庫產(chǎn)品開發(fā)時,需要結合社會各界用戶需求,針對用戶需求來設計地學數(shù)據(jù)庫產(chǎn)品。2)注重前期數(shù)據(jù)源摸底與數(shù)據(jù)庫試點建設工作。和地質資料一樣,地學數(shù)據(jù)庫涉及地質、水文、地球化學、地球物理等多個專業(yè),每個專業(yè)形成的地質報告具有不同的特點,其蘊含的地學知識也不盡相同,因此,地學數(shù)據(jù)庫產(chǎn)品研發(fā)前期需要對數(shù)據(jù)源進行詳細的摸底調研。經(jīng)過數(shù)據(jù)源摸底后需要開展數(shù)據(jù)庫試點建設工作,根據(jù)試點建設過程中遇到的問題,及時修正技術路線。3)擅用技術手段,提升數(shù)據(jù)庫建庫效率。地質資料具有海量性[7-8],海量的地質資料數(shù)字資源蘊含著極為豐富的地學知識,這也導致了地學數(shù)據(jù)庫建設的工作量巨大。擅用自動化手段,提升地學知識提取、匯聚等工作效率,是解決海量地學知識建庫的重要手段方法。
2.2地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式
1)知識來源。地學數(shù)據(jù)庫產(chǎn)品利用全國地質資料館館藏作為知識來源,其中包括有結構化地質資料數(shù)據(jù)、半結構化地質資料數(shù)據(jù)和非結構化地質資料數(shù)據(jù)。館藏地質資料包含有矢量化的數(shù)據(jù),柵格數(shù)據(jù)等,種類豐富,數(shù)據(jù)量大。地學數(shù)據(jù)庫產(chǎn)品開發(fā)前需要對知識來源做充分的數(shù)據(jù)調研,才能保障后續(xù)工作。2)技術要素。從地質資料數(shù)據(jù)中心利用技術要素建設地學數(shù)據(jù)庫產(chǎn)品,主要流程包括有知識提取、知識集成、知識匯聚、知識建庫、知識分析和知識獲取等,具體主要有智能提取、符號表示、規(guī)則抽取、統(tǒng)一編碼、數(shù)據(jù)可視化等相關技術(圖1)。3)領域應用。利用技術手段從地質資料數(shù)據(jù)中提取出地學知識并建庫,從而達到地學數(shù)據(jù)庫產(chǎn)品建設與服務的目的。地學數(shù)據(jù)庫服務領域廣泛,從國家重大工程規(guī)劃部署、基礎設施建設到礦產(chǎn)地質調查、水工環(huán)勘查等。
3開發(fā)實例
3.1全國礦產(chǎn)地數(shù)據(jù)庫
全國礦產(chǎn)地數(shù)據(jù)庫完成于2003年,在礦產(chǎn)資源規(guī)劃、管理、開發(fā)、評價工作中有著重要的意義[9-10],但卻多年未進行系統(tǒng)的數(shù)據(jù)更新維護,致使庫中礦產(chǎn)地數(shù)據(jù)現(xiàn)勢性不足。2018年起,全國地質資料館組織人員力量,從館藏涉及礦產(chǎn)資源地質資料中的報告、附件和附表中挖掘礦產(chǎn)地數(shù)據(jù),并經(jīng)過集成整合后匯聚進新的全國礦產(chǎn)地數(shù)據(jù)庫,形成了全國礦產(chǎn)地數(shù)據(jù)庫2019版。全國地質資料館作為國家級地質資料館藏機構,每年約接收5000檔(約30萬件)的地質資料匯交,其中60%左右是涉及礦產(chǎn)資源的地質資料,具有充足的礦產(chǎn)地數(shù)據(jù)更新數(shù)據(jù)源。全國礦產(chǎn)地數(shù)據(jù)庫利用地質資料中蘊含的礦產(chǎn)地知識聚合形成,不僅包含近些年新發(fā)現(xiàn)的礦產(chǎn)地數(shù)據(jù),還包括有已閉坑的礦產(chǎn)地數(shù)據(jù),數(shù)據(jù)全面。基于知識服務的全國礦產(chǎn)地數(shù)據(jù)庫的建設大大降低了建庫成本,提升了礦產(chǎn)地數(shù)據(jù)庫更新效率,全面提高礦產(chǎn)地數(shù)據(jù)的服務水平。
3.2全國礦床巖石地球化學數(shù)據(jù)庫
經(jīng)過幾十年的地質工作,對全國礦床巖石積累了大量的巖石地球化學數(shù)據(jù),包括有巖石常量元素、微量元素和稀土元素數(shù)據(jù)等。目前,這些數(shù)據(jù)分散在地質資料成果報告、附件、附表和原始地質資料中,其數(shù)據(jù)量與日俱增,對這些數(shù)據(jù)進行提取、集成整合并建設全國礦床巖石地球化學數(shù)據(jù)庫,可提升我國科研人員對礦床巖石進行系統(tǒng)研究,是一項十分重要的基礎地質工作。以往,每個項目組進行礦床學研究時均會采集大量的礦床巖石樣品進行測試分析,所獲得的巖石地球化學數(shù)據(jù)會以知識形式賦存于地質成果報告、附表、附件中。近些年,隨著原始地質資料的匯交,越來越多的礦床巖石地球化學數(shù)據(jù)匯交至全國地質資料館,為全國礦床巖石地球化學數(shù)據(jù)庫的建設奠定數(shù)據(jù)基礎。全國礦產(chǎn)地數(shù)據(jù)庫和全國礦床巖石地球化學數(shù)據(jù)庫的建設是基于知識服務的地學數(shù)據(jù)庫產(chǎn)品開發(fā)的典范,不僅節(jié)約了地學數(shù)據(jù)庫建庫成本,縮短了建庫時間,提升了數(shù)據(jù)更新維護效率,還為其他地學數(shù)據(jù)庫的建設提供了思路和方法。
4建議
4.1強化用戶需求調研,提升地質資料精準化服務
傳統(tǒng)的地學數(shù)據(jù)庫建庫方式以項目為單位,往往是“自建自用”或“自建他用”的服務形式。利用地質資料開發(fā)地學數(shù)據(jù)庫產(chǎn)品則是館藏機構負責建設,用戶使用的方式。因此只有不斷強化用戶的需求調研,才能更加精準的了解用戶需求,設計出適用用戶需求的地學數(shù)據(jù)庫產(chǎn)品。
4.2建立開放式建庫與維護的新機制
在強化用戶需求調研的基礎上,建議開展和用戶聯(lián)合建庫與維護的地學數(shù)據(jù)庫建設新機制,不僅可以更加精準的根據(jù)用戶需求開發(fā)產(chǎn)品,還可以以用戶專業(yè)的角度更加完善產(chǎn)品建設。
4.3豐富地學數(shù)據(jù)庫產(chǎn)品體系
加緊基于地質資料的地學數(shù)據(jù)庫產(chǎn)品規(guī)劃設計,拓寬地學數(shù)據(jù)庫產(chǎn)品范圍是地質資料服務所必經(jīng)之路。傳統(tǒng)方式建設的地學數(shù)據(jù)庫產(chǎn)品更新速度已很難滿足現(xiàn)代社會對地學數(shù)據(jù)庫產(chǎn)品的需求,豐富地學數(shù)據(jù)庫產(chǎn)品體系,加強地學數(shù)據(jù)庫產(chǎn)品的研發(fā)是地質資料需求者共同的夙愿。增加地學數(shù)據(jù)庫產(chǎn)品建設能力,完善地學數(shù)據(jù)庫產(chǎn)品體系,努力提升我國地質資料深層開發(fā)利用的水平。
4.4加強數(shù)據(jù)庫建庫技術研究,提升地學數(shù)據(jù)庫之間的關聯(lián)性
地學數(shù)據(jù)之間的關聯(lián)性很強,例如礦產(chǎn)地質調查工作,對以往地質調查、已有礦產(chǎn)地信息、測試分析數(shù)據(jù)、區(qū)域地質圖件等等具有很強的需求性。將這些地學數(shù)據(jù),甚至地學數(shù)據(jù)庫相關聯(lián),利用先進的數(shù)據(jù)庫建庫技術,將這些數(shù)據(jù)(庫)相關聯(lián),是地學數(shù)據(jù)庫更新?lián)Q代的發(fā)展趨勢。將關聯(lián)數(shù)據(jù)、知識圖譜和數(shù)據(jù)倉庫等數(shù)據(jù)庫建庫技術融入進地學數(shù)據(jù)庫產(chǎn)品建設中,提升地學數(shù)據(jù)庫間的關聯(lián)關系,是下一代地學數(shù)據(jù)庫的發(fā)展趨勢。
5結語
隨著技術的發(fā)展,地質資料開發(fā)利用面臨重大變革。面對海量地質資料數(shù)字資源,通過對數(shù)據(jù)的摸底調研,基于用戶需求,利用地質資料知識挖掘對結構化、半結構化和非結構化的地質資料數(shù)據(jù)進行知識挖掘、提取、集成、整合并匯聚建庫,可以有效推動地學數(shù)據(jù)庫的建設,縮短建庫周期,提升數(shù)據(jù)更新維護效率,提供更加高效的地學數(shù)據(jù)庫產(chǎn)品服務。知識服務時代的來臨,地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式轉型勢在必行,提高地學數(shù)據(jù)庫產(chǎn)品的建設效率與數(shù)據(jù)的現(xiàn)勢性,針對用戶需求實現(xiàn)知識化管理與建庫,成為新時期地質資料開發(fā)利用重要的發(fā)展趨勢。
作者:齊釩宇 李曉蕾 孔昭煜 閻海飛 張仲 單位:中國地質調查局發(fā)展研究中心