前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的信息分類標(biāo)準(zhǔn)主題范文,僅供參考,歡迎閱讀并收藏。
眾所周知,新品牌要在競爭激烈的市場中迅速崛起,快速實現(xiàn)從“0”到“1”的轉(zhuǎn)變,在原有產(chǎn)品基礎(chǔ)上尋找到合適的新品類是一個非常有效的策略。那么,一個有效的新品類至少應(yīng)該滿足哪些標(biāo)準(zhǔn)呢?遠(yuǎn)卓機(jī)構(gòu)認(rèn)為,成功開創(chuàng)的新品類至少要滿足五個標(biāo)準(zhǔn):站得穩(wěn),展得開,收得攏,伸得遠(yuǎn),傳得快。
其一,站得穩(wěn)。新品類不僅要有產(chǎn)品質(zhì)量做根基,而且要能夠找到其潛在的消費(fèi)者需求基礎(chǔ)。滿足這兩個條件后,新品類仍然要有渠道基礎(chǔ),唯有如此,新品類才可能在市場上站得穩(wěn)。例如,我們在服務(wù)潮峰鋼構(gòu)集團(tuán)時,開創(chuàng)了精品鋼構(gòu)這一新品類,滿足了大量客戶對于鋼結(jié)構(gòu)建筑質(zhì)量的高要求,有效推動了該品牌在全國范圍內(nèi)的迅速崛起,品牌知名度和美譽(yù)度火線飆升,很快位居行業(yè)前列。
其二,展得開。新品類必須有足夠的支點來支撐,通俗地說就是,圍繞新品類要能展得開,為新品類找到形式新穎、內(nèi)容相異、主題鮮明的支點。例如,山葉電動車根據(jù)社會現(xiàn)狀和發(fā)展趨勢、行業(yè)現(xiàn)狀和發(fā)展趨勢、企業(yè)現(xiàn)狀和發(fā)展趨勢以及消費(fèi)者需求現(xiàn)狀和發(fā)展趨勢,提出人文電動車這一新品類,然后圍繞人文電動車這一新品類,在處理經(jīng)銷商關(guān)系時大膽創(chuàng)新,將經(jīng)銷商全部視為“事業(yè)元素”,獲得了經(jīng)銷商的大力支持,影響了整個電動車行業(yè)。此外,山葉針對大量電動車由于廠家倒閉而維修難的現(xiàn)狀,全力展開“領(lǐng)養(yǎng)電動車孤兒”活動,掀起震驚行業(yè)的電動車“收孤風(fēng)暴”,感動了無數(shù)電動車用戶。實際上,山葉這些活動都是“人文電動車”這一新品類的有效拓展,直接向社會展示了人文電動車的具體內(nèi)涵。
其三,收得攏。新品類的命名必須具有“高度”和“廣度”,換句話說就是能夠“海納百川”,或者說是“一覽眾山小”,能夠?qū)⑵放莆磥戆l(fā)展過程中的各種有利資源聚集“麾下”,形成一股合力,有效推動品牌的良性發(fā)展。
【摘要題】信息資源建設(shè)與管理
【關(guān)鍵詞】網(wǎng)絡(luò)信息分類法/網(wǎng)絡(luò)信息組織/分類法構(gòu)建
【正文】
根據(jù)網(wǎng)絡(luò)信息和用戶檢索需求的特點,依據(jù)網(wǎng)絡(luò)環(huán)境構(gòu)建科學(xué)、實用的網(wǎng)絡(luò)信息分類法,是信息資源組織管理研究的重點之一。本文主要以1999年—2005年的中國學(xué)術(shù)期刊網(wǎng)數(shù)據(jù)為信息源,從構(gòu)建方法、原則、語言、大綱、信息技術(shù)應(yīng)用等6個方面回顧了近年來網(wǎng)絡(luò)信息分類法構(gòu)建的研究進(jìn)展。
1構(gòu)建網(wǎng)絡(luò)信息分類法的依據(jù)或方法
目前,網(wǎng)絡(luò)信息分類法主要是指網(wǎng)絡(luò)搜索引擎分類體系?;凇胺诸惞ぞ咄ǔJ歉鶕?jù)分類對象的特點和用戶需求,結(jié)合一定的技術(shù)環(huán)境建立的”認(rèn)識,馬張華在《分類搜索引擎類目體系研究》一文中論述了分類搜索引擎類目結(jié)構(gòu)的編制依據(jù):(1)從分類對象來看,網(wǎng)絡(luò)資源的特點是數(shù)量、種類多,動態(tài)性強(qiáng),新興科學(xué)、商業(yè)、娛樂的資源數(shù)量較多,傳統(tǒng)知識門類的資源相對較少,要求有新的、適合處理對象的分類架構(gòu)。(2)從用戶需求來看,網(wǎng)絡(luò)的使用對象涉及所有的終端用戶。(3)從技術(shù)環(huán)境來看,網(wǎng)絡(luò)信息分類體系應(yīng)充分利用計算機(jī)操作環(huán)境與超文本技術(shù),在體系構(gòu)建、類目設(shè)置等方面發(fā)展不同于傳統(tǒng)分類法的技術(shù)特色。[1]
陳樹年提出建構(gòu)網(wǎng)上知識分類體系的(基本結(jié)構(gòu))編制方法,即:①有一個涵蓋各知識領(lǐng)域、結(jié)構(gòu)清晰、層次簡明、能滿足網(wǎng)上信息組織需要的分類體系;②采用等級結(jié)構(gòu)展示知識的系統(tǒng)聯(lián)系,構(gòu)成枝干分明的主題樹或脈絡(luò)清晰的知識地圖;③類目的排列和檢索結(jié)果的排列方法應(yīng)采用對用戶最有用的排列次序;④分類體系的標(biāo)記應(yīng)適當(dāng)保留。[2]石曉華等在分析了網(wǎng)絡(luò)信息分類法與傳統(tǒng)分類法的優(yōu)劣之后,首次提出了建構(gòu)《中國網(wǎng)絡(luò)信息分類法》的建議,并列舉了具體的編制方法,即:①以傳統(tǒng)分類主題體系為基礎(chǔ),建構(gòu)多維的分類體系;②欄目因需而設(shè),突出重點;③控制分級,減少欄目層次;④根據(jù)用戶確定欄目名稱的規(guī)范程度。[3]張琪玉則提出了一整套設(shè)計方針,即:①為不同類型的需求提供不同特性的分類體系;②在統(tǒng)一框架下設(shè)置分散獨(dú)立、各自完整的分類體系;③分類體系的類目設(shè)置不以網(wǎng)羅全部網(wǎng)絡(luò)信息資源為目標(biāo);④分類體系應(yīng)具有開放性和可變性,并應(yīng)有反映新穎信息的措施。他也設(shè)計了一個供普通用戶使用的分類體系框架。[4]王知津贊同石曉華的第①、②、③建議,認(rèn)為可以借鑒傳統(tǒng)分類體系,構(gòu)建《網(wǎng)絡(luò)信息分類法》,實現(xiàn)網(wǎng)絡(luò)信息分類法與主題詞表的結(jié)合,即分類主題一體化。實現(xiàn)分類主題一體化,需要做好三個方面的工作:①建立一個結(jié)構(gòu)簡明的知識分類體系,通過對信息資源的系統(tǒng)分類,實現(xiàn)對網(wǎng)絡(luò)信息的宏觀控制;②建立一個智能化的控制詞表,實現(xiàn)作者語言與用戶檢索語言的控制和轉(zhuǎn)換;③建立分類體系與控制詞表的系統(tǒng)聯(lián)系,即將標(biāo)引語言納入分類體系,這樣既可以用自然語言直接檢索,也可以在任何類下進(jìn)行語詞檢索,從而較好實現(xiàn)分類與主題的兼容。[5]董琳提出的思路是設(shè)計一個融知識分類、行業(yè)分類、網(wǎng)站信息分類于一體的綜合性中文網(wǎng)站分類體系。[6]該體系把一級大類分為5大模塊:較豐富信息的模塊、高查詢率模塊、學(xué)科專業(yè)模塊、查詢?nèi)肟谀K、綜合網(wǎng)站模塊。常設(shè)20個一級類目,把主題作為主要聚類標(biāo)準(zhǔn),學(xué)科和專業(yè)作為輔助聚類標(biāo)準(zhǔn)。
另外,陸寶益提出編制的具體步驟,即建立專門機(jī)構(gòu),配備專業(yè)人員;開展深入調(diào)研,制定可行計劃;廣泛征求意見,不斷修改完善。[7]其他學(xué)者,如陳代春、趙培云、劉穎、許磊等也從不同角度論述了如何構(gòu)建統(tǒng)一的網(wǎng)絡(luò)信息分類法的問題。
2網(wǎng)絡(luò)信息分類法構(gòu)建的原則
構(gòu)建新的網(wǎng)絡(luò)信息分類體系,需要吸收現(xiàn)有搜索引擎分類體系優(yōu)勢,借鑒傳統(tǒng)分類法的部分長處,并遵循基本的設(shè)計指導(dǎo)原則。有的學(xué)者[8]認(rèn)為,強(qiáng)調(diào)類表的科學(xué)性和專業(yè)性,而忽略了最終用戶——信息需求者的利益,是傳統(tǒng)文獻(xiàn)分類法無法適應(yīng)網(wǎng)絡(luò)信息分類的基本原因之一,所以建立中文網(wǎng)絡(luò)信息分類體系應(yīng)以實用性為主。持相同觀點的學(xué)者,如,史學(xué)斌提出“實用性、自然性、系統(tǒng)性和技術(shù)性、針對性”原則[9]。鄭慶勝指出“實用性、全面性、規(guī)律性、統(tǒng)一性和特殊性”原則[10]等。
持相反觀點的學(xué)者認(rèn)為,首要的原則是科學(xué)性原則。吳丹認(rèn)為,與傳統(tǒng)分類法一樣,網(wǎng)絡(luò)信息分類也必須具備科學(xué)性原則,分類體系仍必須以科學(xué)的知識分類為基礎(chǔ),即科學(xué)性原則、易用性原則、針對性原則、動態(tài)性原則[11]。其他學(xué)者,如陸寶益提出“科學(xué)性、自然性、實用性、同一性、通用性、兼容性、發(fā)展性”原則[12]、朱蓓玲提出“科學(xué)性、實用性、易用性、自然性、針對性、快捷性、系統(tǒng)技術(shù)性”原則[13]。敬卿、吳靜提出的“科學(xué)性、實用性、易用性、自然性、通用性”原則[14]。鄧香蓮提出的“科學(xué)性、簡潔性、直接性、實用性、動態(tài)性、自然性”原則[15]也應(yīng)歸屬此類。
關(guān)于網(wǎng)絡(luò)信息分類體系的原則,研究者智者見智,較多學(xué)者都提到了應(yīng)遵循“科學(xué)性、實用性、自然性”原則。主要分歧是強(qiáng)調(diào)科學(xué)性優(yōu)先還是實用性優(yōu)先。筆者認(rèn)為,網(wǎng)絡(luò)信息分類法要適應(yīng)組織網(wǎng)絡(luò)信息動態(tài)變化的需要,滿足用戶復(fù)雜的信息查詢需求,對于綜合性、大眾性的中文網(wǎng)絡(luò)信息分類體系,必須以實用性原則為主,兼顧科學(xué)性的原則。
3網(wǎng)絡(luò)信息分類法構(gòu)建的語言
從實踐來看,傳統(tǒng)的文獻(xiàn)分類法使用的是典型的人工語言,而網(wǎng)絡(luò)信息分類法使用的主要是自然語言。因為人工語言嚴(yán)格的規(guī)范性使用戶喪失了檢索中的自主性和能動性,背離了以人為本的原則,自然語言是檢索語言發(fā)展的必然。[16]張琪玉教授則指出由于自然語言有其固有的缺陷,網(wǎng)絡(luò)信息檢索不可能僅僅使用自然語言,也必須使用人工語言。情報檢索用語發(fā)展的大趨勢,是情報檢索語言的自然語言化和自然語言的情報檢索語言化,是兩者的初級結(jié)合到完全融合的過程。[17]所以有的學(xué)者認(rèn)為需要對網(wǎng)絡(luò)受控語言進(jìn)行適合于網(wǎng)民大眾習(xí)慣用語的改造,提出了“受控語言網(wǎng)民化”的思想。[18]陳晶也指出:“改進(jìn)受控語言的易用化是網(wǎng)絡(luò)環(huán)境下的大勢所趨,而對自然語言進(jìn)行必要的控制也是網(wǎng)絡(luò)環(huán)境下勢在必行的,兩者的相互滲透、有機(jī)結(jié)合是情報檢索語言發(fā)展的大趨勢?!盵19]
有的學(xué)者認(rèn)為分類主題一體化語言,實質(zhì)是受控語言內(nèi)部的一體化,它不能適應(yīng)網(wǎng)絡(luò)檢索的發(fā)展,應(yīng)當(dāng)建立更適合于網(wǎng)絡(luò)信息檢索的自然語言與受控語言結(jié)合的一體化語言。[20]有的學(xué)者通過分析受控語言和自然語言各自在網(wǎng)絡(luò)中的應(yīng)用,分析其優(yōu)缺點,指出無論受控語言還是自然語言都有各自獨(dú)特的優(yōu)點和缺陷,不能彼此取代,可以相互補(bǔ)充。而“它們在網(wǎng)絡(luò)中的應(yīng)用研究也表明兩者之間呈現(xiàn)出明顯的相互交織兼容的趨勢”。[21]
筆者認(rèn)為,任何一種語言都有長處和短處,都不能完全滿足網(wǎng)絡(luò)用戶多樣化需求,分類語言和主題語言相結(jié)合、自然語言和人工語言相結(jié)合才是建構(gòu)網(wǎng)絡(luò)信息分類法的發(fā)展趨勢。
4網(wǎng)絡(luò)信息分類法的大綱設(shè)計
對網(wǎng)絡(luò)信息分類法進(jìn)行深入研究并提出大綱或框架的代表作有文獻(xiàn)[22]、[23]、[24]。陳樹年闡述了構(gòu)建網(wǎng)上分類體系的原則與技術(shù)后,提出了一個適用于一般用戶的綜合性中文搜索引擎的信息分類大綱,該大綱包括22個大類,即哲學(xué)與宗教、人文與社會科學(xué)、社會文化、文學(xué)與藝術(shù)、教育與人才、體育與健身、休閑與生活娛樂、旅游與服務(wù)業(yè)、醫(yī)學(xué)與健康、經(jīng)濟(jì)與金融、政治、法律、軍事、歷史與地理、自然科學(xué)、農(nóng)業(yè)科學(xué)、工程技術(shù)、計算機(jī)與網(wǎng)絡(luò)、新聞與媒體、圖書館與參考資料、國家與地區(qū)、綜合網(wǎng)站。并指出以學(xué)術(shù)和技術(shù)為主的搜索引擎、專業(yè)搜索引擎最好以權(quán)威分類法(或其中的某些類)為基礎(chǔ),經(jīng)過一定的改造后用于網(wǎng)上信息的組織和檢索,因為其科學(xué)的體系和嚴(yán)密的結(jié)構(gòu)是非專業(yè)人員所不能獨(dú)立完成的。[22]吳丹采取學(xué)科分類與事物分類兼顧的方式,也設(shè)計了一個包含有18個大類和若干二級類目的網(wǎng)絡(luò)信息分類體系設(shè)計方案。18個大類,即政治法律與軍事、新聞與媒體、商業(yè)與經(jīng)濟(jì)、自然科學(xué)、農(nóng)業(yè)與工程技術(shù)、計算機(jī)與網(wǎng)絡(luò)、教育、哲學(xué)與宗教、人文社會科學(xué)、文化藝術(shù)、歷史與地理、國家與地區(qū)、旅游與交通、醫(yī)學(xué)與健康、生活服務(wù)、體育與健身、娛樂休閑、圖書館與參考資料。[23]許培揚(yáng)提出了中文網(wǎng)絡(luò)信息分類法應(yīng)由簡表、主表、索引和使用指南四部分組成。簡表一般由1-4級類目構(gòu)成,主表由全部類目構(gòu)成。索引包括:①本表與其他分類體系的對應(yīng),用于不同分類體系的轉(zhuǎn)換;②英譯名稱索引,從英查漢或從漢查英。使用指南是分類體系的詳細(xì)說明。[24]
5現(xiàn)代技術(shù)在網(wǎng)絡(luò)信息分類法構(gòu)建中的應(yīng)用
由于網(wǎng)絡(luò)信息分類法必須能適應(yīng)網(wǎng)絡(luò)技術(shù)環(huán)境,這就要求在編制過程中適當(dāng)采用許多現(xiàn)代信息技術(shù),如自動分類技術(shù)、人工智能技術(shù)、網(wǎng)格技術(shù)等等,以適應(yīng)網(wǎng)絡(luò)技術(shù)環(huán)境的發(fā)展特點。馬張華專文闡述了超文本技術(shù)在網(wǎng)絡(luò)信息分類法編制中的應(yīng)用。[25]他指出:超文本技術(shù)可以改進(jìn)主題之間多維關(guān)系的揭示;可以從多個角度組織信息資源;可以進(jìn)行輪排,亦即多表列類;可以設(shè)置鏡像類目,根據(jù)需要對某些重點類目或熱點類目突出反映;可以動態(tài)設(shè)置類目和動態(tài)揭示類目之間的關(guān)系,根據(jù)需要及時增添類目或刪改類目;可用于聯(lián)結(jié)不同的檢索系統(tǒng),增加檢索入口;可以聯(lián)結(jié)分類體系與相應(yīng)的說明文字與規(guī)則系統(tǒng)。
陳旭論述了分面分類在網(wǎng)絡(luò)信息分類法編制中的應(yīng)用。[26]文章首先論述了在編制網(wǎng)絡(luò)信息分類法時,可根據(jù)需要利用仿分技術(shù)編制各種類型的通用復(fù)分表、專用復(fù)分表及規(guī)定必要的仿分。其次論述了分面敘詞表的應(yīng)用。最后論述了分面分類在可視化檢索中的應(yīng)用。即在檢索界面上設(shè)置主題分面、書目形式分面、時間分面和地域分面,然后再按等級列舉的方式分別展開,既便于類表的修訂與維護(hù),又便于用戶檢索更為專指的信息。
周淑云在《分類主題一體化構(gòu)建網(wǎng)絡(luò)信息分類體系》[27]一文中指出,理想的網(wǎng)絡(luò)分類法應(yīng)是分類法和主題法的結(jié)合使用,理想的模式是以“分類一主題”的方式對知識進(jìn)行組織,形成一種兼具分類、主題兩種標(biāo)引和查找功能的新型檢索語言,從而為不同層次和不同需求的用戶分別提供不同的信息查詢功能。分類主題一體化的網(wǎng)絡(luò)分類體系既突破了傳統(tǒng)分類法層層劃分、層層隸屬的等級結(jié)構(gòu)又克服了主題法系統(tǒng)性差,將同類信息分類的特點。對此問題進(jìn)行論述的還有郭麗芳、梅伯平、蘇瑞竹等。
6構(gòu)建中微觀層面的具體問題
對網(wǎng)絡(luò)信息分類法編制的一些具體問題,許多學(xué)者都予以了詳細(xì)的探討。
陳樹年在《網(wǎng)絡(luò)信息分類法研究》中研究了聚類標(biāo)準(zhǔn)、大類設(shè)置、展開層次、類目種類、類目名稱、多分類體系、分類標(biāo)準(zhǔn)與使用次序、類目設(shè)置的均衡性和規(guī)律性、重點類目、交叉關(guān)系的處理、類目的排列、類目的注釋和說明、用戶界面的設(shè)計等,并給出了相應(yīng)的改進(jìn)意見。[28]他認(rèn)為,關(guān)于聚類標(biāo)準(zhǔn),綜合性網(wǎng)絡(luò)信息分類法聚類的主要標(biāo)準(zhǔn)應(yīng)當(dāng)是“主題和專題”,專業(yè)搜索引擎可以學(xué)科或?qū)I(yè)為主要聚類標(biāo)準(zhǔn),或結(jié)合主題聚類運(yùn)用;關(guān)于大類的設(shè)置數(shù)量通常以10-20個為宜;關(guān)于類目的名稱要做到準(zhǔn)確、通用和精練;關(guān)于類目種類包括“子類”與“網(wǎng)站”兩種,“在每一類下,把內(nèi)容寬泛,各個下位類不能容納的信息歸納為‘綜合網(wǎng)站’集中收錄是網(wǎng)絡(luò)分婁法實用的作法”。
其它方面,人們觀點大致雷同。如,關(guān)于分類體系展開層次,陳樹年提出基本應(yīng)控制在3-6級之間;趙培云認(rèn)為根據(jù)目前網(wǎng)絡(luò)信息的實際情況和用戶瀏覽查詢心理,綜合性網(wǎng)絡(luò)信息分類標(biāo)準(zhǔn),類目應(yīng)控制在三、四層為宜,專業(yè)搜索引擎和網(wǎng)站可適當(dāng)延伸。[29]張琪玉提出類目細(xì)分應(yīng)控制在五級左右。[30]
總之,由于網(wǎng)絡(luò)信息、網(wǎng)絡(luò)信息用戶、網(wǎng)絡(luò)信息技術(shù)環(huán)境等特點,這就決定了網(wǎng)絡(luò)信息分類法的編制原則和技術(shù)方法,有別于傳統(tǒng)分類法的編制原則和技術(shù)方法,但是傳統(tǒng)文獻(xiàn)分類法和現(xiàn)有網(wǎng)絡(luò)信息分類體系的成功經(jīng)驗可以給網(wǎng)絡(luò)信息分類法提供有益的借鑒。我們建議,應(yīng)當(dāng)由國家信息產(chǎn)業(yè)部牽頭,組織圖書情報界專家、計算機(jī)專家、網(wǎng)絡(luò)公司等相關(guān)專家,廣泛征求意見,盡早編制出一部用戶滿意、質(zhì)量較高的網(wǎng)絡(luò)信息分類法。
【參考文獻(xiàn)】
[1]馬張華.分類搜索引擎類目體系研究.圖書情報工作,2001(2):36-40
[2][22]陳樹年.搜索引擎及網(wǎng)絡(luò)信息資源的分類組織.圖書情報工作,2000(4):31-37
[3]石曉華,王春芳。網(wǎng)絡(luò)信息分類與傳統(tǒng)分類法的優(yōu)劣分析——兼談構(gòu)建《中國網(wǎng)絡(luò)信息分類法》.圖書館理論與實踐,2001(1):43-45
[4][30]張琪玉.網(wǎng)絡(luò)信息檢索工具的分類體系.江蘇圖書館學(xué)報,2002(4):7-11
[5]王知津,肖洪.網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒.圖書館工作與研究,2003(4):2-7
[6]董琳.網(wǎng)絡(luò)信息分類組織的發(fā)展趨勢與標(biāo)準(zhǔn)化.圖書情報知識,2004(2):65-67
[7][12]陸寶益.論創(chuàng)建我國統(tǒng)一的網(wǎng)絡(luò)信息分類法.中國圖書館學(xué)報,2004(6):44-47
[8]千忠紅.網(wǎng)絡(luò)信息環(huán)境下的傳統(tǒng)分類法.圖書情報工作,1999(2):37-39
[9]史學(xué)斌.網(wǎng)絡(luò)信息分類體系.圖書館,2002(1):33-35,20
[10]鄭慶勝,易曉陽.從新浪等網(wǎng)站看網(wǎng)絡(luò)信息分類體系的建立.圖書館建設(shè),2003(1):69-71
[11][23]吳丹.網(wǎng)絡(luò)信息分類體系設(shè)計.圖書情報知識,2002(5):37-39
[13]朱蓓玲.淺析構(gòu)建網(wǎng)絡(luò)信息分類體系.情報雜志,2004(8):110-111,114
[14]敬卿,吳靜.網(wǎng)絡(luò)分類目錄規(guī)范化初探.圖書館,2002(1):49-50
[15]鄧香蓮.文獻(xiàn)信息分類與網(wǎng)絡(luò)信息分類之比較研究.情報資料工作,2002(6):43-45
[16]粟慧.以人為本的必然:人工檢索語言向自然語言的轉(zhuǎn)變.圖書館,2000(2):9-10
[17]張琪玉.網(wǎng)絡(luò)信息檢索用語言的發(fā)展趨勢.圖書館雜志,2001(3):5-7
[18]梁樹柏,高夕果.受控語言網(wǎng)民化的思考.情報雜志,2002(8):69-71
[19]陳晶.論網(wǎng)絡(luò)環(huán)境下情報檢索語言的發(fā)展.情報雜志,2002(6):54-55
[20]呂娟,袁相琴.論第四種情報檢索語言系統(tǒng).中國圖書館學(xué)報,2002(1):87-92
[21]焦玉英,李法運(yùn).網(wǎng)絡(luò)環(huán)境下信息檢索語言的優(yōu)化研究.情報學(xué)報,2003(3):291-296
[24]許培揚(yáng),張玢.網(wǎng)絡(luò)信息分類標(biāo)準(zhǔn)研究進(jìn)展.醫(yī)學(xué)情報工作,2002(6):324-326
[25]馬張華,李玲.超文本技術(shù)在分類法編制中的應(yīng)用.大學(xué)圖書館學(xué)報,2001(1):60-62,66
[26]陳旭.分面分類在網(wǎng)絡(luò)資源組織中的應(yīng)用.圖書情報工作,2002(1):59-61
[27]周淑云.分類主題一體化構(gòu)建網(wǎng)絡(luò)信息分類體系.現(xiàn)代情報,2003(4):113-114
關(guān)鍵詞:環(huán)境信息 信息分類 多維樹狀信息結(jié)構(gòu) 球形網(wǎng)狀信息結(jié)構(gòu)
中圖分類號:X5 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2015)10(b)-0192-02
環(huán)境信息,顧名思義是與環(huán)境有關(guān)的信息,但在學(xué)術(shù)上至今為止還沒有統(tǒng)一的國際一致認(rèn)可的定義。環(huán)境信息分類是環(huán)境信息標(biāo)準(zhǔn)化的重要基礎(chǔ),是環(huán)境信息化的關(guān)鍵環(huán)節(jié)之一。建立一個科學(xué)、規(guī)范、精簡、高效、實用的環(huán)境信息體系,能夠支持信息使用者用最簡單、最短的時間獲取最有價值的環(huán)境信息[1]。我國對環(huán)境信息分類已有一定的研究基礎(chǔ)。當(dāng)前環(huán)境信息分類方法比較直觀、易于理解,便于內(nèi)容的組織與歸納。然而,隨著“智慧環(huán)保”“環(huán)保物聯(lián)網(wǎng)”“移動互聯(lián)網(wǎng)”的發(fā)展,環(huán)境信息內(nèi)容不斷擴(kuò)大,此環(huán)境信息分類法忽略了各個類目點的數(shù)據(jù)內(nèi)容交叉性,又切割了各個類目點之間的內(nèi)在客觀聯(lián)系。該文在充分分析環(huán)境信息分類現(xiàn)狀和環(huán)境信息的概念及發(fā)展特征的基礎(chǔ)上,提出新型環(huán)境信息分類方法,為環(huán)境信息的高效利用提供新思路[2]。
1 研究方法
目前,環(huán)境信息分類采用的線分類法和面分類法;線分類法屬于一維分類法,體現(xiàn)的是垂直方向上的概念邏輯關(guān)聯(lián);面分類法為二維分類法,體現(xiàn)的是水平方向上的概念邏輯關(guān)聯(lián)。然而,環(huán)境是多因素的復(fù)雜系統(tǒng),是一個多學(xué)科交叉融合的開放體系,環(huán)境系統(tǒng)內(nèi)部體現(xiàn)的是交叉融合的多維邏輯關(guān)聯(lián)[3]。
(1)多維樹狀信息結(jié)構(gòu)。
該分類方法需滿足以下條件:所有維度的總和所涵蓋的內(nèi)容能夠構(gòu)成完整的系統(tǒng)范疇和領(lǐng)域,每一個分類維度內(nèi)涵必須是互相獨(dú)立、無重復(fù)的。同時,需預(yù)留足夠的類目,以保證新事物出現(xiàn)時不至于打亂已建立的分類體系和結(jié)構(gòu)[4]。
系統(tǒng)中的每個子系統(tǒng)映射為信息空間的一個信息維,每一個信息維包括一顆以維度為根級的分類樹,分類樹包括若干子樹,子樹由相互獨(dú)立的域構(gòu)成,域是葉級分類。樹、子樹和域構(gòu)成了該數(shù)據(jù)維下的二維分類結(jié)構(gòu)[5]。
(2)球形網(wǎng)狀信息結(jié)構(gòu)。
球形網(wǎng)狀信息結(jié)構(gòu)則是結(jié)合樹形數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)上演變而來。構(gòu)建步驟:
一是將信息按照樹形結(jié)構(gòu)分類。
二是調(diào)整每一個信息樹及其分類的位置并旋轉(zhuǎn)一定的角度、形成一個有邊界的多邊形整體效果,將所有的信息單元數(shù)據(jù)對象放在全集空間中考察。
三是對于實踐中所生產(chǎn)的每一個信息單元,先根據(jù)信息的主要功能與價值確定其直接歸屬的欄目,用實線連接該信息單元和其宿主欄目。并考察信息單元與其他欄目的關(guān)聯(lián)性,關(guān)聯(lián)性強(qiáng)的用虛線連接,關(guān)聯(lián)性弱的則不連接。
四是當(dāng)所有的信息樹分類和信息單元都在這個全集空間中標(biāo)示出來時,再把該模型放到立體空間去觀察,最后得到一個球形網(wǎng)狀的結(jié)構(gòu)模型。
2 結(jié)果與討論
2.1 多維樹狀環(huán)境信息分類
環(huán)境信息除了要體現(xiàn)環(huán)境系統(tǒng)的豐富內(nèi)涵,同時也要表達(dá)信息特征和時空特征。因此,環(huán)境信息的三個基本維度可視為:環(huán)境屬性維、信息屬性維和時空定位屬性維。
(1)環(huán)境屬性維。
環(huán)境是多因素的復(fù)雜系統(tǒng),信息包括豐富的內(nèi)涵。通過對環(huán)境政治活動和環(huán)境自然因素分析,結(jié)合我國用戶對環(huán)境信息的需求,該文將環(huán)境屬性維分為活動行為和環(huán)境要素。
活動行為,是按政府對環(huán)境監(jiān)管進(jìn)行分類,主要有環(huán)境管理、生態(tài)保護(hù)、污染防治、環(huán)境科研、公眾參與和環(huán)境產(chǎn)業(yè)發(fā)展等。
環(huán)境要素,是按人類對環(huán)境的一般認(rèn)識進(jìn)行分類,主要有水、大氣、生物、土壤、輻射、聲和社會環(huán)境等。
(2)信息屬性維。
信息屬性說明環(huán)境信息的來源、信息內(nèi)容及信息表現(xiàn)形式,該維度服務(wù)于信息的標(biāo)準(zhǔn)化技術(shù)操作。
環(huán)境信息來源,通過具體分析環(huán)境信息來源,采用相應(yīng)的數(shù)據(jù)集成技術(shù),可方便信息的自動化接收和存儲。該文將環(huán)境信息來源分為:環(huán)保系統(tǒng)內(nèi)部信息、跨部門共享信息、公共網(wǎng)絡(luò)資源、公共科技資源等。
環(huán)境信息內(nèi)容,根據(jù)對環(huán)境內(nèi)涵的分析,環(huán)境信息內(nèi)容可以分為科普知識、監(jiān)測預(yù)警、行政審批、法律政策、新聞公告和科研成果等。
環(huán)境信息表現(xiàn)形式,根據(jù)信息表現(xiàn)的一般分類,該文環(huán)境信息表現(xiàn)形式分為文本、圖表、聲音、視頻、地圖等。
(3)時空定位屬性維。
環(huán)境具有明顯的時空特征,環(huán)境信息也需要反映時空特性,該文將時空定位維分為時間特征、時效特征和空間范圍。
時間特征,按照環(huán)境信息關(guān)聯(lián)的自然時間進(jìn)行定位,該文將時間特征信息分為預(yù)測信息、當(dāng)前信息和歷史信息。
時效特征,按照環(huán)境信息接收到的時間效力進(jìn)行定位,該文將時效特征分為實時信息、準(zhǔn)實時信息、延遲信息等。
空間范圍,按照環(huán)境信息關(guān)聯(lián)的空間位置實現(xiàn)空間定位,該文將空間范圍分為世界、全國、區(qū)域、流域、地方等。
2.2 球形網(wǎng)狀環(huán)境信息分類
根據(jù)以上分類,環(huán)境信息樹包括8類:活動行為、環(huán)境要素、信息來源、信息內(nèi)容、表現(xiàn)形式、時間特征、時效特征和空間范圍,將每個信息樹按其分類旋轉(zhuǎn)一定角度形成空間效果,將實踐中的每一個信息單元與各個環(huán)境信息樹進(jìn)行關(guān)聯(lián),形成一個環(huán)境信息的球形網(wǎng)狀結(jié)構(gòu)。
2.3 結(jié)果討論
該文所采用的多維樹狀信息分類法和球形網(wǎng)狀結(jié)構(gòu)的信息分類法,具有以下特點:
(1)多維樹狀信息分類法從環(huán)境屬性維、信息屬性維和時空定位屬性維對環(huán)境信息進(jìn)行分類,基本涵蓋了環(huán)境及信息的所有內(nèi)涵和特征,克服了現(xiàn)在以線、面混合分類法對于數(shù)據(jù)內(nèi)容交叉性不強(qiáng)的缺陷,為環(huán)境信息分類提出新方向。
(2)球形網(wǎng)狀結(jié)構(gòu)的信息分類法是在多維樹狀信息結(jié)構(gòu)的基礎(chǔ)演變形成,增強(qiáng)了環(huán)境信息類別間的內(nèi)存聯(lián)系,使環(huán)境信息分類體系更富有組織性、有機(jī)性。
(3)同時,環(huán)境信息的多維分類及網(wǎng)狀聯(lián)結(jié)也為信息的存儲和查詢效率提出了更高的要求,要求更高性能的物理存儲、更合理的數(shù)據(jù)庫結(jié)構(gòu),以及更加高效的搜索技術(shù)。
3 結(jié)語
多維樹狀環(huán)境信息分類和球形網(wǎng)狀環(huán)境信息分類是以環(huán)境信息的特征為基礎(chǔ),以信息高效利用需求為導(dǎo)向,提出的現(xiàn)代化新型環(huán)境信息分類方法,它克服了傳統(tǒng)環(huán)境分類數(shù)據(jù)內(nèi)容交叉性弱、內(nèi)在客觀聯(lián)系不強(qiáng)等缺陷,是科學(xué)、規(guī)范、精簡、高效、實用的環(huán)境信息體系構(gòu)建的基礎(chǔ)理論,為現(xiàn)代環(huán)境信息資源目錄體系和環(huán)境信息資源中心的建設(shè)提供了新思路。該研究旨在拋磚引玉,希望更多學(xué)者進(jìn)行探討,為推動環(huán)境信息的綜合有效利用以及環(huán)境信息化發(fā)展做出努力。
參考文獻(xiàn)
[1] 關(guān)于在環(huán)境事物中獲取信息、公眾參與決策和司法救濟(jì)的公約(奧胡斯公約).歐洲經(jīng)濟(jì)委員會環(huán)境政策委員會于1998年在“歐洲環(huán)境”第四次部長級會議[Z].
[2] 尹榮樓,李愛榮.環(huán)境信息分類編碼標(biāo)準(zhǔn)化[J].環(huán)境科學(xué)研究,1994,7(2):39-43.
[3] 王健,甘國輝.多維農(nóng)業(yè)信息分類體系[J].農(nóng)業(yè)工程學(xué)報,2004,20(4):152-155.
關(guān)鍵詞:知識管理 知識化監(jiān)理 知識結(jié)構(gòu)
信息工程監(jiān)理是最近幾年興起的保障信息化建設(shè)質(zhì)量的一種約束機(jī)制。它采用“五控兩管一協(xié)調(diào)”的控制模式,對業(yè)主、承建單位的項目行為實施監(jiān)督,保障信息化建設(shè)的質(zhì)量,避免“豆腐渣”工程,起著不可或缺的重要作用。
一、信息化建設(shè)與知識管理
信息化建設(shè)是以知識管理為核心,信息資源為基礎(chǔ),提高組織核心競爭力為目的的全面整合或再造組織業(yè)務(wù)流程的過程。知識管理是獲取、儲存、學(xué)習(xí)、共享、創(chuàng)新知識的管理控制過程。在信息化建設(shè)中,企業(yè)、政府等組織通過知識管理,從現(xiàn)有的業(yè)務(wù)流程和數(shù)據(jù)中,挖掘、獲取并確定各類知識資源,定位擁有專業(yè)知識、經(jīng)驗的個體,將個體的知識、經(jīng)驗、信息提升為組織的知識資源,有序傳遞、整合、規(guī)劃和有效利用知識資源,有助于提高組織的整體業(yè)務(wù)、技術(shù)和管理水平。
在承建單位實施信息化建設(shè)中,知識管理是通過公司內(nèi)雇員、部門、可能的跨國公司合作、與業(yè)主的溝通協(xié)調(diào),傳遞、整合、有效利用本單位的知識資源,運(yùn)用信息技術(shù),通過設(shè)計最優(yōu)技術(shù)方案、控制施工質(zhì)量,共享和創(chuàng)造知識價值。
在信息化建設(shè)中,對組織內(nèi)各種各類知識進(jìn)行評估,挖掘、獲取真正有用的知識。知識不僅僅是信息,是顯性知識和隱性知識的集合。通過評估,區(qū)分知識和信息、知識管理和信息管理,以實現(xiàn)資源的充分開發(fā)與應(yīng)用。
整合或再造業(yè)務(wù)流程,是與知識管理密切相關(guān)的。1990年美國管理專家Michael Hammer提出了“業(yè)務(wù)流程重組”(Business Process ReengineeringBPR)的概念,它是以用戶需求為導(dǎo)向,信息化、知識化為基礎(chǔ),對用戶的業(yè)務(wù)流程進(jìn)行再思考、關(guān)鍵性的重新設(shè)計和根本的變革,從而獲得在成本、質(zhì)量、服務(wù)和速度等方面業(yè)績的持續(xù)改善。在業(yè)務(wù)流程重組中,信息(知識)的獲取、分類、存儲、利用,只有與知識管理結(jié)合,才能夠發(fā)揮更有效的作用。
知識管理技術(shù)貫穿于信息化建設(shè)始終,它與信息技術(shù)相輔相成。在知識獲取、學(xué)習(xí)、共享、創(chuàng)新的過程中,整合各種信息技術(shù),構(gòu)建完整的知識管理體系,是知識經(jīng)濟(jì)時代信息技術(shù)的新發(fā)展。
二、信息資源規(guī)劃和整合
信息資源整合(Information Resource Integrating, IRI)的前提是進(jìn)行統(tǒng)一的信息資源規(guī)劃(Information Resource Planning, IRP),消除“信息孤島”,共享信息資源。信息資源的規(guī)劃是實施信息化工程的基礎(chǔ),IRP的基礎(chǔ)是建立信息資源管理基礎(chǔ)標(biāo)準(zhǔn),IRI的實質(zhì)是通過信息技術(shù)改造、重建或重構(gòu)數(shù)據(jù)環(huán)境。信息產(chǎn)業(yè)部的《信息系統(tǒng)工程監(jiān)理暫行規(guī)定》中定義信息資源系統(tǒng)為“以信息技術(shù)為主要手段建立的信息資源采集、儲存、處理的資源系統(tǒng)”。
在信息化建設(shè)中,信息資源規(guī)劃是很重要的一環(huán)。在組織的生產(chǎn)、經(jīng)營、服務(wù)活動中,會產(chǎn)生大量的數(shù)據(jù)、資料、指標(biāo)、圖紙、報表及其它顯性資源,也存在各種各類的知識、擁有專業(yè)知識和經(jīng)驗的個體等隱性資源。信息資源規(guī)劃是對實施信息化后產(chǎn)生、控制、使用這些資源進(jìn)行識別和分類;評估、挖掘、獲取、共享各類知識;對承載信息資源的信息基礎(chǔ)設(shè)施進(jìn)行分析、設(shè)計和指導(dǎo)。
(一)信息資源規(guī)劃的主要任務(wù)
信息資源規(guī)劃的任務(wù)是對支撐業(yè)務(wù)流程的邏輯相關(guān)的數(shù)據(jù)進(jìn)行分類,建立具有結(jié)構(gòu)化、標(biāo)準(zhǔn)化、一致性的共享數(shù)據(jù)庫。分析業(yè)務(wù)流程重組后產(chǎn)生、控制和使用的數(shù)據(jù),了解各種數(shù)據(jù)的內(nèi)容、范圍、可靠性等,理解數(shù)據(jù)的共享要求和應(yīng)用策略以及數(shù)據(jù)使用中的問題,使信息資源規(guī)劃能夠滿足數(shù)據(jù)資源的管理要求。
(二)信息資源管理標(biāo)準(zhǔn)
信息資源管理標(biāo)準(zhǔn)是指決定信息系統(tǒng)質(zhì)量的、進(jìn)行信息資源開發(fā)利用的基本標(biāo)準(zhǔn)。威廉·德雷爾1985年在其《數(shù)據(jù)管理》專著中總結(jié)了信息資源管理的基礎(chǔ)標(biāo)準(zhǔn)———數(shù)據(jù)管理五項標(biāo)準(zhǔn),內(nèi)容如下:
1.數(shù)據(jù)元素標(biāo)準(zhǔn)。數(shù)據(jù)元素(Data Elements)是信息資源中最小的信息單位,是抽象的數(shù)據(jù)對象。它的質(zhì)量是構(gòu)建穩(wěn)定的數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)的關(guān)鍵。數(shù)據(jù)元素標(biāo)準(zhǔn)包括數(shù)據(jù)元素命名標(biāo)準(zhǔn)、標(biāo)數(shù)據(jù)元素識標(biāo)準(zhǔn)和數(shù)據(jù)元素一致性標(biāo)準(zhǔn)。
2.信息分類編碼標(biāo)準(zhǔn)。是信息標(biāo)準(zhǔn)中的基礎(chǔ)標(biāo)準(zhǔn)。信息分類編碼(Information Classifying and Coding)的對象,是一些最重要的數(shù)據(jù)元素,自動處理、檢索、存儲和傳輸信息的質(zhì)量及效率與這些元素緊密相關(guān)。信息分類是根據(jù)信息內(nèi)容的屬性或特征,將信息按一定的原則和方法進(jìn)行區(qū)分和歸類,并建立一定的分類系統(tǒng)和排列順序,便于管理和使用信息。信息編碼就是在信息分類的基礎(chǔ)上,將編碼對象賦予有一定規(guī)律性的、易于計算機(jī)和人識別和處理的符號。信息分類編碼工作要確定每個編碼對象的編碼規(guī)則、碼表結(jié)構(gòu)和代碼表。
3.用戶視圖標(biāo)準(zhǔn)。用戶視圖(User View)是一些數(shù)據(jù)元素的集合,表示用戶對信息需求和數(shù)據(jù)實體的最終解釋。用戶視圖是數(shù)據(jù)的系統(tǒng)外在表現(xiàn)形式,是系統(tǒng)的輸入、輸出媒介和手段。用戶視圖與外部數(shù)據(jù)流是同一詞,來自某個數(shù)據(jù)源或流向某個數(shù)據(jù)接收端的數(shù)據(jù)流。常用的用戶視圖有紙面的,如圖紙、單證、表單、報表、賬冊等;有電子的,如屏幕格式等。
4.概念數(shù)據(jù)庫標(biāo)準(zhǔn)。概念數(shù)據(jù)庫(Conceptual Database)是用戶對數(shù)據(jù)存儲的最終解釋。用戶的信息需求,應(yīng)首先界定概念數(shù)據(jù)庫。概念數(shù)據(jù)庫是綜合信息資源用戶的數(shù)據(jù)要求構(gòu)成的全局?jǐn)?shù)據(jù)庫,表示數(shù)據(jù)庫的整體數(shù)據(jù)組織狀況和邏輯結(jié)構(gòu)。
5.邏輯數(shù)據(jù)庫標(biāo)準(zhǔn)。邏輯數(shù)據(jù)庫(Logical Database)是系統(tǒng)分析設(shè)計人員的解釋。在關(guān)系數(shù)據(jù)庫模型中,邏輯數(shù)據(jù)庫是一組規(guī)范化的基本表(Base Table),是從概念數(shù)據(jù)庫中映射出的所需信息。邏輯數(shù)據(jù)庫表示的是局部數(shù)據(jù)的數(shù)據(jù)庫邏輯結(jié)構(gòu)。
(三)信息資源規(guī)劃方案
在定義數(shù)據(jù)管理標(biāo)準(zhǔn)的基礎(chǔ)上,制定信息資源規(guī)劃方案,為業(yè)務(wù)流程重組提供依據(jù),為系統(tǒng)設(shè)計提供基礎(chǔ)。
在信息資源規(guī)劃中,將隱性資源轉(zhuǎn)變?yōu)轱@性資源,有序傳遞、整合、規(guī)劃和有效利用各類知識資源。因此,信息資源規(guī)劃是資源的知識管理規(guī)劃。信息技術(shù)的投資,可能不會給企業(yè)帶來明顯的效益,因為基于信息的競爭優(yōu)勢正在逐漸轉(zhuǎn)變?yōu)榛谥R管理的競爭優(yōu)勢,以信息資源規(guī)劃為核心的信息系統(tǒng)規(guī)劃,如果不實施知識管理,將不會產(chǎn)生顯著的信息化效益。
(四)資源整合
我國政府信息化進(jìn)程從20世紀(jì)80年代開始到現(xiàn)在已有20多年的時間。政府部門的信息資源建設(shè)和政府內(nèi)網(wǎng)信息門戶建設(shè)已具較大規(guī)模,但由于缺乏統(tǒng)一規(guī)劃,造成了各部門應(yīng)用系統(tǒng)的開發(fā)平臺不同、操作系統(tǒng)不同,特別是數(shù)據(jù)庫管理系統(tǒng)千差萬別,各系統(tǒng)之間“不聯(lián)不通”,從而形成了一個個“信息孤島”。因此當(dāng)前電子政務(wù)建設(shè)面臨著兩項任務(wù),一項是政府信息資源整合、流程優(yōu)化,建立有效的領(lǐng)導(dǎo)決策支持系統(tǒng);另一項是提供周到、方便的公共服務(wù)能力,即構(gòu)建電子服務(wù)型政府。
一、信息資源整合
在短期內(nèi)建設(shè)完成電子服務(wù)型政府的困難是:我國目前電子政務(wù)物理網(wǎng)的基礎(chǔ)設(shè)施和單項應(yīng)用雖然很豐富,但是信息資源共享與交換能力不足,因此重視數(shù)據(jù)流分析和辦公流程整合,搞好軟件系統(tǒng)的頂層設(shè)計是電子政務(wù)建設(shè)必須經(jīng)歷的重要階段。信息資源整合的三項內(nèi)容:內(nèi)容整合、數(shù)據(jù)整合、應(yīng)用整合。
從總體上看,內(nèi)容整合包括對分散異構(gòu)信息資源體系的整合。首先,原則上是在兼顧信息資源現(xiàn)有配置與管理狀況的條件下,實現(xiàn)無縫整合;其次,在新的信息交換與共享平臺上,開發(fā)新的應(yīng)用,實現(xiàn)信息資源的最大增值。
數(shù)據(jù)整合的關(guān)鍵是構(gòu)建基礎(chǔ)數(shù)據(jù)庫和建立數(shù)據(jù)中心?;A(chǔ)數(shù)據(jù)庫包括人口數(shù)據(jù)庫、法人單位數(shù)據(jù)庫、自然資源和空間地理數(shù)據(jù)庫、宏觀經(jīng)濟(jì)數(shù)據(jù)庫和各地方特殊資源數(shù)據(jù)庫等。其中數(shù)據(jù)中心的建立是電子政務(wù)的基石,是政府信息化的基礎(chǔ)設(shè)施。
應(yīng)用整合包括包含G2G、G2B、G2C和G2E(政府對公務(wù)員)等模式下的政務(wù)應(yīng)用系統(tǒng)及協(xié)同工作與決策支持系統(tǒng)。
此外,電子政務(wù)標(biāo)準(zhǔn)規(guī)范體系和電子政務(wù)安全體系作為電子政務(wù)建設(shè)的核心內(nèi)容,也不容忽視。
二、信息資源整合的難點
電子政務(wù)工程建設(shè)經(jīng)過多年的開發(fā)和積累,政府各部門存在了大量的數(shù)據(jù)庫,對這些現(xiàn)有數(shù)據(jù)庫系統(tǒng)進(jìn)行整合中遇到的難題主要有:
1.對現(xiàn)有分散異構(gòu)的信息資源如何無縫接入。包括結(jié)構(gòu)化數(shù)據(jù)資源的接入、非結(jié)構(gòu)化數(shù)據(jù)的接入和應(yīng)用軟件系統(tǒng)的接入。
2.整合后信息系統(tǒng)的管理問題?,F(xiàn)有信息資源的管理分為自上而下的管理、集中式管理、可控性自主管理、個性化管理和實時性管理等多種管理模式。信息資源整合后將實行分布式信息資源管理。如何實現(xiàn)物理上分散、邏輯上集中、應(yīng)用上分散、管理與服務(wù)集中將是面臨的主要難題。
3.如何滿足新的需求。包括共享需求、交換需求、協(xié)同需求等。
4.支持不同用戶的訪問需求。包括支持不用授權(quán)的可控性訪問、不同用戶的個性化服務(wù)、支持單一性訪問、支持實時性的應(yīng)用需求。
三、信息資源整合方案
整合后的管理架構(gòu)體系分5層,如圖1所示。
該管理架構(gòu)的優(yōu)勢是:
1.視圖管理層中所有管理模塊都提供與WebService的接口,易于實現(xiàn)分布部屬,統(tǒng)一管理。
2.統(tǒng)一的資源目錄層PKI和PMI中心層中的授權(quán)管理可以靈活定義用戶類型和用戶屬性,從而可以方便地定義信息欄目下的不同條目或應(yīng)用下的不同操作,靈活定制授權(quán)策略。支持第三方CA認(rèn)證及其資源目錄系統(tǒng)和第三方應(yīng)用系統(tǒng)的集成。
3.組件封裝層:涵蓋了日常工作中用到的各種文件模版,并提供舊文件查詢等功能。
4.軟件層:提供各種辦公應(yīng)用軟件及專用軟件。
四、信息資源整合的成功案例
2005年全國電子政務(wù)建設(shè)步入新的發(fā)展階段。以河北省電子政務(wù)“112”工程為例,該工程的重點是構(gòu)建了統(tǒng)一的電子政務(wù)平臺和12個應(yīng)用系統(tǒng)。
1.統(tǒng)一的電子政務(wù)平臺:公務(wù)內(nèi)網(wǎng)、公務(wù)外網(wǎng)和信息交換系統(tǒng)
2.12個重點應(yīng)用系統(tǒng):辦公及網(wǎng)上審批系統(tǒng)、財稅和審計監(jiān)管系統(tǒng)、社會保障信息系統(tǒng)、宏觀經(jīng)濟(jì)信息系統(tǒng)、農(nóng)業(yè)信息及服務(wù)系統(tǒng)、自然資源和基礎(chǔ)地理信息系統(tǒng)、社區(qū)綜合管理服務(wù)系統(tǒng)、人口基本信息管理系統(tǒng)、應(yīng)急聯(lián)動信息系統(tǒng)、公共衛(wèi)生信息系統(tǒng)、信用信息服務(wù)系統(tǒng)、綜合教育信息系統(tǒng)。
系統(tǒng)建設(shè)分三個階段進(jìn)行:
第一階段(需求分析階段):主要任務(wù)是業(yè)務(wù)梳理和用戶視圖及數(shù)據(jù)流分析。通過業(yè)務(wù)梳理和分析,按照信息工程方法論,建立起由職能域、業(yè)務(wù)過程、業(yè)務(wù)活動構(gòu)成的業(yè)務(wù)模型;通過對報表、單證、帳冊等用戶視圖的登記和拆分,得到所涉及的數(shù)據(jù)項及其分布情況;通過對數(shù)據(jù)流也就是用戶視圖流動的分析,得到業(yè)務(wù)與數(shù)據(jù)的關(guān)聯(lián)關(guān)系,形成數(shù)據(jù)流程圖。通過對輸入、輸出、存儲等數(shù)據(jù)流的量化分析,得到對網(wǎng)絡(luò)通信和數(shù)據(jù)存儲設(shè)備的量化需求。
第二階段(系統(tǒng)建模階段):系統(tǒng)建模是需求分析的繼續(xù)和定型,這一階段的主要任務(wù)是建立系統(tǒng)的功能模型、數(shù)據(jù)模型和體系結(jié)構(gòu)模型。在對需求分析階段得到的業(yè)務(wù)過程、業(yè)務(wù)活動能否計算機(jī)化進(jìn)行分析的基礎(chǔ)上,將可計算機(jī)化的業(yè)務(wù)過程、業(yè)務(wù)活動用功能模塊和程序模塊表達(dá)出來,建立起功能模型,解決系統(tǒng)做什么的問題;通過對需求階段得到的數(shù)據(jù)流程圖、用戶視圖、數(shù)據(jù)項及其分布情況的進(jìn)一步分析、分類和規(guī)范化,按業(yè)務(wù)主題和業(yè)務(wù)需要建立起由主題數(shù)據(jù)庫、基本表、數(shù)據(jù)元素集構(gòu)成的數(shù)據(jù)模型,解決系統(tǒng)信息如何組織的問題;通過對功能模型和數(shù)據(jù)模型關(guān)聯(lián)關(guān)系的分析,建立起系統(tǒng)的體系結(jié)構(gòu)模型,表達(dá)出子系統(tǒng)與主題數(shù)據(jù)庫的關(guān)聯(lián)情況以及各子系統(tǒng)的程序模塊與基本表的關(guān)聯(lián)情況,為共享數(shù)據(jù)庫的創(chuàng)建與使用、數(shù)據(jù)分布分析和制定開發(fā)計劃提供決策依據(jù)。
第三階段(信息分類編碼階段):主要任務(wù)是數(shù)據(jù)元素規(guī)范化、信息分類編碼和專項報告編制。利用數(shù)據(jù)元素規(guī)范化理論和方法,對基本表中的每一個數(shù)據(jù)元素進(jìn)行分析、規(guī)范和一致性控制,數(shù)據(jù)模型也得到進(jìn)一步完善;通過對數(shù)據(jù)元素內(nèi)涵的分析,識別信息分類編碼對象并進(jìn)行適當(dāng)分類,按照國際、國家、地方、企業(yè)的順序,進(jìn)行信息分類編碼標(biāo)準(zhǔn)調(diào)研,對確需自己進(jìn)行編碼的對象,要制定編碼規(guī)則、編制相應(yīng)的代碼表,并通過收集已有的編碼標(biāo)準(zhǔn),最終形成系統(tǒng)所需的完整的信息分類編碼標(biāo)準(zhǔn);在完成信息資源規(guī)劃方案的基礎(chǔ)上,通過對整個過程和成果的總結(jié)與提煉,分別形成流程優(yōu)化、信息資源管理基礎(chǔ)標(biāo)準(zhǔn)、數(shù)據(jù)交換標(biāo)準(zhǔn)、數(shù)據(jù)環(huán)境建設(shè)、投資分析等五個專項報告。
2005年4月29日,河北省電子政務(wù)“112”工程順利通過國家信息化專家組的評審,開始在電子政務(wù)建設(shè)中發(fā)揮效用。
關(guān)鍵詞:知識庫;農(nóng)業(yè)信息分類;mysql
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)32-7560-02
Abstract: Through the research on database technology and techniques for classification of agricultural information, designing the structure of agricultural technology database and developing the agricultural information acquisition system, provides the input interface for the agricultural knowledge acquisition. The design of agricultural database building a foundation for the developing of agricultural knowledge retrieval system. The practical application proves that, the agricultural knowledge database providing a good support for the development of agricultural information retrieval system.
Key word: knowledge database; agricultural information classification; mysql
新疆地域遼闊,農(nóng)業(yè)、牧業(yè)生產(chǎn)較分散,特別是牧民生產(chǎn)生活地點不固定,農(nóng)業(yè)科技人員很難進(jìn)行定點科技服務(wù)。通過農(nóng)業(yè)知識庫建設(shè),建立農(nóng)業(yè)信息話務(wù)咨詢中心,農(nóng)牧民在田間地頭通過為農(nóng)服務(wù)熱線即可咨詢生產(chǎn)過程中遇到的各種問題,這將大大提高我區(qū)為農(nóng)服務(wù)水平,及時幫助農(nóng)戶快速解決生產(chǎn)中遇到的各種問題,提高為農(nóng)服務(wù)質(zhì)量,促進(jìn)我區(qū)農(nóng)、林、牧、副、漁業(yè)快速發(fā)展。因此農(nóng)業(yè)知識庫的構(gòu)建與實現(xiàn)是建立農(nóng)業(yè)信息話務(wù)中心的迫切需求。
1 農(nóng)業(yè)信息分類
農(nóng)業(yè)知識庫需要儲存大量的農(nóng)業(yè)數(shù)據(jù),為了合理的構(gòu)建農(nóng)業(yè)知識庫,需要研究農(nóng)業(yè)信息科學(xué)的分類方法。經(jīng)過調(diào)查研究、咨詢相關(guān)專家以及查閱相關(guān)書籍,依據(jù)“農(nóng)業(yè)信息分類標(biāo)準(zhǔn)草案”,我們將農(nóng)業(yè)信息分為種植業(yè)及制品、漁業(yè)、畜牧業(yè)、農(nóng)業(yè)生產(chǎn)資料、園林、農(nóng)機(jī)械、植物病理、動物病理類,每個大類下面又分二級類別、三級類別、四級類別。以種植業(yè)及其制品為例,其二級類別又可分為糧食作物、經(jīng)濟(jì)作物、蔬菜、瓜果類、油類。二級類別下又設(shè)三級類別,以糧食作物為例其三級類別又可分為谷物,三級類別下又設(shè)四級類別,以谷物為例,其四級類別包括大麥、燕麥、蕎麥、青稞等具體植物;經(jīng)濟(jì)作物的三級級類別又可分為油料、豆類、棉麻、糖類作物。油料的四級類別又分為花生、油菜、芥菜等植物;豆類的四級類別包括大豆、蠶豆、豌豆、等植物;棉、麻的四級類別包括棉花、細(xì)絨棉、木棉、野麻、劍麻等植物;糖類作物的四級類別包括甘蔗、甜菜。蔬菜的三級類別又可分為根菜類、莖菜類、葉菜類、花菜類、果菜類、種子類。根菜的四級類別分為蘿卜、大頭菜、牛蒡等植物;莖菜類的四級類別又分為馬鈴薯、菊芋、藕等植物;葉菜類的四級類別包括小白菜、菠菜、芹菜等植物;花菜類下面有花椰菜、青花菜、金針菜等植物;果菜類四級類別包括黃瓜、南瓜、苦瓜等植物;種菜類四級類別包括籽用西瓜、蓮子、芡實;瓜果類三級類別包括瓜類、果類、堅果、干果。瓜類四級類別包括西瓜、甜瓜、哈密瓜等植物;果類下面有蘋果、桃、石榴等植物;堅果、干果下面有按巴旦木、核桃、葡萄干等植物。油類又可分為食用油。食用油下面有花生油、豆油、菜籽油等。按照這樣的方法將其余七類由大至小細(xì)分。
3 知識錄入系統(tǒng)的設(shè)計與實現(xiàn)
知識庫數(shù)據(jù)的獲取主要包括三種途徑,第一種途徑是通過網(wǎng)絡(luò)爬蟲從相關(guān)農(nóng)業(yè)網(wǎng)站抓取信息,然后分類導(dǎo)入知識庫,第二種途徑為人工錄入已掌握的大量農(nóng)業(yè)科技信息,第三種途徑為用戶檢索過程中查詢不到的關(guān)鍵詞經(jīng)客服人員搜索再次錄入知識庫,通過這三種途徑不斷豐富農(nóng)業(yè)知識庫,為方便人工錄入,開發(fā)了農(nóng)業(yè)知識庫錄入接口,開發(fā)技術(shù)采用jsp+servlet+strus,服務(wù)器使用fedora14.農(nóng)業(yè)知識錄入界面如圖2。
在知識錄入過程中,首先要選擇所錄農(nóng)業(yè)科技知識所屬一級類別、二級類別、三級類別和四級類別,然后在標(biāo)題欄中輸入農(nóng)業(yè)知識標(biāo)題,在內(nèi)容欄中輸入農(nóng)業(yè)知識內(nèi)容,點擊提交即可。農(nóng)業(yè)信息的分類不但利于數(shù)據(jù)的存儲,而且為后期開發(fā)農(nóng)業(yè)科技知識檢索系統(tǒng)及用戶個性信息定制提供了基礎(chǔ)。
4 結(jié)束語
目前該知識庫已設(shè)計完畢,數(shù)據(jù)錄入工作正在進(jìn)行,已錄入農(nóng)業(yè)科技知識3000余條,網(wǎng)絡(luò)爬蟲采集數(shù)據(jù)經(jīng)分類入庫350多萬條,為農(nóng)業(yè)知識檢索系統(tǒng)提供了數(shù)據(jù)支持,起到了為農(nóng)服務(wù)的目的。
參考文獻(xiàn):
[1] 李永可,李悅,陳燕紅,等.農(nóng)業(yè)知識檢索系統(tǒng)的設(shè)計與實現(xiàn)[J].電腦知識與技術(shù),2014,10(23):5449-5452.
[2] 李永可,張?zhí)t,馮向萍.中文農(nóng)業(yè)網(wǎng)站多元線性回歸識別研究[J].新疆農(nóng)業(yè)大學(xué)學(xué)報,2011,34(5):442-446.
[3] 胡毅,劉波,方逵.農(nóng)業(yè)知識庫知識檢索系統(tǒng)研究與實現(xiàn)[J].農(nóng)機(jī)化研究,2013(6):13-18.
[4] 王玉娟.農(nóng)業(yè)知識文本庫檢索系統(tǒng)關(guān)鍵技術(shù)研究[D].長沙:湖南農(nóng)業(yè)大學(xué),2012.
[5] 王斌.信息檢索導(dǎo)論[M].北京:人民郵電出版社,2010.
[6] 王玉娟,方逵.農(nóng)業(yè)知識庫檢索系統(tǒng)探索[J].寧夏農(nóng)林科技.2012(4):24-27
[7] 羅武.農(nóng)業(yè)知識庫知識錄入系統(tǒng)關(guān)鍵技術(shù)研究與實現(xiàn)[D].長沙:湖南農(nóng)業(yè)大學(xué),2011.
P鍵詞:工程項目 WBS 計算機(jī)
一、WBS簡介
Work Breakdown Structure(WBS)是一種全面系統(tǒng)的工程項目分析法,是項目管理的基礎(chǔ)性工作。[1]它可以將龐大的工程分解為方便管理的工作包,這樣可以增加對工程的費(fèi)用、進(jìn)度和質(zhì)量控制的準(zhǔn)確度。早在在上世紀(jì)七八十年代,就成為國際上進(jìn)行工程項目管理的基本方法。
WBS是一個由軟件、硬件、服務(wù)以及資料組成的以產(chǎn)品為中心的層次體系,它確定了整個項目工程的走向,對項目工程起到了決定作用。[2]WBS可以對需要進(jìn)行研制或者生產(chǎn)的產(chǎn)品進(jìn)行顯示并且在最終的產(chǎn)品與工作單元之間建立起一座橋梁,在確定產(chǎn)品單元時起著至關(guān)重要的作用。WBS具體可以分為四類,分別為:綱要性WBS、項目綱要性WBS,合同WBS和項目WBS,它的建立必須遵守整體性、系統(tǒng)性和可追溯性的原則,這是WBS作為工程項目管理的要求。那么,為了實現(xiàn)這三項原則,在針對WBS進(jìn)行設(shè)計時要特別注意結(jié)構(gòu)、代碼和報告這三要素的設(shè)計。
二、工作包模型
工作包是工作包模型的基本構(gòu)成單元,而工作包又是在對項目進(jìn)行分解后的結(jié)果上形成的。工作包模型的思路就是將工作包作為整個項目的具體控制對象,實現(xiàn)高效化管理。工期控制、費(fèi)用控制等在項目進(jìn)行中對各個單元的控制都可以成為工作包的控制對象,這樣一來可以為整個工程提供一個完整準(zhǔn)確的的信息。由于工作包的上述屬性導(dǎo)致由其組成的層次結(jié)構(gòu)體系在反映工程項目生產(chǎn)過程的同時還可以反映項目的內(nèi)部聯(lián)系和目標(biāo)要求,進(jìn)而支持項目控制的整個過程。
在工作包模型建立后,可以利用計算機(jī)數(shù)據(jù)庫技術(shù)對整個工程項目進(jìn)行集成化管理。工程項目的分類與編碼關(guān)系到計算機(jī)在工程項目中充分發(fā)揮自身的功能,因此工作包的建立尤其重要。
如圖一所示工作包模型:
圖一:工作包模型
三、工程項目信息的分類體系
工程項目信息分類體系始于西方國家,經(jīng)過幾十年的發(fā)展演變已經(jīng)形成了多個體系,其分類領(lǐng)域也逐漸擴(kuò)大。[3]這一演變正是工程項目信息管理內(nèi)容增加的寫照。信息分類是建立WBS 的基礎(chǔ),因為不同的項目參與者有不同的理解,他們各自按照自身從事的行業(yè)來制定信息分類體系,這些體系勢必會與信息分類體系對應(yīng)的編碼體系有所差別。這大大影響了項目參與者與各方的信息交流,為計算機(jī)技術(shù)在建筑業(yè)中的應(yīng)用帶來了不便。
在眾多工程項目信息分類體系中,ISO集眾家之所長提出了按照空間和工種的特性、設(shè)施種類、建筑材料等逐層分解的方法。這種方法目前應(yīng)用最為廣泛,具體分類標(biāo)準(zhǔn)如下:
1.設(shè)施:按照用途劃分,比如房屋、道路、車站、廠房、大壩等。
2.空間:按照范圍構(gòu)成劃分,比如招待所、公寓樓、娛樂區(qū)、辦公樓、道路區(qū)等。
3.分部:按照設(shè)施的物理構(gòu)成部分以及一定的功能性劃分。比如外墻、供熱系統(tǒng)、電力系統(tǒng)等。
4.工作段:按照工種特性來分,且必須小于分部。比如結(jié)構(gòu)工程電氣工程等。
5.建筑配件和材料:工程項目永久性的一部分,按照不同用途來進(jìn)行分類。比如用于大壩觀測、用于觀測自動化系統(tǒng)信號傳遞等。
6.建筑輔助:在工程項目中國其臨時作用且不構(gòu)成永久性的部分,比如梯子、腳手架、設(shè)備等。
這個ISO技術(shù)報告框架是多國專家學(xué)者在對本國具體工程項目進(jìn)行研究后得出的工程項目分類和編碼體系。這種分類體系是在ISO技術(shù)報告上進(jìn)行細(xì)分后產(chǎn)生的,使得層次更加清晰結(jié)構(gòu)更見簡單明了,更好的突出了重點,有利于對工程項目的整體控制且包括了所有的土木工程,適合WBS的編制。
四、工程項目信息編碼的內(nèi)容與方式
對項目分解體系進(jìn)行編碼是項目信息編碼的主要內(nèi)容,包括時間上、參與者(建設(shè)方、設(shè)計方、承包商等)建筑材料、建筑設(shè)備等有型資源的編碼和項目文檔的編碼等。
編碼可以采用字母和符號等多種方式來進(jìn)行。比較常見的簡單編碼結(jié)構(gòu)主要是樹狀結(jié)構(gòu),這種結(jié)構(gòu)主要是指將下一級的編碼進(jìn)行匯總后形成上一級,是一個如樹狀的包含關(guān)系。這種編碼方式雖然有利于信息的匯總但是這種分類方法缺陷很多,比如在擴(kuò)展性上就受到了本身結(jié)構(gòu)的限制。而比較復(fù)雜的編碼方式有分面結(jié)構(gòu),就是指將編碼分為不同的部分,然后對其進(jìn)行結(jié)合形成完整的意義。這種結(jié)構(gòu)相對于上述的樹狀結(jié)構(gòu)擴(kuò)展性更強(qiáng)。第三種編碼方式是結(jié)合了前兩種方式產(chǎn)生的,是指在保持樹狀結(jié)構(gòu)的同時改善匯總方式,采取不同組合的方法增強(qiáng)擴(kuò)展力度。
以上三種編碼方式已經(jīng)被廣泛應(yīng)用于各個國家或者地區(qū)的項目編碼體系中,但是隨著計算機(jī)應(yīng)用技術(shù)水平的逐步提高,國際上比較認(rèn)可的是第二種方式即分面結(jié)構(gòu)。綜上所述,不同的編碼方式有不同的優(yōu)點與缺點,應(yīng)該根據(jù)具體情況具體分析,選擇最佳的編碼方式,保證項目的穩(wěn)定性與兼容性。
五、結(jié)語
工程項目的建設(shè)必定會產(chǎn)生大量的數(shù)據(jù),那么對數(shù)據(jù)進(jìn)行有效的分析與整理就成為了項目管理的重點。為了滿足工作包模型及數(shù)據(jù)結(jié)構(gòu)建立的需要,應(yīng)當(dāng)對工程項目中產(chǎn)生的數(shù)據(jù)進(jìn)行重點統(tǒng)計分析,利用計算機(jī)技術(shù),綜合整體的工程項目進(jìn)行取舍,建立起工作包的關(guān)系模型。隨后透過關(guān)系模型建立數(shù)據(jù)庫模型就大大的降低了難度,更加快捷簡單。計算據(jù)數(shù)據(jù)庫是整個工程項目中應(yīng)用計算機(jī)技術(shù)最為重要的部分,只有將工作包與計算機(jī)緊密結(jié)合才可能實現(xiàn)管理手段的飛躍。而將其結(jié)合的方式就是建立工作包,這樣可以極大的提高項目管理效率,實現(xiàn)高效管理。這樣可以使管理者更加靈活有效的組織調(diào)控項目計劃,對整個項目在宏觀上有足夠的認(rèn)識。除此之外,WBS的運(yùn)用還可以對項目實施中的進(jìn)度、費(fèi)用等進(jìn)行嚴(yán)格的控制,保證項目按照計在控制中實施,實現(xiàn)效率與質(zhì)量的雙贏。
參考文獻(xiàn):
[1]劉金星.改進(jìn)的WBS方法在工程項目管理中的應(yīng)用[J].建筑經(jīng)濟(jì),2011(6):18-21
[2]王俊軍.WBS方法在工程項目管理中的應(yīng)用探討[J].工程技術(shù),2016(9):283-283
[3]張波.工程項目管理中WBS分解及實現(xiàn)的探討[J].中國西部科技,2014(6):4-6
[關(guān)鍵詞]Web3.0分眾分類標(biāo)簽
[分類號]TP393 G254
隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,Web2.0以應(yīng)用的開放性、信息傳播的交互性、讀寫并存的表達(dá)方式、社會化的聯(lián)合方式和便捷化的體驗方式,使得越來越多的網(wǎng)民參與到互聯(lián)網(wǎng)信息的創(chuàng)造及中。然而,隨著信息量的快速增長,由此衍生的信息雜亂無章、信息的純凈度和可信度大大降低、搜索引擎精準(zhǔn)度下降等問題相繼出現(xiàn)在互聯(lián)網(wǎng)用戶面前,網(wǎng)民越來越期待及時準(zhǔn)確地獲得切合自身需求的信息和知識,以及便捷的互動交流和信息的協(xié)同共享。面對這一問題,網(wǎng)絡(luò)模式急需更新?lián)Q代,能夠為用戶提供一種更加高效、精確和個性化的互聯(lián)網(wǎng)平臺的Web3.0模式成為首選的解決方案。
1 Web3.0及其特征
Web3.0是新一代互聯(lián)網(wǎng)應(yīng)用的統(tǒng)稱,它是建立在Web2.0的基礎(chǔ)上,包含了Web2.0的所有特點,但同時為了讓人們更好地利用網(wǎng)絡(luò)資源,Web3.0提供了一種方便管理、方便查找信息資料,能夠自己控制一切的全新的服務(wù):網(wǎng)站內(nèi)的信息可以直接和其他網(wǎng)站相關(guān)信息進(jìn)行交互,能夠?qū)Χ嗉揖W(wǎng)站的信息進(jìn)行整合使用,并能根據(jù)用戶需求,智能化處理互聯(lián)網(wǎng)海量信息的整合,最終聚合用戶個性化的需求,同時實現(xiàn)真正意義上的互聯(lián)互通??傊?,相對于Web1.0的“瀏覽和下載”、Web2.0的“參與、展示和互動”,Web3.0的核心理念是“個性、精準(zhǔn)和智能”。其主要特征表現(xiàn)如下:
1.1個性化信息聚合
Web3.0最大的特點在于信息的聚合以及提供個性化的信息服務(wù),真正的Web3.0時代不僅僅是按照用戶需求提供綜合化服務(wù),創(chuàng)建綜合化服務(wù)平臺,更關(guān)鍵的是,把散布在互聯(lián)網(wǎng)上的各種信息點以及用戶的需求點聚合和對接起來,提供基于用戶偏好的個性化聚合服務(wù)。
1.2信息檢索的高精準(zhǔn)度
Web3.0在對于UGC(用戶生產(chǎn)內(nèi)容)篩選性過濾的基礎(chǔ)上同時引入偏好信息處理與個性化引擎技術(shù),對用戶的行為特征進(jìn)行分析,既尋找可信度高的UGC源,同時對互聯(lián)網(wǎng)用戶的搜索習(xí)慣進(jìn)行整理、挖掘,得出最佳的設(shè)計方案,幫助互聯(lián)網(wǎng)用戶快速、準(zhǔn)確地搜索到自己想要感興趣的信息內(nèi)容,避免了大量信息帶來的搜索疲勞。
1.3搜索引擎的智能化
Web3.0時代的網(wǎng)絡(luò)是智能網(wǎng)絡(luò),這是一個以整個互聯(lián)網(wǎng)為基礎(chǔ),聚合了所有知識的智能平臺。在這樣的平臺上,用戶可用自然語言表達(dá)自己的查詢意圖,搜索引擎能夠?qū)Σ樵冞M(jìn)行解析,提取相關(guān)概念,組合查詢表達(dá)式,從而返回準(zhǔn)確的結(jié)果;甚至,用戶可以提出完整的問題,通過搜索獲得一些問題的解決方案。
1.4多種終端平臺、跨網(wǎng)站和跨語言信息交互
Web3.0不僅能夠?qū)崿F(xiàn)不同網(wǎng)站間的信息交互,而且還能實現(xiàn)不同終端的兼容。通過互聯(lián)網(wǎng)與通信的融合,用戶可以用所有智能終端(固定電話、移動電話、PC、IPTV以及其他智能終端)輕松享受看得見、聽得到、用得好、即時交互的信息服務(wù)。另外,Web3.0的智能翻譯引擎突破了國家、語言的限制,使用戶用自己的母語可以與全世界所有人進(jìn)行交流,實現(xiàn)了更大范圍內(nèi)的信息交流與共享。
2 分眾分類及其特征
分眾分類(Folksonomy)是隨著Web2.0而產(chǎn)生的新型網(wǎng)絡(luò)信息分類法,也叫大眾分類、社會分類、自由分類等,它就是由網(wǎng)絡(luò)信息用戶自發(fā)地為某類信息定義一組標(biāo)簽(Tag)進(jìn)行描述,并最終根據(jù)標(biāo)簽被使用的頻次選用高頻標(biāo)簽作為該類信息類名的一種為網(wǎng)絡(luò)信息分類的方法。其實質(zhì)就是以詞為類,但其類目卻是平面的、非等級的,它是用戶用標(biāo)簽對感興趣的資料進(jìn)行分類,并與他人共享標(biāo)簽的過程和結(jié)果。
2.1分眾分類的優(yōu)勢
與傳統(tǒng)網(wǎng)絡(luò)信息分類方法相比,分眾分類最大的不同之處在于,它并不采用嚴(yán)格的分類標(biāo)準(zhǔn),其分類全部由用戶直接提交,分類的形成過程完全是自發(fā)的。分眾分類的主要機(jī)制基于“開放性元數(shù)據(jù)標(biāo)準(zhǔn)”和“自然語言社群聚類”。其優(yōu)勢主要表現(xiàn)在:首先,分眾分類的標(biāo)簽形成過程充分體現(xiàn)了其自由性,任何用戶都可以自由選擇自然語言語詞來對感興趣的資源進(jìn)行標(biāo)注,從而可以從多個維度來揭示信息內(nèi)容;其次,分眾分類具備實時性與適應(yīng)性,用戶可以隨時對其閱讀或創(chuàng)建的內(nèi)容和主題創(chuàng)建標(biāo)簽,并立即保存下來,并被允許即時快速的進(jìn)行標(biāo)簽用語的修改;第三,分眾分類為用戶提供了共享標(biāo)簽的功能,任何人對內(nèi)容進(jìn)行標(biāo)注后,他人可立刻看到這些標(biāo)簽,也可以點擊這些標(biāo)簽,進(jìn)而看到更多使用這個標(biāo)簽的信息內(nèi)容,或是與此相近的內(nèi)容。
2.2分眾分類的局限
作為使用非控詞匯的分眾分類目前還存在一定的局限性,具體表現(xiàn)如下:
2.2.1標(biāo)簽的多樣性 由于用戶認(rèn)知程度不同,對同一事物的揭示程度也存在很大的差異,導(dǎo)致不同用戶在標(biāo)注同一信息時使用了不同的標(biāo)簽,但是系統(tǒng)卻無法創(chuàng)建這些標(biāo)簽之間的聯(lián)系。標(biāo)簽的多樣性極大的影響系統(tǒng)的檢全率。
2.2.2標(biāo)簽的模糊性 分眾分類是一種基于標(biāo)簽語法層次的簡單聚合分類,因此,同一標(biāo)簽可能映射出不同語義的資源,而系統(tǒng)卻不能識別出各個語義的不同。標(biāo)簽的模糊性使用戶不得不花更多的時間和精力找到與檢索標(biāo)簽相關(guān)的記錄,因而影響到系統(tǒng)的檢準(zhǔn)率。
2.2.3標(biāo)簽的扁平化組織 分眾分類的組織方式與傳統(tǒng)的等級體系分類法組織方式不同,它是扁平化的,沒有等級層次的劃分。因此,系統(tǒng)無法識別各個標(biāo)簽之間的等級層次聯(lián)系。一方面,這種由于標(biāo)簽缺乏等級控制造成的信息分散也必然影響了信息的檢全率;另一方面,類目的平面非等級顯示同樣會隱藏一些有價值的信息。同時,信息越多利用標(biāo)簽直接找到相關(guān)信息就越困難。
2.2.4系統(tǒng)間的交互性很低 很多網(wǎng)絡(luò)系統(tǒng)都具有標(biāo)注資源和分享標(biāo)簽的能力,但是目前各個分眾分類系統(tǒng)在語義表達(dá)和格式規(guī)范上并不一致,這不僅阻礙了各個系統(tǒng)之間的信息交互和軟件的自動化處理,同時也引發(fā)了一系列檢索方面的問題。另外,受語言、文化背景等因素的影響,跨國界、跨文化的分眾分類系統(tǒng)之間的交互性更低。
2.2.5標(biāo)簽問語義關(guān)系缺乏 分眾分類是以高頻標(biāo)簽作為類目的一種信息分類方法,其分類結(jié)構(gòu)是平面的,標(biāo)簽間是平等關(guān)系,缺乏對標(biāo)簽間的層次體系關(guān)系、屬性關(guān)系和其他的復(fù)雜語義關(guān)系的描述,而標(biāo)簽間語義關(guān)系的缺乏不僅影響到檢索的精準(zhǔn)度,更重要的是對智能化搜索帶來諸多障礙。
3 Web3.0對分眾分類的需求
Web3.0的基礎(chǔ)是Web2.0,因而,分眾分類也是Web3.0的一種主要的信息組織方式。但是目前分眾分類所具有的上述局限性顯然阻礙了Web3.0的核心理念――“精準(zhǔn)、個性和智能”的真正實現(xiàn),Web3.0的發(fā)展需求決定了分眾分類的發(fā)展方向,因而,未來的分眾分類還需要在以下幾個方面進(jìn)一步拓展。
3.1微內(nèi)容的自由整合與過濾研究
微內(nèi)容是Web3.0的基本信息單元,由于Web3.0同樣具有草根性,其內(nèi)容良莠不齊,有價值的專業(yè)分析討論與各種雜談閑聊摻雜在一起,因而首先需要對微內(nèi)容進(jìn)行篩選性的過濾研究。這部分的研究主要包括:研究分析用戶的行為特征,尋找可信度高的微內(nèi)容源;對微內(nèi)容的價值進(jìn)行判定,并按價值量的高低作不同處理;對垃圾信息進(jìn)行有效過濾等等;其次,研究如何應(yīng)用Mashup技術(shù)對用戶生成的微內(nèi)容進(jìn)行整合,如何利用ONTO/RSS基礎(chǔ)聚合技術(shù)對微內(nèi)容進(jìn)行有效聚合,從而使信息的特征性更加明顯,為實現(xiàn)Web3.0的“個性化”打下基礎(chǔ)。
3.2微內(nèi)容的標(biāo)準(zhǔn)化與結(jié)構(gòu)化研究
要實現(xiàn)Web3.0的跨平臺、跨社區(qū)、跨語言的信息共享,需要對微內(nèi)容進(jìn)行標(biāo)準(zhǔn)化與結(jié)構(gòu)化研究,提出一個通用的數(shù)據(jù)標(biāo)準(zhǔn)。這方面的研究主要包括微內(nèi)容的拆分標(biāo)準(zhǔn)、屬性選擇、結(jié)構(gòu)化表征、數(shù)據(jù)邏輯結(jié)構(gòu)標(biāo)準(zhǔn)以及數(shù)據(jù)的存儲結(jié)構(gòu)標(biāo)準(zhǔn)等,其目的是使微信息之間實現(xiàn)互動,讓W(xué)eb完全可編程,從而滿足復(fù)雜程序的需求,為信息在不同的應(yīng)用平臺之間的整合和傳播提供支撐。目前,有關(guān)微內(nèi)容的標(biāo)準(zhǔn)化和結(jié)構(gòu)化的研究則僅限于企業(yè)網(wǎng)站的構(gòu)建,如紅門資訊在微內(nèi)容的拆分、詞義標(biāo)準(zhǔn)化和結(jié)構(gòu)化等方面進(jìn)行了深入的研究,其推出的公用信息平臺已經(jīng)實現(xiàn)了廠家信息、商家信息、品牌信息、文章信息等160多類信息平臺間的自由互動。但目前整個IT行業(yè)中并沒有一套完善的有關(guān)微內(nèi)容的拆分、屬性選擇、結(jié)構(gòu)化表示等方面的標(biāo)準(zhǔn),這對實現(xiàn)整個互聯(lián)網(wǎng)信息的無縫連接帶來障礙。
3.3標(biāo)注的規(guī)范控制研究
Web3.0核心理念之一是“精準(zhǔn)”,而因為網(wǎng)絡(luò)用戶標(biāo)注行為缺乏控制,導(dǎo)致標(biāo)簽的多樣性、模糊性和隨意性等缺點,進(jìn)而影響到檢索的精準(zhǔn)度,因而需要對用戶的標(biāo)注行為進(jìn)行規(guī)范性控制。主要研究包括:如何利用受控詞表等對同義詞、近義詞、專有名詞等進(jìn)行限定,并構(gòu)建規(guī)范的標(biāo)引詞庫推薦用戶使用;如何確定標(biāo)簽的含義以及標(biāo)簽間的關(guān)聯(lián),以幫助用戶在創(chuàng)建標(biāo)簽時進(jìn)行選擇;如何利用后控手段對不斷產(chǎn)生的大量標(biāo)簽進(jìn)行篩選、融合和規(guī)范化處理,并將其與核心標(biāo)簽關(guān)聯(lián)等等。其目的避免網(wǎng)絡(luò)用戶生產(chǎn)出各種錯誤的、無意義的、不規(guī)則的標(biāo)簽,從而提高標(biāo)簽系統(tǒng)的準(zhǔn)確性、兼容性和開放性,以實現(xiàn)標(biāo)簽集合的移植與共享,促進(jìn)不同網(wǎng)絡(luò)信息系統(tǒng)對信息資源的協(xié)同組織。目前,國內(nèi)外學(xué)者都對標(biāo)簽的規(guī)范控制研究顯示出極大的興趣,紛紛提出了多種規(guī)范標(biāo)注行為,從而提高標(biāo)簽質(zhì)量的解決措施,如有些網(wǎng)站在用戶標(biāo)注時提供一些規(guī)范詞供用戶選擇,或?qū)τ脩舻臉?biāo)注結(jié)果進(jìn)行詞義轉(zhuǎn)換等,但總的來說研究的系統(tǒng)性不夠,其深度和廣度都有待加深與拓寬,從而提高檢索的“精準(zhǔn)度”。
3.4標(biāo)簽的基本屬性研究
標(biāo)簽是分眾分類形成和使用的基礎(chǔ),也是分眾分類類目體系的基本構(gòu)成單元。標(biāo)簽指代并標(biāo)示W(wǎng)eb3.0環(huán)境中的各種微內(nèi)容,通過查找標(biāo)簽?zāi)軌驒z索到關(guān)聯(lián)的微內(nèi)容。因而,標(biāo)簽本身的相關(guān)屬性決著信息檢索的質(zhì)量和效率,所以,需要對標(biāo)簽的特征、標(biāo)簽的價值判定(包括垃圾標(biāo)簽的處理)、標(biāo)簽使用量的分布規(guī)律、標(biāo)簽的賦予權(quán)、標(biāo)簽的翻譯、標(biāo)簽庫的構(gòu)建等展開進(jìn)一步的研究;同時,因為目前的標(biāo)簽比較側(cè)重于橫向關(guān)系的表達(dá),而專業(yè)性、學(xué)術(shù)性信息的表達(dá)則需要縱向和橫向兩個方面的參照系,因而,如何加強(qiáng)縱向關(guān)系的表達(dá),仍然有待于進(jìn)一步研究。目前,對標(biāo)簽的特征、標(biāo)簽價值判定的相關(guān)研究比較多,而對標(biāo)簽使用量的分布規(guī)律、標(biāo)簽的賦予權(quán)、標(biāo)簽的翻譯、標(biāo)簽庫的構(gòu)建等方面的研究相對較少。
3.5傳統(tǒng)分類法與大眾分類法的融合研究
分眾分類是由網(wǎng)絡(luò)用戶的自發(fā)標(biāo)引行為產(chǎn)生,盡管這在一定程度上體現(xiàn)了用戶對知識分類的共性,但由于不同使用目的對信息的類分會使得相同的信息被劃分在不同的類別中。這種平面勝的分類體系,既無法準(zhǔn)確地表達(dá)出相關(guān)標(biāo)簽的層次,也難揭示出信息之間復(fù)雜的關(guān)系;另外,受大眾淺層信息需求的誤導(dǎo),很多有價值的信息也容易被淹沒。因而,分眾分類的質(zhì)量無法滿足Web3.0檢索精準(zhǔn)度的需求。而傳統(tǒng)分類法特別是文獻(xiàn)分類法歷史悠久,在一定程度上體現(xiàn)了知識分類的科學(xué)性。為此,應(yīng)該將分眾分類與傳統(tǒng)分類法進(jìn)行融合,以提高信息分類的質(zhì)量和效率,如可先對選定范圍內(nèi)全部信息劃分大類的基礎(chǔ)上允許網(wǎng)絡(luò)用戶再進(jìn)行知識細(xì)分。把眾多的標(biāo)簽先按人為大類存放,既增強(qiáng)了標(biāo)引一致性,又降低了平面非等級結(jié)構(gòu)的標(biāo)簽所帶來的檢索難度。
3.6標(biāo)簽的聚類研究
由于分眾分類允許用戶使用不同的標(biāo)簽來標(biāo)記相似的資源,但并不了解這些標(biāo)簽之間的關(guān)系,因而其內(nèi)容檢索機(jī)制受到嚴(yán)重的阻礙。為克服這一局限,有必要針對標(biāo)簽的統(tǒng)計學(xué)規(guī)律、標(biāo)簽間的共現(xiàn)分析、層次分析、標(biāo)簽與特定人和物的相關(guān)度、標(biāo)簽間的相似度比較等問題進(jìn)行聚類分析,其目的是尋找相關(guān)標(biāo)簽群,從而形成立體的分類體系,并在此基礎(chǔ)上展開標(biāo)簽關(guān)系庫的構(gòu)建研究。顯然,這部分的研究有助于實現(xiàn)Web3.0的“精準(zhǔn)”和“個性化信息聚合”。
3.7標(biāo)簽間的關(guān)聯(lián)研究
Web3.0的特征之一是要讓用戶跨越不同的應(yīng)用平臺,并共享不同社區(qū)的信息資源,而這種信息的共享除了需要相關(guān)內(nèi)容的標(biāo)準(zhǔn)化、結(jié)構(gòu)化和規(guī)范化研究外,更重要的是通過標(biāo)簽的方式進(jìn)行相互鏈接,現(xiàn)有的標(biāo)簽只能做到對站內(nèi)的關(guān)鍵詞進(jìn)行關(guān)聯(lián),不同網(wǎng)站之間站信息沒有形成真正的網(wǎng)絡(luò)和關(guān)聯(lián),往往存在信息“孤島”,常常要借助其他的搜索引擎,因而未來的研究應(yīng)該著重予標(biāo)簽間關(guān)聯(lián)的深化研究。一方面,研究同一網(wǎng)站中同一文本和不同文本間的所有標(biāo)簽之間的自動鏈接技術(shù);另一方面,研究不同網(wǎng)站間標(biāo)簽的關(guān)聯(lián),從而在更大范圍、更高層次上建立起詞間關(guān)系網(wǎng)絡(luò),為實現(xiàn)Web3.0的“跨平臺”信息交互打下基礎(chǔ)。
3.8標(biāo)簽與本體的結(jié)合研究
本體是在語義網(wǎng)環(huán)境下為解決語義歧義、實現(xiàn)信息智能處理而提出的一種形式化描述的、共享的概念認(rèn)知模型,它是對某一領(lǐng)域知識的規(guī)范化描述,不僅提供了概念明確的定義,而且揭示了概念問豐富的語義關(guān)系,使知識能夠在人與人之間、人和系統(tǒng)之間以及各種異構(gòu)系統(tǒng)之間進(jìn)行廣泛的共享和交流。顯然,本體所具備的特性正好彌補(bǔ)了分眾分類的許多不足,因而,需要充分挖掘標(biāo)簽間的語義關(guān)系,將標(biāo)簽與本體進(jìn)行結(jié)合研究。具體研究包括:分析分眾分類中用戶、網(wǎng)絡(luò)資源和標(biāo)簽三者之間的同現(xiàn)關(guān)系,對分眾分類中的各種標(biāo)簽進(jìn)行語義分析,研究標(biāo)簽之間的主題相關(guān)性,并給出這些標(biāo)簽間相互關(guān)系的明確定義,同時探討如何基于標(biāo)簽的語義關(guān)系構(gòu)建被標(biāo)注對象之間的聯(lián)系,并在標(biāo)簽中建立起概念層次,構(gòu)建大眾標(biāo)注中各類標(biāo)簽詞的本體,從而構(gòu)成語義Web的基礎(chǔ),真正實現(xiàn)web3.0的“智能化”。目前,這方面的研究多集中在標(biāo)簽語義的提取、標(biāo)簽本體的構(gòu)建等方面,并推出了多種語義標(biāo)注平臺。但是目前在大多數(shù)語義標(biāo)注的過程中仍需要大量人工的輔助,標(biāo)注平臺的可用性、互用性、重用性和擴(kuò)展性較差,需要進(jìn)一步提高。
3.9用戶興趣模型構(gòu)建研究
概念模型的作用
概念模型是對某一領(lǐng)域信息高度抽象化的靜態(tài)描述,它包括類、類關(guān)聯(lián)和類屬性等模型基本元素的定義,是進(jìn)一步細(xì)化應(yīng)用系統(tǒng)模型的基礎(chǔ)。
1994年,國際標(biāo)準(zhǔn)化組織第215技術(shù)委員會提出了“衛(wèi)生信息建??蚣堋?。該框架說明了信息模型應(yīng)當(dāng)是由概念模型到邏輯模型,最后細(xì)化到物理模型。2002年美國CDC在“公共衛(wèi)生概念數(shù)據(jù)模型”一文中提出信息模型可劃分為主題域模型、類關(guān)系模型、概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型、數(shù)據(jù)庫設(shè)計模型和物理數(shù)據(jù)庫模型,它們分別處于上、中、下三個層級,這種層級關(guān)系與ISO提出的層級結(jié)構(gòu)一致,只是美國CDC的層級劃分更加細(xì)致。
因此,概念模型是連接高層模型和低層模型的橋梁和紐帶。對于一個具體信息的開發(fā)過程而言,上層模型在某個領(lǐng)域內(nèi)是高度抽象和概括的,它們不涉及過多的細(xì)節(jié),獨(dú)立于具體的信息系統(tǒng); 對整個領(lǐng)域的信息化建設(shè)都具有指導(dǎo)意義,它是信息標(biāo)準(zhǔn)化的基礎(chǔ)。
公共衛(wèi)生信息領(lǐng)域具有多領(lǐng)域跨學(xué)科的特點。概念模型提供了一個易于理解的公共衛(wèi)生信息的整體框架,是公共衛(wèi)生數(shù)據(jù)字典的基礎(chǔ)框架。在概念模型的指導(dǎo)下,對公共衛(wèi)生數(shù)據(jù)元的理解和應(yīng)用變得更加方便和容易。因此,概念模型將為公共衛(wèi)生信息系統(tǒng)的開發(fā)提供一個整體框架和數(shù)據(jù)應(yīng)用指南。
在公共衛(wèi)生信息領(lǐng)域內(nèi),該概念模型可以支持多個信息系統(tǒng)的開發(fā),減少重復(fù)性工作,降低開發(fā)成本,加快系統(tǒng)的開發(fā)速度。在同一個概念模型指導(dǎo)下開發(fā)的多個系統(tǒng)間具有良好的一致性,同時也為系統(tǒng)間的數(shù)據(jù)交換與共享奠定良好基礎(chǔ)。
概念模型的構(gòu)建方法
對于一個具體系統(tǒng)而言,建立一個模型不是很困難,但建立一個抽象的元模型――概念模型則要困難得多。建立國家公共衛(wèi)生概念模型需要經(jīng)歷從具體到抽象這樣一個反復(fù)的過程。HL7(Health Level 7)推薦的建立概念模型的技術(shù)路線與方法是從用例分析到信息分析,最后到建立概念信息模型。
類、類關(guān)聯(lián)、類屬性和數(shù)據(jù)類型是概念模型的重要組成部分。概念模型中的類屬性同樣具有較高的抽象性和一般性,發(fā)現(xiàn)這些屬性也需要經(jīng)過從具體實例分析――領(lǐng)域信息分析――概念信息模型分析這樣一個抽象與泛化的過程。
我國公共衛(wèi)生信息概念模型的構(gòu)建主要是通過以下步驟實現(xiàn)的:
1. 主題域的確定
信息是對于活動、活動關(guān)聯(lián)方以及它們之間關(guān)系的抽象與描述。在公共衛(wèi)生領(lǐng)域,參照美國CDC提出的公共衛(wèi)生概念數(shù)據(jù)模型(PHCDM),將我國公共衛(wèi)生劃分為衛(wèi)生相關(guān)活動、參與者、材料和位置4個主題域。其中衛(wèi)生相關(guān)活動是衛(wèi)生信息來源的主體,是四個主題域中最重要、最活躍的一個,而其余三個均為活動的關(guān)聯(lián)方,位置說明活動發(fā)生的地點,參與者為活動的參與方如衛(wèi)生服務(wù)的提供方或接受方,材料是活動中所涉及的物質(zhì),比如標(biāo)本、菌株等等。這些構(gòu)成了公共衛(wèi)生信息概念模型的四個主題域。
2. 類
具有相同屬性的同類事物、概念組成類。以上四個主題域各為一類,每個主題域下又可以分成若干主類。以衛(wèi)生相關(guān)活動為例,結(jié)合我國公共衛(wèi)生信息的分類框架,可以將衛(wèi)生相關(guān)活動抽象為四個主類――疾病預(yù)防控制、公共衛(wèi)生服務(wù)、公共衛(wèi)生管理及衛(wèi)生監(jiān)督。
3. 類關(guān)聯(lián)與屬性設(shè)置
類之間存在一定的聯(lián)系,稱為類關(guān)聯(lián),其作用在于使不同的類形成一個完整、聯(lián)系的結(jié)構(gòu)。在公共衛(wèi)生信息概念模型的建模中,主要涉及父子類關(guān)聯(lián),關(guān)系關(guān)聯(lián)和參與關(guān)聯(lián)三種類關(guān)聯(lián)。
父子類關(guān)聯(lián)指的是每個類(主類或子類)下面還可以根據(jù)實際劃分為若干更小的類。上位類(通稱為父類)與下位類(通稱為子類)關(guān)聯(lián)稱為父子類關(guān)聯(lián)。很顯然,子類對于父類的屬性有繼承的關(guān)系。
關(guān)系關(guān)聯(lián)描述的是在同一主類內(nèi)部各個類或者是實例之間的關(guān)聯(lián)關(guān)系,如疾病預(yù)防控制主類的不同活動之間(疫情暴發(fā)與檢測之間)的關(guān)系。
參與關(guān)聯(lián)則是指不同主類的類之間發(fā)生的關(guān)系。例如疫情監(jiān)測類(屬于衛(wèi)生相關(guān)活動主題域的某個類)與調(diào)查者(屬于參與者主題域的某個類),或者與標(biāo)本(屬于材料主題域中的某個類)之間存在參與的關(guān)系等。
屬性是對類以及類關(guān)聯(lián)所具有的特性的描述,是描述類的特征的元數(shù)據(jù),改變屬性的值可以改變類的行為和外觀。概念模型類屬性設(shè)置應(yīng)遵循HL7 RIM所規(guī)范的屬性格式及內(nèi)容,在此基礎(chǔ)上按照自身的需求精化、修飾屬性,形成模型獨(dú)特的屬性。
4. 概念模型的建模技術(shù)與方法
首先是應(yīng)用UML的用例分析方法進(jìn)行業(yè)務(wù)分析。這是指對業(yè)務(wù)過程中所有參與元素的拆解、對比、描述、再定義與組合。然后在用例分析的基礎(chǔ)上,進(jìn)行泛化分析。即對各組成元素進(jìn)行分析、判別、抽象,并歸納成不同的類。下圖1為在衛(wèi)生檢測中的幾個用例分析過程。圖2為泛化與抽象過程。經(jīng)過泛化與抽象,對衛(wèi)生檢測相關(guān)活動,可提煉出5個子類: 申請、受理、檢測、報告、質(zhì)量控制。用例分析與泛化是公共衛(wèi)生信息概念模型建模的重要階段和技術(shù),要應(yīng)用于公共衛(wèi)生信息概念模型建模的全過程中。
公共衛(wèi)生概念模型框架與內(nèi)容
我國公共衛(wèi)生信息的概念模型包括了4個主題域及35個類。其核心為4個主題域(衛(wèi)生相關(guān)活動,參與者、材料及位置)。在模型的建立中,公共衛(wèi)生相關(guān)活動主題域及各級子類的確定采用了公共衛(wèi)生信息分類框架的結(jié)果。作為模型,還對其他3個主題域進(jìn)行了詳細(xì)的分類,并增加了關(guān)聯(lián)類的內(nèi)容及對于類屬性描述的要求。在這里要區(qū)分信息分類與模型之間的關(guān)系及區(qū)別。信息分類框架關(guān)心的是對信息的分類,確定信息所在的位置以便用戶存放、查找及使用,因此并不涉及對于主題域、類之間的關(guān)聯(lián)以及類屬性的描述。而建立模型的目的是為了理解信息,描述信息。理解信息包括了解信息的來源(借助于信息框架)及關(guān)聯(lián),描述信息包括對數(shù)據(jù)元這個信息的基本單元屬性及關(guān)聯(lián)的描述,以便在統(tǒng)一的規(guī)范下查詢、使用信息。
概念模型的應(yīng)用
概念模型可以輔助系統(tǒng)設(shè)計者分析所需要采集的數(shù)據(jù)及屬性,建立相應(yīng)的邏輯數(shù)據(jù)模型(Logical Data Model),從而規(guī)范信息系統(tǒng)的建設(shè)。下面以傷害監(jiān)測為例說明模型的應(yīng)用。