公務(wù)員期刊網(wǎng) 精選范文 生物信息學(xué)的定義范文

生物信息學(xué)的定義精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的生物信息學(xué)的定義主題范文,僅供參考,歡迎閱讀并收藏。

生物信息學(xué)的定義

第1篇:生物信息學(xué)的定義范文

>> 民族信息學(xué)的研究范式與發(fā)展方向探析 生物信息學(xué)在農(nóng)學(xué)研究領(lǐng)域中的應(yīng)用 協(xié)作學(xué)習(xí)在信息學(xué)奧賽輔導(dǎo)中的實踐研究 中醫(yī)藥信息學(xué)的發(fā)展與應(yīng)用 醫(yī)學(xué)信息學(xué)課程的發(fā)展與思考 發(fā)展中的醫(yī)學(xué)影像信息學(xué) 癌癥研究的生物信息學(xué)資源 中醫(yī)神經(jīng)信息學(xué)研究趨勢 生物信息學(xué)方法在蛋白質(zhì)―蛋白質(zhì)相互作用研究中的應(yīng)用 社區(qū)信息學(xué)的主要方法 中日美企業(yè)文化的比較研究 云計算及其在生物信息學(xué)中的應(yīng)用 關(guān)于化學(xué)信息學(xué)及其課程教學(xué) 生物信息學(xué)在生物學(xué)研究領(lǐng)域的應(yīng)用 在信息學(xué)輔導(dǎo)中培養(yǎng)學(xué)生的信息素養(yǎng) 我國醫(yī)學(xué)信息學(xué)教育的歷史與發(fā)展現(xiàn)狀 美國健康信息學(xué)技術(shù)的發(fā)展現(xiàn)狀及作用 中醫(yī)大數(shù)據(jù)下生物信息學(xué)的發(fā)展及教育模式淺析 人才成為國外醫(yī)學(xué)信息學(xué)發(fā)展原動力 自建在線評測平臺在中學(xué)信息學(xué)奧賽教學(xué)中的應(yīng)用 常見問題解答 當(dāng)前所在位置:l.

[4] 野田五十洌山下央,副田俊介.新しい情笱В3.暮η笱[J].情I理,2010,51(6):649-655.

[5] Subedi J.Disaster Informatics:Information Management as a Tool for Effective Disaster Risk Reduction[J].Advanced ICTs for

Disaster Management and Threat Detection:Collaborative and Distributed Frameworks,2010:415.

[6] 龐宗禮.關(guān)于建立災(zāi)害信息學(xué)的建議和農(nóng)業(yè)災(zāi)害信息初探[J].農(nóng)業(yè)信息探索,1989(1):27-30.

[7] 龐宗禮.災(zāi)害信息學(xué)的基本構(gòu)架[J].科學(xué)管理研究,1991(5):74-78.

[8] 劉藝林.災(zāi)害信息的采集及其成果積累[J].災(zāi)害學(xué),1999(1):70-75.

[9] 田中 淳.暮η笳の展望:p膜蚰恐袱筏疲學(xué)gv演會|京大學(xué)t合防那笱芯駿互螗咯`O立湞伐螗蓀弗Ε啵[J].生b研究,2008,60(4):19-26.

[10] 孫庚.日本災(zāi)害信息學(xué)研究的歷史與現(xiàn)狀[J].國際新聞界,2010(1):111-116.

[11] 民政部災(zāi)害信息管理項目建設(shè)考察團(tuán),王振耀,方志勇,等.加快災(zāi)害信息管理系統(tǒng)建設(shè)──美國、日本災(zāi)害應(yīng)急管理系統(tǒng)建設(shè)啟示[J].中國減災(zāi),2004(5):49-51.

[12] 宋丹,高峰.美國自然災(zāi)害應(yīng)急管理情報服務(wù)案例分析及其啟示[J].圖書情報工作,2012,56(20):79-84.

[13] Asimakopoulou E.Advanced ICTs for Disaster Management and Threat Detection:Collaborative and Distributed Frameworks:Collaborative and Distributed Frameworks[M].IGI Global,2010.

[14] Weichselgartner J,Pigeon P.The Role of Knowledge in Disaster Risk Reduction[J].Int J Disaster Risk Sci,2015,6(2):107-116.

[15] Takahashi B,Tandoc E C,Carmichael municating on Twitter during a disaster:An analysis of tweets during Typhoon Haiyan in the Philippines[J].Computers in Human Behavior,2015(50):392-398.

[16] Svoboda M D.,F(xiàn)uchs B A.,Poulsen C C,et al.The drought risk atlas:Enhancing decision support for drought risk management in the United States[J].Journal of Hydrology,2015(526):274-286.

[17] Lindell M K,Prater C S,Gregg C E,et al. Households'immediate responses to the 2009 American Samoa Earthquake and Tsunami[J].International journal of disaster risk reduction,2015(12):328-340.

[18] Steelman T,Mccaffrey S,Velez A-L.,et al.What information do people use,trust,and find useful during a disaster?Evidence from five large wildfires[J].Nat Hazards,2015,76(1):615-634.

[19] Ryan B.Information seeking in a flood[J].Disaster Prevention and Management:An International Journal,2013,22(3): 229-242.

[20] Su Y,Zhao F,Tan L.Whether a large disaster could change public concern and risk perception: a case study of the 7/21 extraordinary rainstorm disaster in Beijing in 2012[J].Nat Hazards,2015,78(1):555-567.

[21] 郭松玲.試論災(zāi)害信息的特征與分類[J].中國減災(zāi),1992(3):25-27.

[22] 彭姚.國內(nèi)自然災(zāi)害信息分類與組織研究綜述[J].科技創(chuàng)新導(dǎo)報,2014(30):26-30.

[23] 崔鵬飛.我國災(zāi)害信息管理現(xiàn)狀與發(fā)展分析[J].教育教學(xué)論壇,2014(30):243-244.

[24] 陳祖琴,蘇新寧.基于情景劃分的突發(fā)事件應(yīng)急響應(yīng)策略庫構(gòu)建方法[J].圖書情報工作,2014,58(19):105-110.

[25] 蔣勛,毛燕,蘇新寧.突發(fā)事件驅(qū)動的信息語義組織與跨領(lǐng)域協(xié)同處理模型[J].情報理論與實踐,2014(11):114-119.

[26] 蔣勛,蘇新寧,劉喜文.突發(fā)事件驅(qū)動的應(yīng)急決策知識庫結(jié)構(gòu)研究[J].情報資料工作,2015(1):25-29.

[27] 吳小蘭,章成志.基于DTM-LPA的突發(fā)事件話題演化方法研究――以H7N9微博為例[J].圖書與情報,2015(3):9-16.

[28] 邵健,章成志.文本表示方法對微博Hashtag推薦影響研究――以Twitter上H7N9微博為例[J].圖書與情報,2015(3):17-25.

[29] 鄧三鴻,劉喜文,蔣勛.基于利益相關(guān)者理論的突發(fā)事件案例知識庫構(gòu)建研究[J].圖書與情報,2015(3):1-8.

[30] 林曦,姚樂野.我國突發(fā)事件應(yīng)急管理的情報工作現(xiàn)狀與問題分析[J].圖書情報工作,2014,58(23):12-18.

[31] 徐占品,鐘健.災(zāi)害信息傳播的研究對象、方法和意義[J].防災(zāi)科技學(xué)院學(xué)報,2010(3):125-129.

[32] 徐占品.災(zāi)害信息傳播者類型及其傳播特點[J].新聞界,2013(21):28-33.

[33] 徐占品,劉利永.新媒體時代災(zāi)害信息的傳播特點――以北京7.21特大暴雨山洪泥石流災(zāi)害為例[J].新聞界,2013(5):48-53.

[34] 劉曉嵐,劉穎,遲曉明.我國災(zāi)害信息傳播的研究現(xiàn)狀與展望[J].防災(zāi)科技學(xué)院學(xué)報,2010(1):132-136.

[35] 劉偉,劉曉嵐.移動互聯(lián)網(wǎng)語境下的災(zāi)害信息傳播研究[J].東南傳播,2015(3):5-7.

[36] 劉雯,高峰,洪凌子.基于情感分析的災(zāi)害網(wǎng)絡(luò)輿情研究――以雅安地震為例[J].圖書情報工作,2013,57(20):104-110.

[37] 劉波.公共突發(fā)性事件中微博輿論場域的生成與引導(dǎo)――從北京“7?21”特大自然災(zāi)害到事件[J].中國黨政干部論壇,2013(4):76-80.

第2篇:生物信息學(xué)的定義范文

準(zhǔn)確地說:自20世紀(jì)80年代以來,我們已是處在一個信息爆炸的時代、一個知識經(jīng)濟(jì)的時代。有人還更形象地說:這是一個一“網(wǎng)”情深的時代;一個“網(wǎng)”事如歌的時代;一個無“網(wǎng)”而不勝的時代。的確,進(jìn)入20世紀(jì)的后期,我們已實實在在地處在了一個信息網(wǎng)絡(luò)化的時代中。未來學(xué)家們又進(jìn)一步預(yù)言說:21世紀(jì)將是生物科技的時代,或者說是生命科學(xué)的時代。因為生物技術(shù)和信息技術(shù)的迅猛發(fā)展已向人們展現(xiàn)出了更加誘人前景,并使得將生物學(xué)和信息學(xué)結(jié)合起來的生物信息學(xué)的研究成為可能。運用生物信息學(xué)的原理或機(jī)制去提示生命的奧秘,認(rèn)識和探討人類疾病的發(fā)生和發(fā)展及至康復(fù)等醫(yī)學(xué)問題,將是一個全新的課題,并有望開啟一個嶄新醫(yī)學(xué)時代。生物信息醫(yī)學(xué)的時代。這是一個將“物質(zhì)、能量和信息”三基元的思想用來指導(dǎo)醫(yī)學(xué)的研究和發(fā)展的新階段,是對現(xiàn)代醫(yī)學(xué)僅從人體的物質(zhì)結(jié)構(gòu)和功能(能量)或者注重從生物物理和生物化學(xué)的角度去認(rèn)識疾病和防治疾病方法的一種進(jìn)步和完善。換句話說:我們將從生理、生化和生物信息三方面去看待機(jī)體和生命,去認(rèn)識和防治疾病。這不正是我們傳統(tǒng)中醫(yī)學(xué)的“形、氣、神”理論的現(xiàn)代體現(xiàn)嗎?所以,我們認(rèn)為,21世紀(jì)的醫(yī)學(xué)發(fā)展趨勢將是以生物信息為主導(dǎo)的醫(yī)學(xué)新時代。

下面我想從4個方面來分析和探討一下,我們所提出的“生物信息醫(yī)學(xué)”形成的可能性或可行性。即:①現(xiàn)代高新科技發(fā)展所提供的時代科技背景;②信息時代新的哲學(xué)思想原則為之提供的認(rèn)識論和方法論;③生物信息醫(yī)學(xué)已存在的歷史和發(fā)展現(xiàn)狀;④生物信息醫(yī)學(xué)未來的發(fā)展前景展望。

1生物信息醫(yī)學(xué)形成的時代背景――現(xiàn)代高新科技

現(xiàn)代醫(yī)學(xué)科學(xué)的每一個新進(jìn)展都與當(dāng)時的科學(xué)研究和技術(shù)的支持是分不開的,在當(dāng)今蓬勃發(fā)展的醫(yī)學(xué)背后有現(xiàn)代高新技術(shù)強(qiáng)有力的支撐。

現(xiàn)代高新科技來自現(xiàn)代尖端科學(xué)的研究,所謂尖端科學(xué)就是人類探索自然界規(guī)律,攀登科學(xué)知識高峰的前沿。當(dāng)前,科學(xué)研究的最前沿主要可以歸結(jié)為以下幾個方面的問題,即物質(zhì)的組成或結(jié)構(gòu),生命的本質(zhì)和演化,人類生存的環(huán)境,宇宙的起源和人類智力的奧秘。正是對在這些問題探索研究的過程中,人們不斷獲取尖端科學(xué)知識,并應(yīng)用這些知識,又進(jìn)一步開發(fā)出了如下高新科學(xué)技術(shù),即:①生命科學(xué)技術(shù)(或稱生物科學(xué)技術(shù))――對生命的本質(zhì)和演化的探索;②信息科學(xué)技術(shù)――對人類智力的探索;③軟科學(xué)技術(shù)(或稱管理科學(xué))――對人類智力的探索;④海洋科學(xué)技術(shù)――對生存環(huán)境的探索;⑤空間科學(xué)技術(shù)(或稱航空航天技術(shù))――對宇宙空間的探索;⑥環(huán)境科學(xué)技術(shù)――有益于環(huán)境的高新技術(shù);⑦新材料科學(xué)技術(shù)――對物質(zhì)的組成或結(jié)構(gòu)的探索;⑧新能源和可再生能源科學(xué)技術(shù)――對物質(zhì)的組成或結(jié)構(gòu)的探索。

這高新技術(shù)中,其中信息科學(xué)技術(shù)、生命科學(xué)技術(shù)和軟科學(xué)(管理科學(xué))是與人的生命和智力的探索直接相關(guān)的。自然也是與醫(yī)學(xué)是密切相關(guān)的科學(xué)和技術(shù)。海洋科學(xué)和空間科學(xué)及環(huán)境科學(xué),主要研究人類生存空間的拓展和生存環(huán)境的保護(hù),也是以人為本的。新材料科學(xué)和新能源及可再生能源科學(xué)則主要是為人類尋找更好的使用工具和動力資源,提高人類勞動效率和生存生活質(zhì)量。同時,其新材料科學(xué)技術(shù)還將會為我們的醫(yī)學(xué)提供更精細(xì)和精密的診療儀器或技術(shù)手段。例如:納米技術(shù)可使我們造制出更加精細(xì)的檢測儀器,如:纖維鏡、胃鏡等,也可提供更精細(xì)手術(shù)器械等。

在現(xiàn)代高新科學(xué)技術(shù)的基礎(chǔ)上,現(xiàn)代醫(yī)學(xué)科學(xué)研究方法的特點:一是研究更為深入,利用現(xiàn)代生物學(xué)先進(jìn)技術(shù),在核酸、蛋白質(zhì)等生物大分子水平上闡述生命體的結(jié)構(gòu)和功能特征,并且利用基因技術(shù)使人們能夠設(shè)計和改變生物體特征;二是研究技術(shù)的綜合應(yīng)用,以往各學(xué)科單一的研究方法、系統(tǒng)正在被跨學(xué)科多水平的實驗體系所取代,高水準(zhǔn)的研究一般都在整體、離體組織、細(xì)胞、分子多種水平上證實一種論點;三是高新技術(shù)的發(fā)展完善,使得元損傷非侵入式研究越來越廣泛被采用,不僅可以在實驗動物上得出與人更接近的結(jié)果,還能直接用于人體的研究;四是信息科學(xué)技術(shù)又為現(xiàn)代醫(yī)學(xué)科學(xué)的研究提供了新的思路和方法。它使我們對生命體的認(rèn)識不再只考慮其物質(zhì)結(jié)構(gòu)和能量代謝兩個方面的問題,而是將生命體內(nèi)物質(zhì)、能量和信息三個基本要素都考慮進(jìn)來。目前,對于人體信息系統(tǒng)的組成、信號轉(zhuǎn)導(dǎo)及有關(guān)的分子家族、信號轉(zhuǎn)導(dǎo)過程、細(xì)胞內(nèi)信號轉(zhuǎn)導(dǎo)、細(xì)胞間通訊、神經(jīng)信息的傳遞、大腦信息的加工、處理等有了前所未有的詳細(xì)認(rèn)識。

因此,在這里我將重點介紹一下信息科學(xué)技術(shù)和生物科學(xué)技術(shù)。因為,這兩項技術(shù)與我所提出的生物信息醫(yī)學(xué)是緊密相連的。

1.1信息科學(xué)技術(shù)

1.1.1信息的定義及本質(zhì)的討論:從20世紀(jì)中葉開始,對于信息的定義及其本質(zhì)的問題在世界范圍內(nèi)已引起了非常廣泛的討論,但仍未有一個定論。

其實,信息現(xiàn)象十分古老,早在人類歷史發(fā)端以前,信息已存在于物質(zhì)世界。如陽光普照,星光燦爛,就是宇宙天體發(fā)出的信息,在人類社會誕生以后,信息不僅來自物質(zhì)世界,而且來自精神領(lǐng)域。人類認(rèn)識和改造客觀世界的過程,實質(zhì)上就是一個信息過程。所以,人類自誕生以來,一直是在不斷地進(jìn)行信息的加工、傳遞、交流和利用等過程。

人類雖然很早并一直在接觸和利用信息,但對信息進(jìn)行有意識的科學(xué)闡析,都是20世紀(jì)以后的事。在此之前,我們對信息的認(rèn)識和理解,主要是指一些通知、報告、新聞消息、報道、情報、知識見聞、資料等,進(jìn)一步指思想、事實、思維、意念、資訊等,在通信科學(xué)發(fā)展的時代中是指信號、指令、代碼、數(shù)據(jù)、圖像等等。這些都是我們的日常可能接觸到的一些信息。。然而,從哲學(xué)的角度去深究信息的本質(zhì),是相當(dāng)艱難的,在學(xué)術(shù)上也一直是爭論不休的。這些爭論,始終是圍繞著信息同物質(zhì)、能源的關(guān)系,同認(rèn)識、意識的關(guān)系問題展開的。由于人們認(rèn)識上的差異以及觀察角度和采用方法的不同,各國學(xué)者在探索過程中,給“信息”下的定義已有四五十個之多,每種定義都有理性的面,但還沒有一個是定義在世界范圍內(nèi)得到公認(rèn)。不過,從這些討論中可以肯定的是:信息與物質(zhì)和能量一起共同構(gòu)成了人類可利用的三大基本資源要素。換句話說:整個世界(包括人體)是由物質(zhì)、能量和信息三大資源構(gòu)成的。信息論的創(chuàng)始人之一,美國學(xué)者唯納說過一句有名的話,他說:信息就是信息,它不是物質(zhì)也是能量;不承認(rèn)這一點的唯物論,在今天就不能存在下去。

隨著信息科學(xué)和技術(shù)的發(fā)展與完善,相信人們一定會對信息的本質(zhì)作出一個比較全面的科學(xué)闡析。目前,對信息的單位已確定了用“比特”來表示。所謂的信息流也就是比特流。美國麻省理工學(xué)院媒體實驗室主任尼古拉•尼葛洛龐帝先生說過:信息社會的基本要素不是原子,而是比特。比特與原子遵循著不同的安全法則。比特沒有重量,易于復(fù)制,可以以極快的速度傳播。它在傳播時,時空障礙完全消失。而原子只能由有限的人使用,使用的人越多其價值越高。尼葛洛龐帝還說:“我覺得我們的法律就仿佛在甲板上吧達(dá)吧達(dá)掙扎的魚一樣。這些垂死的魚拼命喘著氣,因為數(shù)字世界是個截然不同的地方。大多數(shù)法律都是為了原子的世界而不是比特的世界而制定的”??梢娦畔⑴c物質(zhì)和能量有著本質(zhì)的不同。另外信息網(wǎng)絡(luò)帶來的挑戰(zhàn),可能會更超出我們所有人的想象。所有這些都將有助于我們對“信息”的進(jìn)一步理解。對于信息的定義值得一提的有:《中國新聞實用大辭典》(人民日報出版社)從“實用”的角度,把“信息”表述為:一切事物的狀態(tài)和特征的反映。它普遍存在于自然界、人類社會以及人們的認(rèn)識和思維過程中。人類生活的世界是一個充滿信息的世界。另有一個比較通俗的說法:即認(rèn)為凡是人和動物通過眼睛、耳朵、鼻子、舌頭、身體、大腦接受到的外界事物及其變化,統(tǒng)統(tǒng)都含有信息。如五彩濱紛的圖畫、火車的鳴叫、香水的芬芳、蘋果的酸味、棒擊的疼痛、靈感的觸發(fā)等等。據(jù)專家統(tǒng)計,一般來說,人類通過視覺獲得的信息占83%,通過聽覺獲得的信息占12%,而其余6%的信息通過嗅覺、觸覺和味覺獲得。然而,這些也只不過是指人體從外界接收或獲取的體外信息,只是機(jī)體信息中一個方面。而另一方面在生物體內(nèi)自身還有其信息的加工、處理、發(fā)出、傳輸、儲存和利用等過程。如大腦的思維、心理活動、神經(jīng)反射、激素調(diào)節(jié)、體液傳導(dǎo)、遺傳變異、氣功意念、經(jīng)絡(luò)傳感、細(xì)胞、組織的新陳代謝等等,都是一些重要的生物信息過程。可見,“生物信息”的過程要比現(xiàn)在我們了解的“電子信息”處理的過程更為復(fù)雜。

現(xiàn)代醫(yī)學(xué)是建立在分子生物學(xué)、細(xì)胞學(xué)、組織胚胎學(xué)、解剖學(xué)、生理學(xué)和生物化學(xué)的基礎(chǔ)上的。它注重的是機(jī)體不同部分之間的差異性,即每發(fā)現(xiàn)一個部分在結(jié)構(gòu)和功能上的不同,就給予這個部分一個命名,就成為一種新發(fā)現(xiàn)。這也正是科學(xué)界歷來所信奉的“結(jié)構(gòu)決定功能”的理論觀念。由于這種思想觀念的指導(dǎo),使人們對機(jī)體內(nèi)部各個部分都有了深刻的研究和了解,便于得到各部分之間的結(jié)構(gòu)方式和本質(zhì)差別,進(jìn)而了解其功能特征。然而,這種只從物質(zhì)結(jié)構(gòu)狀態(tài)和功能(或能量)特征去認(rèn)識機(jī)體是不全面的,它忽視了生物體不同部分之間還有其信息的聯(lián)系和控制調(diào)節(jié)等特點,即生物體內(nèi)的“信息調(diào)控機(jī)制”問題。因而,現(xiàn)代醫(yī)學(xué)也就遇到了許多理論難題和臨床疑點問題,這些問題也正是影響醫(yī)學(xué)和生命科學(xué)全面發(fā)展的主要因素。因此,未來醫(yī)學(xué)則必須是建立在生物物理學(xué)(物質(zhì)結(jié)構(gòu)功能,即分子生物學(xué)、細(xì)胞學(xué)、組織胚胎學(xué)、解剖學(xué)、生理學(xué)等)、生物化學(xué)(物質(zhì)和能量代謝)和生物信息學(xué)的基礎(chǔ)上。

1.1.2信息技術(shù)的發(fā)展歷程:在人類誕生之初――即最原始的人類,其信息交流可能主要是靠叫聲和動作手勢,進(jìn)而就有語言的產(chǎn)生,最后又有了文字符號,并進(jìn)一步又有印刷術(shù)的出現(xiàn)。緊接著又有書報、信件、郵遞員、信鴿等信息傳播工具或媒體,這些是古代信息傳播技術(shù)發(fā)展的一個基礎(chǔ)過程。到了近代,隨著電的發(fā)明和發(fā)展,利用電來傳遞信息的技術(shù)得以研究和發(fā)展。最初是電報、電傳,到了1876年3月10日,貝爾運用電聲轉(zhuǎn)換技術(shù)發(fā)明了電話,隨后又是有了無線電廣播、電影、電視的發(fā)睨。這些使人類的信息傳播技術(shù)產(chǎn)生的一個飛躍,是一次信息革命

進(jìn)入20世紀(jì)后,電話、無線電廣播、電影和電視得到了極大的發(fā)展和應(yīng)用。更有意義的是:20世紀(jì)上半葉又有了電子計算機(jī)的出現(xiàn),計算機(jī)改變了人類對信息儲存、加工、處理和復(fù)制的基本方式,也使傳統(tǒng)的印刷術(shù)發(fā)生了一場革命。使之告別了鉛與火,代之以光和電。進(jìn)入20世紀(jì)90年代以后,以Intemet為代表的計算機(jī)網(wǎng)絡(luò)得到了飛速的發(fā)展。它從最初的教育科研網(wǎng)絡(luò),逐漸發(fā)展成為商業(yè)和民用網(wǎng)絡(luò),并正在改變著我們工作和生活的各個方面??梢院敛豢浯蟮卣f,Intemet是自印刷術(shù)以來人類通信方面最大的變革。目前,Intemet與電話和電視并稱為三大通信網(wǎng)絡(luò)。從計算機(jī)網(wǎng)絡(luò)(Intemet)的發(fā)展速度和趨勢來看,有可能以它為核心將“三網(wǎng)合而為一”。

1993年9月15日,美國政府了一個在全世界引起很大反響的文件,其文題是“國家信息基礎(chǔ)結(jié)構(gòu)行動計劃”。后來人們又通俗、生動而形象地把這個“行動計劃”稱作“信息高速公路”。緊接著全世界所有的工業(yè)發(fā)達(dá)國家和很多發(fā)展中國家都紛紛研究和制訂本國建設(shè)信息基礎(chǔ)結(jié)構(gòu)的計劃。這就使得計算機(jī)網(wǎng)絡(luò)(Intemet)的發(fā)展進(jìn)入了一個新的歷史階段。應(yīng)該說,這正是我們進(jìn)入信息化時代的一個標(biāo)志。當(dāng)然,這個時代是經(jīng)歷了由信息科學(xué)研究一信息技術(shù)革命一信息產(chǎn)業(yè)化、商品化一信息的社會化一信息化時代的過程,也差不多是經(jīng)歷了一個世紀(jì)的發(fā)展歷程。

在這個信息化時代,我們所有的人都可以感受它給我們帶來的快捷和便利。也更驚嘆它的發(fā)展速度以及其社會變化竟是如此變幻莫測。有一個著名的定律是美國貝爾電話實驗室的穆爾提出的,叫穆爾線性定律:他說一個硅片上的晶體管數(shù)量,按每18個月增加1倍的集成度的速度增長。目前,一塊計算機(jī)芯片上晶體管的集成度已達(dá)幾億個以上。據(jù)估計,到2007年將達(dá)到2000億個晶體管。所以,有些學(xué)者說,在信息化時代,我們只能預(yù)測到5年(最多10年)以內(nèi)的發(fā)展情形,10年以后是很難以預(yù)料的,因其發(fā)展太快了。如果說20世紀(jì)末的信息時代是那么地變幻莫測,那么21世紀(jì)的生物科技時代,就更難以預(yù)測了。因為,21世紀(jì)人類的生存、生活、婚姻、家庭以及倫理、道德等方式都將有可能被重新定義或定位。你想想,可以將人進(jìn)行復(fù)制,并使生命延續(xù)的克隆技術(shù)已予示著將打破一切條條框框(這正是下面我將要介紹的生物科學(xué)技術(shù)的發(fā)展及態(tài)勢)。

1.2生物科學(xué)技術(shù)的發(fā)展態(tài)勢:生物技術(shù)應(yīng)該說不完全是一門新興學(xué)科,它包括傳統(tǒng)生物技術(shù)和現(xiàn)代生物技術(shù)兩部分。傳統(tǒng)的生物技術(shù)是舊有的制造醬油、醋、酒、面包、奶酪、酸奶及其他食品等傳統(tǒng)工藝?,F(xiàn)代生物技術(shù)則是指20世紀(jì)70年代末80年代初發(fā)展起來的,以基因工程為核心,以DNA重組技術(shù)的建立為標(biāo)志的新興學(xué)科。目前我們所提的生物技術(shù)基本上是指現(xiàn)代生物技術(shù)。

現(xiàn)代生物技術(shù)包括:基因工程、細(xì)胞工程、酶工程、發(fā)酵工程、蛋白質(zhì)工程以及生化工程等。.不久的將來也許還將有生物信息工程的誕生。

1.2.1基因工程:1944年Averg等科學(xué)家闡明了DNA是遺傳信息的攜帶者;1953年Wats。n和Crick提出了DNA的雙螺旋結(jié)構(gòu)模型,闡明了DNlA的半保留復(fù)制模式,從而開啟了分子生物學(xué)研究的新紀(jì)元;1961年M•Nirenberg等破譯了遺傳密碼,揭示了DNA編碼的遺傳信息如何傳遞給蛋白質(zhì)這一秘密;1972年Berg首先實現(xiàn)了DNA體外重組技術(shù),這標(biāo)志著生物技術(shù)的核心技術(shù)――基因工程技術(shù)的開始,它向人們提供了一種全新的技術(shù)手段,使人們可以按照意愿在試管內(nèi)切割DNA,分離基因,并經(jīng)重組后導(dǎo)人其他生物或細(xì)胞,藉以改造農(nóng)作物或畜牧品種;也可以直接導(dǎo)人人體內(nèi)進(jìn)行基因治療?;蛑委熤饕ㄖ苽湔;蛉〈z傳缺陷的基因,或者關(guān)閉異常表達(dá)的基因,或者降低異?;虻谋磉_(dá)強(qiáng)度。這樣可以對一些由于基因突變、缺失和異常表達(dá)所引起的疾病,如遺傳病、惡性腫瘤等有望達(dá)到較理想的治療效果。

根據(jù)基因工程技術(shù)而進(jìn)行的基因工程藥物的研究自20世紀(jì)70年末也已經(jīng)開始,如人工胰島素、干擾素、生長素類、白細(xì)胞介素類和肝炎疫苗等。一還有轉(zhuǎn)基因技術(shù)對人工選育優(yōu)良品種也取得了成功。其中克隆羊的成功為動物轉(zhuǎn)基因研究揭示了廣闊的前景(有關(guān)克隆技術(shù)在下面的細(xì)胞工程中介紹)。

1.2.2細(xì)胞工程技術(shù):所謂的細(xì)胞工程是指以細(xì)胞為基本單位,在體外條件下進(jìn)行培養(yǎng)、繁殖,或人為地使細(xì)胞某些生物學(xué)特性按人們的意愿發(fā)生改變,從而達(dá)到改變生物品種和創(chuàng)造新品種,加速繁育個體,或獲得某種有用的物質(zhì)的過程。在這里我重點介紹一下細(xì)胞核移植技術(shù)-克隆技術(shù)。進(jìn)入20世紀(jì)90年代,利用幼胚細(xì)胞核克隆哺乳動物的技術(shù)接近成熟。世界上許多國家和地區(qū),如美國、英國、新西蘭、中國、臺灣等紛紛報道成功克隆猴子、豬、綿羊、牛、山羊、兔等。不過最讓生物學(xué)家和全世界震驚的重大突破是英國PPL生物技術(shù)公司羅斯林(R。slin)研究所的維爾穆特(Wilmut)博士于1997年2月27日在世界著名權(quán)威雜志《Nature》上宣布的用乳腺細(xì)胞的細(xì)胞核克隆出一只綿羊“多莉”(D。lly)的消息,“多莉”的誕生,既說明了體細(xì)胞核的遺傳信息的全能性,也翻開了人類以體細(xì)胞核竟相克隆哺乳動物的新篇章。僅僅過了一年半,1998年7月5日,日本人就喜迎來了叫作“能都”和“加賀”的兩頭克隆牛犢的降生。它們是用母牛輸卵管細(xì)胞的細(xì)胞核克隆成功的,幾乎與此同時,一組科學(xué)家在美國檀香山宣布,他們已經(jīng)采用卵泡細(xì)胞的細(xì)胞核克隆成功的小鼠“卡繆麗娜”再克隆出了下一代。祖孫三代22只克隆鼠組成的大家庭具有完全一致的遺傳基因和信息。隨后,德國和韓國的科學(xué)家也相繼宣布用體細(xì)胞成功克隆出哺乳動物的消息??梢?,幾個世紀(jì)以來人類夢寐以求的快速、大量繁殖純種動物的夙愿,在20世紀(jì)快要結(jié)束之前正在變成現(xiàn)實。

如果說1997年2月克隆“多莉”羊的新聞轟動了世界,一些人還是持懷疑態(tài)度的話,那么隨著“能都”和“加賀”等多頭克隆牛的問世以及克隆老鼠的再克隆成功,用體細(xì)胞而不是用早期胚胎細(xì)胞的細(xì)胞核克隆的哺乳動物,已經(jīng)成了廣為科學(xué)界和普通群眾接受的事實。在此基礎(chǔ)上,克隆人已經(jīng)不再是科幻小說中的故事了。1998年初,美國哈佛大學(xué)的理查德•希德宣布了他的克隆人計劃,立即招來了全世界一浪高過一浪的反對呼聲,緊接著歐洲19國聯(lián)合簽署了禁止克隆人的協(xié)議,我國政府以及美、英、德、日也已明確表示反對。然而這位69歲的博士稱:克隆人“只不過是人類生育的另一項先進(jìn)技術(shù)”。他計劃把自己的體細(xì)胞核與捐獻(xiàn)者的卵相結(jié)合后,再將這個胚胎植入他妻子格洛麗亞的子宮中,以期生下他的復(fù)制品。目前全世界都以關(guān)切的目光注視著希德的舉動和美國政府的一些反應(yīng)。另據(jù)報道,韓國科學(xué)家已于最近克隆成功了人的早期胚胎,但攝于法律的約束,又主動將她銷毀了。正象核能的開發(fā)具有截然相反的作用那樣,人類對克隆自身已采取了十分慎重的嚴(yán)肅態(tài)度。

但是,科學(xué)的發(fā)展是無法阻擋,即便是法律最終也可能無能為力,它也只能為順應(yīng)科學(xué)的發(fā)展而變化或制訂新的條文,以此來對新生事物加以規(guī)范或約束,強(qiáng)制阻撓是愚蠢的。正如信息時代一樣對信息犯罪必須重新修訂法律條文。所以,克隆人最終還是會變成現(xiàn)實的。據(jù)了解,目前在醫(yī)學(xué)領(lǐng)域是允許可以克隆器官的,以便提供被人體易接受的一模一樣的器官移植。

總之,這項技術(shù)必將對21世紀(jì)的醫(yī)學(xué)科學(xué)、生命科學(xué)以及農(nóng)學(xué)等諸多領(lǐng)域產(chǎn)生重大的影響和變革。如果一旦被允許可以克隆人時,那么,整個社會的形態(tài),生存和生活的方式都將發(fā)生變化,人與人之間的關(guān)系、婚姻、家庭和倫理道德等概念都將會被重新改寫或定義,因為,一種新的生育方式將改變這一切。因此,21世紀(jì)的生命科學(xué)時代的確是人們難以預(yù)料的。

1.2.3生物信息學(xué)的萌生:隨著人類基因組計劃等大型國際項目的實施,以及生物技術(shù)和信息科學(xué)技術(shù)的進(jìn)一步研究和發(fā)展,一門新興的邊緣學(xué)科――生物信息學(xué)已應(yīng)運而生。因為,生物科技和信息科技等高新技術(shù)的發(fā)展已為生物信息學(xué)的研究、開發(fā)和利用提供了可能,并已成為當(dāng)前一個前沿領(lǐng)域和研究的熱點。

生物信息學(xué)是以核酸(DNA分子)、蛋白質(zhì)等生物大分子的信息密碼;細(xì)胞間的通訊;腦科學(xué)和神經(jīng)網(wǎng)絡(luò);內(nèi)分泌激素的信使作用和免疫調(diào)節(jié),以及中醫(yī)的經(jīng)絡(luò)學(xué)說和精氣神理論為主要研究對象。以數(shù)學(xué)、信息學(xué)、計算機(jī)科學(xué)和仿生學(xué)為主要手段,以計算機(jī)硬件、軟件和通信網(wǎng)絡(luò)為主要工具,對浩如煙海的原始數(shù)據(jù)和紛繁復(fù)雜的生命信息進(jìn)行存儲、管理、注釋、加工、解讀,使之成為具有明確生物意義的生物信息。通過對生物信息的查詢、搜索、備份、比較、分析,從中獲取基因編碼、基因調(diào)控,核酸和蛋白質(zhì)的翻譯和其結(jié)構(gòu)功能關(guān)系,大腦的信息加工、處理機(jī)制、神經(jīng)信息的傳輸原理等等知識。在弄明白這些大量的生物信息的基礎(chǔ)上,再結(jié)合已有的生理、生化知識去探索生命的起源、生物的進(jìn)化、生命信息的傳輸調(diào)控機(jī)制、大腦的思維和神智;人類的疾病與康復(fù),以及細(xì)胞、器官和個體的發(fā)生、發(fā)育、衰亡等生命科學(xué)中的重大問題,搞清楚它們的基本規(guī)律和內(nèi)在聯(lián)系,是完全可能的。因此,生物信息學(xué)對21世紀(jì)的醫(yī)學(xué)科學(xué)和生命科學(xué)具有不可估量的奠基和推動作用。

高新技術(shù)的重要特征之一是學(xué)科的橫向滲透、縱向加深、綜合交錯、發(fā)展迅速。所以,我們所提出的生物信息學(xué)也正是在現(xiàn)代多學(xué)科發(fā)展的基礎(chǔ)上橫向結(jié)合而產(chǎn)生的。它是生物學(xué)與信息學(xué),信息學(xué)與生物醫(yī)學(xué)工程學(xué)等學(xué)科之間的相互交叉、相互滲透的一門邊緣學(xué)科。同樣,生物信息學(xué)又將與生命科學(xué)和醫(yī)學(xué)科學(xué)進(jìn)行交叉和滲透,并進(jìn)一步形成生物信息醫(yī)學(xué)這門新興分支學(xué)科。它將促進(jìn)醫(yī)學(xué)科學(xué)的發(fā)展,并有可能引發(fā)一場醫(yī)學(xué)革命,使我們步入生物信息醫(yī)學(xué)時代。雖然,我們目前尚不能作出一個比較完善的定義或解釋,但是,今天我們大家大概都不會否認(rèn),信息過程是生物體(人體)的一個重要過程。這一過程從根本上來說,是個體為了適應(yīng)機(jī)體內(nèi)、外瞬息萬變的各種環(huán)境。事實上,現(xiàn)代生物遺傳工程、轉(zhuǎn)基因技術(shù)、細(xì)胞工程學(xué)和克隆技術(shù),還有現(xiàn)代醫(yī)學(xué)的腦科學(xué)研究、神經(jīng)生理學(xué)、內(nèi)分泌激素、免疫學(xué)、心理醫(yī)學(xué)和思維醫(yī)學(xué),以及我們祖國傳統(tǒng)醫(yī)學(xué)中的針灸學(xué)、經(jīng)絡(luò)學(xué)說、氣功和推拿按摩學(xué)等等,這些都已不同程度地揭示了機(jī)體內(nèi)的一些信息過程中內(nèi)涵。這些探討生命過程中的信息問題,對于了解生命的本質(zhì)、演化以及疾病的發(fā)生、發(fā)展和轉(zhuǎn)歸等無疑是十分重要的。因此,我們有理由相信,生物信息醫(yī)學(xué)將成為21世紀(jì)醫(yī)學(xué)科學(xué)研究和發(fā)展的主流。

2信息時代的哲學(xué)思想原則與方法

19世紀(jì)和20世紀(jì)初,我們把它稱為工業(yè)化的時代。在工業(yè)化時代,牛頓力學(xué)有力地支撐了對立統(tǒng)一的哲學(xué)思想原則,也使我國古代就已形成的“物生有兩,體分左右,皆有二也”的樸素“二元論”辯證法觀念找到了近代科學(xué)的解釋。然而,牛頓力學(xué)觀察的是兩個物體之間的相互作用,是以質(zhì)量和能量作為物質(zhì)的兩個本源特質(zhì)的。人們很容易理解,任何事物都有正反兩個方面,非此即彼,非我即敵的機(jī)械認(rèn)識論觀點就是這種思想方法的極端體現(xiàn)。

進(jìn)入20世紀(jì)后半葉,現(xiàn)代科學(xué)技術(shù)發(fā)展把人們推進(jìn)到了信息化時代,人們遇到的諸多問題已經(jīng)不可能在牛頓力學(xué)的單一因果鏈的思維平臺上獲得滿意的答案,除了對立雙方之間的力學(xué)作用之外,還必須考慮介質(zhì)或者環(huán)境變化的信息作用問題。對立雙方長期斗爭的結(jié)果并不總是一個吃掉另一個,而往往是兩敗俱傷,由第三者或第三態(tài)主導(dǎo)局面。因此,信息時代的哲學(xué)思想原則應(yīng)該是至少要考慮三個最基本的要素而不是兩個。比如:物質(zhì)、能量和信息;元序、有序和自序;整體、局部和媒介;主體、對象和環(huán)境;正態(tài)、負(fù)態(tài)和零態(tài);宏觀、微觀和中觀等等。現(xiàn)已知曉:物質(zhì)、能量和信息是人類可利用的三大基本的戰(zhàn)略資源。整個世界包括我們的人體,是由物質(zhì)、能量和信息三者所共同構(gòu)成的。因此,一位美國科學(xué)家曾經(jīng)說過這樣一首詩,他說:“沒有物質(zhì)的世界是一個虛無的世界;沒有能量的世界是一個死寂的世界;沒有信息的世界則是一個混亂的世界”。可見,物質(zhì)、能量和信息這三者是缺一不可。物質(zhì)可以被加工成材料,為工具準(zhǔn)備形體;能源可以被轉(zhuǎn)換為動力,為工具注入活力,驅(qū)動機(jī)器運轉(zhuǎn);信息則可以被提煉成為知識和智慧,為工具和機(jī)器提供智能指令。在這三種資源之中,物質(zhì)相對直觀;信息資源相對抽象;而能量資源則介于兩者之間:人類認(rèn)識世界的規(guī)律是由直觀而至抽象,這就決定了一個極為有趣的生產(chǎn)力發(fā)展進(jìn)程。在農(nóng)業(yè)時代,人們主要利用物質(zhì)一種資源來制造人力工具(稱為一維工具、死工具),這種“物質(zhì)”又全部取之于自然環(huán)境;在工業(yè)時代,人類進(jìn)一步學(xué)會了高效地利用能量資源,并把它與材料結(jié)合起來制造動力工具(稱為二維工具、活工具)物質(zhì)和能量大顯身手、大出了風(fēng)頭,使我們看到了電燈代替油燈,汽車代替了馬車。到了信息化時代,人類又學(xué)會了利用信息資源,并把它與物質(zhì)和能量結(jié)合起來制造智能工具(稱為三維工具、聰明工具),也使我們看到計算機(jī)代替生產(chǎn)線上的工人。也因此在信息時代,大量的下崗和失業(yè)是在所難免的。

由此可見,人類的生產(chǎn)活動,實際上是通過能源的開采、運輸和變換,作用于各種物質(zhì),使之發(fā)生物理的和化學(xué)的種種變化,使之成為人們所需要的各種產(chǎn)品。這種能量流和物質(zhì)流的結(jié)合程度,取決于信息流的注入程度。我們?nèi)祟惖尼t(yī)療實踐活動似乎也遵循了這一發(fā)展規(guī)律,在原始的農(nóng)業(yè)時代,人們的醫(yī)療手段主要是靠自然醫(yī)療和天然藥物醫(yī)療。那時只能憑借自然界的現(xiàn)有條件來同疾病作斗爭。到了工業(yè)時代,人類也就掌握了運用化學(xué)藥物和切開手術(shù)醫(yī)療手段來戰(zhàn)勝疾病,這些正是將物質(zhì)和能量的結(jié)合利用。那么,到了信息化時代,人類也將會把信息導(dǎo)入醫(yī)療實踐活動,并把他作為一種新的診斷和治療手段,或與藥物和手術(shù)結(jié)合起來應(yīng)用,使其醫(yī)療手段更加先進(jìn)和完善。在工業(yè)化時代,人類對自然資源的過度開采和大量索取,造成了有些資源短缺、物種的滅絕和環(huán)境的嚴(yán)重污染或破壞等,已使人類飽償大自然對人類的懲罰。同樣,現(xiàn)代醫(yī)學(xué)由于大量使用化學(xué)藥物和手術(shù)切除或置換修補,致使藥源性和醫(yī)源性疾病的發(fā)生和泛濫。也使人們也償?shù)娇囝^,并感到了恐慌。把生物信息資源導(dǎo)入醫(yī)療實踐,將很有可能改變這一不利局面。

我們知道,在生產(chǎn)力體系中,物質(zhì)、能量為實體因素,而信息是非實體因素。信息對物質(zhì)和能量起著結(jié)合和控制作用。沒有信息的參與,物質(zhì)和能量無法正常發(fā)揮作用,生產(chǎn)就混亂而無法進(jìn)行,除了這種“結(jié)合”和“控制”作用外,信息還起到放大或倍增作用――即信息可以憑借它“攜帶”的科技和經(jīng)濟(jì)知識、管理智慧,使物質(zhì)和能量十倍、百倍甚至千倍地產(chǎn)生效益。一旦人們掌握了新的技術(shù)信息和管理知識,就可以創(chuàng)造發(fā)明新的工具;利用新的能源,掌握控制先進(jìn)的生產(chǎn)程序,就可以十倍、百倍地提高勞動生產(chǎn)率。同樣的道理,將信息作為一種診斷和治療手段或要素參與醫(yī)療實踐,無疑將可以降低化學(xué)藥物的用量和手術(shù)的創(chuàng)傷使療效成倍的提高;甚至可以免去不必要的手術(shù)和化學(xué)藥物的應(yīng)用,使治療效果更加穩(wěn)定、可靠,副作用也更小。

總之,在信息時代,人們對信息的本質(zhì)和作用的認(rèn)識也越來越深刻。并受到廣泛的重視,傳統(tǒng)哲學(xué)的二元論思想原則已受到挑戰(zhàn)。一種以“物質(zhì)、能量和信息”三基元的哲學(xué)指導(dǎo)思想正在起著主導(dǎo)作用。這種新的哲學(xué)思想認(rèn)為:任何事物都是由三個具有正交完備性的最基本的要素構(gòu)成的,比如熱力學(xué)有三定律,機(jī)械學(xué)有三定律,生物學(xué)也有三定律(遺傳、變異、自然淘汰),現(xiàn)代交叉科學(xué)有老三論(控制論、信息論、系統(tǒng)論),新三論(協(xié)同論、突變論、耗散結(jié)構(gòu)論),有三個基本原理,彩色電視中有三基色原理,任何事物可能都是由物質(zhì)、能量和信息三個基本要素的完整體現(xiàn),任何事物(包括機(jī)體)的組織形態(tài)也可能都存在著無序、有序和自序這三種極端模式等等。這種“三基元論”的哲學(xué)指導(dǎo)思想原則,無疑將改變我們對所有自然科學(xué)的研究方法和認(rèn)識論觀點。

我們知道,西方近、現(xiàn)代自然科學(xué)受英國啟蒙科學(xué)家培根(R.Bac。n,1220~1292)的巨大影響,拋棄了古代科學(xué)家習(xí)慣使用的思辯方法,強(qiáng)調(diào)“實驗方法”和“數(shù)學(xué)”的偉大作用,倡導(dǎo)一種直觀形象的思維方法或模式,采用一種實證方法來進(jìn)行驗證。也就是我前面所提到的科學(xué)界所信奉的“結(jié)構(gòu)決定功能”科學(xué)思想觀念。因此,在18世紀(jì)以來,實驗和觀察成為所有自然科學(xué)的主要研究途徑和人類認(rèn)識客觀世界的第一位的最重要實踐活動。并進(jìn)而將現(xiàn)代科學(xué)技術(shù)推進(jìn)到一個很高的水平。

現(xiàn)代醫(yī)學(xué)(西醫(yī))正是在這種哲學(xué)指導(dǎo)思想和科學(xué)發(fā)展的背景下得以取得了巨大發(fā)展的。其思維模式是以具體(個體)的形象思維為主導(dǎo)的,即將其分割后進(jìn)行驗證,運用形象的邏輯推理的方式,來找到或發(fā)現(xiàn)有可能的因果關(guān)系。因此現(xiàn)代醫(yī)學(xué)(西醫(yī))較偏重于局部的組織結(jié)構(gòu)和功能的研究,而對于整體的宏觀信息調(diào)控的考慮則相對較少,如解剖學(xué)、細(xì)胞學(xué)、組織胚胎學(xué)、分子生物學(xué)、病理學(xué)、細(xì)菌學(xué)、生物化學(xué)等,這些學(xué)科都是從不同的角度,通過實驗方式進(jìn)行研究和觀察。它注重和強(qiáng)調(diào)具體的人體物質(zhì)結(jié)構(gòu)和形態(tài)的存在形式。與此正好相反,我們傳統(tǒng)的中醫(yī)學(xué)卻仍然堅守著古代哲學(xué)的思辯方法,即是從復(fù)雜的整體環(huán)境和現(xiàn)象中尋找規(guī)律,通過比類取象的方法,對物質(zhì)世界進(jìn)行一種抽象的概括或綜合歸納。因此,中醫(yī)學(xué)偏重于整體的宏觀研究和經(jīng)絡(luò)信息網(wǎng)絡(luò)的調(diào)節(jié)機(jī)能,是以整體的、運動的、辯證的觀點在活的機(jī)體上來認(rèn)識人體,依據(jù)“天人同理” 原理,采取比類取象的方法,以自然和社會的規(guī)律及現(xiàn)象來類比觀察人體與疾病。如中醫(yī)的陰陽五行學(xué)說、形氣神理論、天人合一理論、五運六氣和臟象學(xué)說等,都是我國勞動人民在長期的生產(chǎn)和生活實踐中測天觀地、比類取象,并引伸到人體的生老病死中,以整體的抽象思維方式概括而成的。同樣,針灸學(xué)中的經(jīng)絡(luò)學(xué)說也是古人根據(jù)人體復(fù)雜的“氣”感和穴位效應(yīng)等機(jī)體信息變化現(xiàn)象而抽象概括描述出來的。

這兩種不同的思維模式也就導(dǎo)致中西醫(yī)兩種截然不同的理論體系。現(xiàn)代醫(yī)學(xué)因拋棄了抽象的思辯方法,因而在認(rèn)識上就不夠全面了,這也是現(xiàn)代醫(yī)學(xué)不能完全取代傳統(tǒng)中醫(yī)學(xué)的原因。信息時代的“物質(zhì)、能量和信息”三基元論的哲學(xué)指導(dǎo)思想原則將使我們重新調(diào)整對人體的認(rèn)識方法和醫(yī)學(xué)的研究方法。前面說過,物質(zhì)是具體而形象,而信息相對抽象;能量則介于兩者之間。因此,西醫(yī)的形象思維和中醫(yī)的抽象思維模式都只能是認(rèn)識論的一個方面的,都有一定的片面性或局限性。如果將它們結(jié)合起來作為醫(yī)學(xué)的一種新的認(rèn)識研究方法,即形成第三種思維方法――維象思維模式,我想我們醫(yī)學(xué)的發(fā)展就會有較大的突破,中西醫(yī)兩種醫(yī)學(xué)也就可能真正結(jié)合到一起。我們所提出的生物信息醫(yī)學(xué)正是以這種新的哲學(xué)指導(dǎo)思想原則和維象思維模式為指導(dǎo),它將會使我們傳統(tǒng)中醫(yī)學(xué)的一些抽象理論和神奇的治療方法得以挖掘和科學(xué)的闡析。因此可以說,信息科技時代將是我們傳統(tǒng)中醫(yī)學(xué)得以振興和科學(xué)解析的時代。

3生物信息醫(yī)學(xué)存在的歷史和發(fā)展現(xiàn)狀

3.1傳統(tǒng)中醫(yī)學(xué)中的信息醫(yī)療方法和思想:《靈樞•官能篇》日:“語徐而安靜,手巧而心審諦者,可使行針艾……緩節(jié)柔筋而心和調(diào)者,可使導(dǎo)引、行氣”。這就是說在傳統(tǒng)的針灸和按摩治療中,已體現(xiàn)出了一種樸素的信息醫(yī)療思想觀念。它對從事針灸的施術(shù)者(醫(yī)生)提出了要修心養(yǎng)性,語言和藹,施術(shù)時要安靜,注意意念集中,以便達(dá)到最佳的信息調(diào)節(jié)治療效果。對從事氣功推拿的要求是:應(yīng)加強(qiáng)修煉,使動作柔緩、心理調(diào)和,這也是強(qiáng)調(diào)意念信息的調(diào)理作用。還有針灸針的針柄也給了我們一個很好啟示,針柄上的“線圈”不應(yīng)單單只是為提插捻轉(zhuǎn)的方便而設(shè)計。這種金屬“線圈”還當(dāng)然具有接收和傳導(dǎo)生物信息的功能,它可接收術(shù)者的意念信息或外界環(huán)境的某些信號并傳導(dǎo)給被施術(shù)的病人體內(nèi)。從而達(dá)到一種生物信息的調(diào)節(jié)治療,因此針灸療法實質(zhì)上是一種信息刺激調(diào)節(jié)療法。所以,我們可以這樣來認(rèn)為:藥物治療主要是給機(jī)體補充“能量”以增強(qiáng)機(jī)體的抗病能力,是一種“能量”治療,而手術(shù)的切除、修補或置換是對機(jī)體物質(zhì)結(jié)構(gòu)形態(tài)的改變,是一種物質(zhì)治療方法。那么,針灸、推拿治療則主要是運用信號刺激和傳輸而達(dá)到調(diào)節(jié)生物“信息”節(jié)律為目的的信息醫(yī)療思想和方法。這也正是這類療法的抽象神奇之所在,因信息的調(diào)控機(jī)制尚未被揭示,所以,只知其然而暫時不知其所以然。盡管針灸早已引起世界各國科學(xué)家的關(guān)注并成為研究的熱點,但從信息論的角度來研究還只是近幾年的事。例如:隨著山東大學(xué)張穎清教授對生物全息律的發(fā)現(xiàn)和全息生物學(xué)的創(chuàng)立。針刺療法的信息映射傳輸反應(yīng)也從一定的程度上得到一些提示和發(fā)展,隨之也就有全息胚針灸學(xué)的出現(xiàn)。我們堅信,隨著生物信息學(xué)的研究深入,針刺的治病和鎮(zhèn)痛機(jī)制將會得到科學(xué)的解釋和進(jìn)一步的發(fā)展。

不僅僅如此,我國勞動人民在醫(yī)療養(yǎng)生保健活動中,還積累和創(chuàng)造了其它很多寶貴的“信息療法”。如:心理療法、思維療法、物境療法、生物鐘療法、生理饑餓療法、睡眠療法、想象療法、信念療法、靜思療法、善美療法、閱讀療法、技藝療法、音唱療法、笑罵療法、暗示療法、音樂療法、幽默療法、認(rèn)識行為療法、精神分析療法。還有在臨床上經(jīng)常使用的氣功療法、埋線療法、刮痧療法、灸法等等。另外,在中醫(yī)診斷學(xué)中的切脈就是一種很抽象的“信息”診斷法,它是通過對脈搏的動態(tài)信息變化來進(jìn)行分析、推測和辯證診斷的。在中藥治療學(xué)中,是很強(qiáng)調(diào)中藥性味的歸經(jīng)和配伍的,其中藥味的甘、辛、苦、寒,其實就是一種可以傳輸給機(jī)體的信息,并通過經(jīng)絡(luò)信息網(wǎng)絡(luò)傳遞給所要治療的臟腑器官。而現(xiàn)代的中成藥幾乎是完全去掉了中藥的味,只取其性,因而其效果大打了折扣,所以對中藥進(jìn)行化學(xué)提純或深加工,并不一定是很理想的選擇。

中醫(yī)的經(jīng)絡(luò)學(xué)說一直是科學(xué)界關(guān)注和廣泛研究的課題,科學(xué)家一直試圖想找到它的物質(zhì)結(jié)構(gòu)形態(tài)。可最終所得到的不是神經(jīng),就是血管,要不就是網(wǎng)織的膠原纖維組織,根本沒有屬于經(jīng)絡(luò)自身的物質(zhì)結(jié)構(gòu)或組織,其實,如果我們按照中醫(yī)學(xué)“天人同理”思想,將經(jīng)絡(luò)與現(xiàn)代的信息網(wǎng)絡(luò)類比,就不難明白,現(xiàn)代通信網(wǎng)絡(luò)是由不同的地域(局域網(wǎng))、系統(tǒng)網(wǎng)、有線網(wǎng)和元線網(wǎng)等通信子網(wǎng)互聯(lián)而成的一個很大而且開放的通信網(wǎng)絡(luò)。并且還有電信網(wǎng)、廣播電視網(wǎng)和計算機(jī)網(wǎng)等三大異質(zhì)網(wǎng)絡(luò)系統(tǒng)。它們的傳輸途徑和媒介有光纖傳輸、電纜傳輸、衛(wèi)星傳輸、地面微波接力傳遞等等,還可以互相轉(zhuǎn)換信號,如:模數(shù)或數(shù)模轉(zhuǎn)換等。我們的神經(jīng)系統(tǒng)、血液循環(huán)系統(tǒng),就如同有線通信子網(wǎng),機(jī)體還存在一個無線通信子網(wǎng),如:內(nèi)分泌激素、免疫系統(tǒng)等。這些機(jī)體通信子網(wǎng)的互聯(lián)通訊就構(gòu)成了一個人體完整的信息網(wǎng)絡(luò)系統(tǒng)。所以,我們可以把經(jīng)絡(luò)系統(tǒng)理解為神經(jīng)系統(tǒng)、血液循環(huán)系統(tǒng)、內(nèi)分泌激素、免疫系統(tǒng)、細(xì)胞間的聯(lián)系等組織、器官和系統(tǒng)的信息子網(wǎng)的互聯(lián),即人體信息的互聯(lián)網(wǎng)絡(luò)。

中醫(yī)的相生相克理論認(rèn)為,機(jī)體的五臟六腑、四肢百骸都存在著相互化生和相互制約的關(guān)系。中藥的配伍也存在其相生相克的關(guān)系。世界的萬事萬物都存在著相生相克的關(guān)系。所以,機(jī)體(個體)與機(jī)體之間也有一個相生相克的關(guān)系。這種相生相克其實就是一種生物信息的相互生成或互相沖突(干預(yù))。因而,在臨床醫(yī)療過程中,我們可能會發(fā)現(xiàn)這樣的一個現(xiàn)象:對同樣一個人,兩個針灸師采用的是同樣的施針方法,選擇的也是同樣的穴位,可是達(dá)到的效果卻不一樣。這種情況一般認(rèn)為是由于針灸師的臨床經(jīng)驗不同而造成的。其實這里面也應(yīng)該存在一個機(jī)體之間生物信息的相生相克機(jī)制問題。如果一個針灸師的生物信息場與病人的信息場是相克的關(guān)系,那么他對病人進(jìn)行針刺信息調(diào)節(jié)治療,其效果肯定是不理想,甚至可能還會加重病情。同樣,施行氣功導(dǎo)引和推拿的醫(yī)師也存在這種現(xiàn)象。還有,同一名醫(yī)師,他在不同的時期行醫(yī),也可能表現(xiàn)出在不同時期雖然采用的診治方法一樣,但臨床診治效果卻不同。這可能是這名醫(yī)師在不同時期,因自身的身體狀況和精神因素變化而造成的生物信息動態(tài)變化所致。其一定時期的生物信息可能剛好與那些病人的生物信息場相生,所以治療效果好。而另外某一個時期的生物信息場不好,正好與病人相克,所以治療效果不佳。其實,這也反應(yīng)了中醫(yī)學(xué)要求行醫(yī)者必需注意個人修練,保持心靜、氣調(diào)、神清的醫(yī)德思想境界。

中醫(yī)的臟象學(xué)說中的“象”是指什么?所謂“象”就是臟腑所表現(xiàn)出的動態(tài)的時空信息變化,即“時空信息花樣”。中醫(yī)學(xué)的“形、氣、神”正好與我們所說“物質(zhì)、能量和信息”是一一對應(yīng)的。只是中醫(yī)學(xué)缺乏對現(xiàn)代科學(xué)知識的引入,加之信息科學(xué)發(fā)展較晚,以致無法揭示“神志”的內(nèi)涵致使中醫(yī)學(xué)顯得有些神秘摸測,甚至有的人還對他的科學(xué)性表示懷疑。隨著生物信息學(xué)的研究和發(fā)展并逐步引入中醫(yī)學(xué)的研究中,相信一定會使中醫(yī)學(xué)重新大放光彩。

中國的氣功科學(xué)盡管還有不少疑點,但確能強(qiáng)身治病,這是舉世公認(rèn)的。氣功強(qiáng)調(diào)“調(diào)心”、“調(diào)神”、“調(diào)息”、“以意領(lǐng)氣”、“意念觀想”等。這可能都是強(qiáng)調(diào)用意念和精神因素來調(diào)節(jié)或控制神經(jīng)、免疫、內(nèi)分泌等信息經(jīng)絡(luò)系統(tǒng),使其達(dá)到健身、治病和提高生活質(zhì)量的目的。在氣功文獻(xiàn)和氣功醫(yī)學(xué)實踐中,有跡象表明(當(dāng)然還不是證實)大腦中想象的愿望、狀態(tài)、圖景、符號、口決、童趣,以及想象的動作、行為、刺激、過程等,都可通過經(jīng)絡(luò)信息系統(tǒng)的調(diào)控作用而影響人體生理活動,并可強(qiáng)身治病。這與西方醫(yī)學(xué)和心理學(xué)中的“摸擬情緒”影響免疫和內(nèi)分泌功能有著異曲同工之妙。

3.2現(xiàn)代醫(yī)學(xué)中所體現(xiàn)出的信息醫(yī)療思想和方法:過去人們流行的觀點是“生命在于運動”,并把死亡的標(biāo)志確定為以呼吸的停止、心臟的停跳為標(biāo)志。隨著近幾十年來腦科學(xué)的研究與發(fā)展,人們對于腦在整個機(jī)體中的重要地位的認(rèn)識已日益深刻。腦是人體的信息中樞,人體的各個組織、器官和系統(tǒng)都受它的調(diào)節(jié)和控制。科學(xué)研究顯示,人類大腦工作時,大腦的神經(jīng)細(xì)胞會從大腦以外的細(xì)胞那里搜集信息,并把這些信息綜合起來作出判斷,然后再輸出指令,讓人體的某些部位做出相應(yīng)的反應(yīng)。對于端起一杯咖啡這一簡單的動作,就需要幾百萬個神經(jīng)細(xì)胞的協(xié)調(diào)工作。美國國立老年研究所使用計算機(jī)控制的電子顯微鏡測定,經(jīng)常用腦的老年人腦細(xì)胞比一些中年人還多。國外學(xué)者通過調(diào)查5000名已故的運動員后發(fā)現(xiàn),他們當(dāng)中多數(shù)人的壽命短于一般人。美國學(xué)者馬勞斯在研究不同職業(yè)者的壽命時也發(fā)現(xiàn),超級球星和優(yōu)秀拳擊運動員的壽命比學(xué)術(shù)上有成就的學(xué)者、專家平均短8~83歲,究其原因是因為長時間進(jìn)行劇烈運動會使人體的新陳代謝長期處于旺盛狀態(tài),縮短了人體細(xì)胞分裂的周期,從而加快了機(jī)體器官組織的磨損與衰老。而經(jīng)常使用大腦的人,由于大腦的信息調(diào)控作用,使機(jī)體各部位的協(xié)調(diào)運動,保持動靜平衡,進(jìn)而達(dá)到延年益壽。據(jù)此,有人將“生命在于運動”的命題引伸為“生命在于腦運動”。并且現(xiàn)代醫(yī)學(xué)對死亡標(biāo)志作了新的認(rèn)定,即腦死亡是人死亡的主要標(biāo)志。因此,人體健康首先是應(yīng)該腦的健康和運動。

現(xiàn)代醫(yī)學(xué)也已充分地注意到了心理、精神和社會因素對健康和疾病的影響,例如:心理和精神因素對心臟病、高血壓、胃潰瘍、糖尿病和癌癥等均有很大影響。于是,就有了心理醫(yī)學(xué)、思維醫(yī)學(xué)和身心醫(yī)學(xué)的提法,并運用心理療法來配合這些疾病的治療。對癌癥的病人一般不直接告知患者本人的患病情況,只告知其家人――這在醫(yī)學(xué)上稱為“善意的謊言”,目的是不要讓患者的心理負(fù)擔(dān)過重,否則,精神就會夸掉。身心醫(yī)學(xué)就是研究社會、心理和精神等因素與疾病發(fā)生與發(fā)展關(guān)系的一門醫(yī)學(xué)新學(xué)科。國外已有人證明,心理刺激可通過氧化自由基而損傷DNA。

人類文明在進(jìn)步的同時也給人類帶來了許多新的文明病。其中以“大腦信息”失控或失調(diào)所致的精神心理障礙性疾病最為突出。據(jù)世界衛(wèi)生組織的統(tǒng)計數(shù)字,全世界約有5億人患者有不同程度的精神錯亂,有5200萬人患有嚴(yán)重精神病,約有1.5億人患神經(jīng)官能癥,3000萬人患癲癇。加上患有精神過敏癥和其它心理障礙的人數(shù),估計已占到總?cè)丝诘?0%以上。對于這些精神心理性疾病,現(xiàn)代醫(yī)學(xué)的藥物或手術(shù)療法已顯得力不從心了,只能采用心理療法或思維療法等信息調(diào)適方法,也有人把目光投向傳統(tǒng)的中醫(yī)、針灸、氣功等信息療法。從而也使我們看到了這些樸素的信息醫(yī)療方法對于現(xiàn)代文明病的攻克,顯示出了廣闊的發(fā)展前景。

在現(xiàn)代醫(yī)學(xué)的診斷學(xué)中,心電圖和腦電圖的檢測技術(shù),其實就是一種探觸大腦和心臟動態(tài)信息的檢測技術(shù);現(xiàn)代分子生物學(xué)已揭示了基因遺傳信息的編碼和控制蛋白質(zhì)合成的信息鏈板;腦科學(xué)的研究也從一定程度上揭示了大腦進(jìn)行信息搜集、加工、分析、處理并發(fā)出信息指令的部分原理;神經(jīng)生物學(xué)、內(nèi)分泌和免疫學(xué)則揭示了一部分機(jī)體信息交換、傳輸和產(chǎn)生反應(yīng)的機(jī)制。隨著生物信息學(xué)的研究和發(fā)展,現(xiàn)代醫(yī)學(xué)在上述這些研究領(lǐng)域一定會取得更大突破和進(jìn)展。

4生物信息醫(yī)學(xué)的發(fā)展前景

“電腦”是人們對電子計算機(jī)的俗稱,表現(xiàn)了人們的一種愿望――使計算機(jī)像人類大腦一樣工作。這種仿生技術(shù)的發(fā)展和應(yīng)用,必將對腦科學(xué)和機(jī)體信息調(diào)控機(jī)制的研究產(chǎn)生巨大促進(jìn)作用。

迄今為止,科學(xué)家們已經(jīng)模擬出了神經(jīng)系統(tǒng)的一連串的活動規(guī)律,并據(jù)此編制出了相應(yīng)的計算機(jī)程序;美、英科學(xué)家已合作成功研制出了世界上第一個硅神經(jīng)元――一種能夠模仿生物大腦細(xì)胞信息處理功能的微型芯片。這種面積只有01平方毫米的芯片的工作速度,比同樣大小的生物神經(jīng)細(xì)胞的工作速度還要快l00萬倍;與此同時,日本三菱電機(jī)公司也已開發(fā)出了每秒可達(dá)800億次的神經(jīng)元芯片,這一成果把神經(jīng)元芯片記憶一個字符所需的時間縮短到了萬分之三秒。神經(jīng)細(xì)胞是神經(jīng)系統(tǒng)的基本單元,它采用電子工作方式。硅神經(jīng)元在模擬神經(jīng)細(xì)胞時,其電子特性和神經(jīng)細(xì)胞一樣能夠獨立運行,有自己的“行為規(guī)范”,不受控制者的“指揮”。因此,從理論上說,幾百萬個芯片就可以組成一個功能強(qiáng)大的“人造大腦”,科學(xué)家還研制成了生物芯片,生物芯片傳遞信息的速度比人類大腦還要快l00萬倍。同時,當(dāng)芯片出現(xiàn)故障時,它可以自我修補,成為一種半永久性的器件。

神經(jīng)元芯片和生物芯片的獲得,為生物計算機(jī)――仿生電腦研究帶來了勃勃生機(jī)。而與之相關(guān)的神經(jīng)元網(wǎng)絡(luò)研究上的突破,更使生物計算機(jī)的研究大大向前推進(jìn)了一步。神經(jīng)元網(wǎng)絡(luò)是科學(xué)家們在神經(jīng)科學(xué)、心理生理學(xué)研究的基礎(chǔ)上發(fā)展的,它具有聯(lián)想記憶、相似性識別和分類、誤差較正、時序保留和概括等功能。當(dāng)神經(jīng)元網(wǎng)絡(luò)之間高度連接時,會引起并行機(jī)制而使神經(jīng)元集團(tuán)具有獨特的計算性質(zhì),如同人腦的一些高級思維和信息處理或控制功能。試想,生物計算機(jī)技術(shù)對揭示人類的大腦和生物信息節(jié)律的調(diào)控機(jī)制將會起到多么關(guān)鍵的作用,對于大腦疾病、神經(jīng)官能癥、精神和心理障礙以及癲癇等疾病的有效診治,其為期難道還遠(yuǎn)嗎?

如今人們常常是,“談癌色變”因為癌癥的確困擾醫(yī)學(xué)很久了,盡管有了很多新藥的研究開發(fā)以及手術(shù)的改進(jìn),但這些并非是醫(yī)治癌癥的良方或萬全之策。在生物信息醫(yī)學(xué)時代,我們很有可能找到醫(yī)治它的良方,比如:依據(jù)生物信息原理,我們可以研究“修復(fù)”癌細(xì)胞缺損或變異的信息密碼技術(shù),也就是對癌細(xì)胞進(jìn)行“重新教育”使之“改邪歸正”,或者是恢復(fù)對癌癥等病灶的正常生物信息指令控制。這就好比怎樣平息一個“地區(qū)”的“獨立判亂”一樣,其武力解決(病灶切除)并非是上策,通過說服教育,使人心歸順,才能算得上對該地真正收復(fù)。另外,對于一些組織器官或系統(tǒng)的功能紊亂,可以使用模擬相應(yīng)的生物信息(信息編程)儀器或電子信息藥丸,并設(shè)法讓它進(jìn)入該信息系統(tǒng)進(jìn)行調(diào)節(jié)控制,使之恢復(fù)其生物信息節(jié)律的平衡。這種同疾病作斗爭的方式的確如同“現(xiàn)代戰(zhàn)爭”(大家可能看過電視劇《突出重圍》……)。在現(xiàn)代戰(zhàn)爭中,“電子信息戰(zhàn)”已越來越突出而重要,與常規(guī)武器和生化武器等的協(xié)同作用威力也是越來越大?!秾O子兵法》中云:“不戰(zhàn)而屈人之兵,乃上之上策也”。這不正是信息戰(zhàn)的偉大之處嗎。同樣,我們未來的醫(yī)療實踐,也必將是以生物信息調(diào)節(jié)為先導(dǎo),或?qū)⑿畔⒄{(diào)控、藥物治療及手術(shù)治療結(jié)合起來以達(dá)到協(xié)同作戰(zhàn)的最佳效果。所以,我們不難預(yù)想21世紀(jì)的醫(yī)療實踐將是一個更加先進(jìn)和完美的生物信息化的醫(yī)療時代,或者可以簡稱之為“信息醫(yī)學(xué)”時代。

第3篇:生物信息學(xué)的定義范文

【關(guān)鍵詞】轉(zhuǎn)錄因子結(jié)合位點 計算機(jī)技術(shù)

近年來隨著基因組計劃的執(zhí)行,海量的基因序列原始數(shù)據(jù)被發(fā)現(xiàn)。為了闡述數(shù)據(jù)的生物意義,數(shù)學(xué)、計算機(jī)學(xué)等學(xué)科被廣泛結(jié)合運用,在研究過程中決定基因在生命工程中意義的基因表達(dá)就成了生物信息學(xué)主要的研究課題之一?;虮磉_(dá)是指基因在生物體內(nèi)的轉(zhuǎn)錄、剪接、翻譯以及轉(zhuǎn)變成有生命意義的蛋白質(zhì)分子的過程。

其中轉(zhuǎn)錄調(diào)控是基因表達(dá)的關(guān)鍵步驟,調(diào)控基因轉(zhuǎn)錄是由轉(zhuǎn)錄因子通過特異性結(jié)合調(diào)控區(qū)域的DNA序列來完成的,轉(zhuǎn)錄因子結(jié)合位點是與轉(zhuǎn)錄因子結(jié)合的長度通常在5~20 bp范圍內(nèi)的短小DN斷,一個轉(zhuǎn)錄因子往往同時調(diào)控若干個基因,而它在不同基因上的結(jié)合位點具有一定的保守性,但又不完全相同。對經(jīng)過生物實驗驗證的已知位點進(jìn)行分析可知,轉(zhuǎn)錄因子結(jié)合位點往往是在相關(guān)基因序列中具有保守性,可以表現(xiàn)出特定的模式,所以也被稱作模體。與其它常見的序列模體信號相比,轉(zhuǎn)錄因子結(jié)合位點模體除了長度較短以外,其堿基組成也更加靈活,容許較多的變體。識別轉(zhuǎn)錄因子結(jié)合位點模體問題在業(yè)內(nèi)通常簡化成為模體識別。

解決模體識別問題,需要運用生物學(xué)、數(shù)學(xué)和計算機(jī)學(xué)等學(xué)科的綜合研究成果,在數(shù)學(xué)和計算機(jī)學(xué)的作用下,模體識別可以形象的認(rèn)為是在龐雜的復(fù)雜的背景信號中找到具有相對保守性的微小特征信號的模型。

而這類微小特征信號因為模體的片段較短,而較短的序列在規(guī)模較大基因組中重復(fù)出現(xiàn)的次數(shù)很多, 另外模體又現(xiàn)實存在一定的模體變體, 這使得背景中的噪音信號對所關(guān)注的信號有著很大的干擾,減少這種干擾就是模體識別問題的難點

1 模體的表示方法

在生物信息學(xué)領(lǐng)域,通常用三種模型來表現(xiàn)模體。分別是:一致序列(Consensus)模型、權(quán)值矩陣模型(Weight Matrix Model, WMM)、可視化模型。

1.1 一致序列(Consensus)模型

一致序列模型是指取各個模體實例中同一位置出現(xiàn)次數(shù)最多的堿基作為一致序列該位置的堿基,這樣組成的序列就被稱作一致序列。這樣一致序列模型是對模體的一種大致性表示,一致序列模型的結(jié)果并不一定存在于被表示DNA序列中。以表1作為例子來說明:

1.2 權(quán)值矩陣模型

由一致序列模型表示的模體除了簡單直觀在精確性上與實際要求相差很遠(yuǎn),隨著算法的發(fā)展,人們發(fā)現(xiàn)用權(quán)值矩陣矩陣更能表現(xiàn)出模體的特性。

矩陣的行代表了不同的堿基,矩陣的列代表了堿基序列的位置。假設(shè)該矩陣為 W, 那么 W(i,j)表示第 i 個堿基在堿基位置 j 出現(xiàn)的概率。以上表為例可以得出矩陣W(4,5),如圖1所示。

可以在權(quán)值矩陣模型下用似然函數(shù)來評價生物序列模體的保守程度。

1.3 可視化模型

logo模型是可視化模型的典型代表,它依據(jù)信息論用形象直觀的圖形方式來表示結(jié)合位點的特征。

在logo模型中,每個位上的值是所有在該位置上出現(xiàn)的堿基疊加生成,該位置上值的高度等于該位置上堿基出現(xiàn)的信息量之和,該位置上堿基的排列按照信息量的大小從上向下排列。例如我們把已在真實數(shù)據(jù)庫公布的模體用logo模型表示,如圖2。

logo模型可以用直觀圖形地表示出結(jié)合位點的保守度,以及堿基在具置上的分布和影響。

2 轉(zhuǎn)錄因子結(jié)合位點識別研究歷程

根據(jù)轉(zhuǎn)錄因子結(jié)合位點在相關(guān)基因序列中的保守性,近年來人們開發(fā)了很多識別它們的算法。

較直觀使用的研究主要是基于字串枚舉的方法 ,其原理是:在給定的共表達(dá)基因上游區(qū)域中,模體序列的出現(xiàn)頻率比其背景序列片段現(xiàn)的頻率要高。因此,通過窮盡列舉輸入序列中所有可能的候選模體,計算出每個候選模體的實際現(xiàn)次數(shù)與其期望出現(xiàn)次數(shù)進(jìn)行比較衡量,選擇具有顯著統(tǒng)計特性的候選模體。

其中1984年Helden等人提出的Oligo-analysis方法;1992年 Pesole等人提出的模式驅(qū)動列舉(WordUp ) ;這兩種方法雖然簡單直觀但有兩個明顯的不足:時間復(fù)雜度高、僅適用于模體較小的情況,同時不能允許模體出現(xiàn)變體。接著,Helden對Oligo-analysis進(jìn)行了擴(kuò)展,2000年提出了dyad-analysis算法。該方法對兩端保守的模體識別率較高, 但當(dāng)模體保守區(qū)域長度定義后,搜索到的模體不能有變化,兩端保守區(qū)域也不能有變體的存在,因此只能應(yīng)用于某些特定結(jié)構(gòu)的模體識別。

2002年,Sinha,S等人提出了YMF法,即基于三階馬爾科夫鏈的簡單窮舉法。與之前算法不同,YMF可以用于預(yù)測的模體種類較多,但仍然有著枚舉法的通用弱點--如果模體較長則時間復(fù)雜度變得很差,識別精度也降低很快。為了能夠?qū)Y(jié)果更復(fù)雜,特征不明顯的較長(十幾至幾十堿基)模體進(jìn)行識別,2002年Eskin和Pevner提出了前綴樹法(Mitra)使用前綴樹描述搜索空間,通過分割搜索空間,刪除弱表達(dá)子空間,修剪完成后獲得的樹中各路徑即是顯著性模體。這種方法可以有效地減少搜索空間,能夠搜索較長的模體和組合型模體,缺點是模體長度需要預(yù)先設(shè)定,搜索空間較大。隨后在MITRA基礎(chǔ)上,Pavesi等人提出了后綴樹法(Weeder)方法。Weeder法對候選模體集并不是通過直接修剪搜索空間來獲得最終結(jié)果,而是通過對各候選模體在序列中實際現(xiàn)判定條件的嚴(yán)格限制,減少符合設(shè)定條件的模體數(shù)來得到。和Mitra方法相比Weeder方法不需要對模體長度進(jìn)行預(yù)先設(shè)定。

在直觀的基于字串枚舉方法發(fā)展的同時,其他領(lǐng)域取得進(jìn)展的算法也在不停地被借鑒到模體識別問題中來?;诰植克阉鞯乃惴u漸成為主流。此類算法是首先構(gòu)建一個模體的初始模型,例如相似度矩陣模型,然后對該模型在每次迭代中進(jìn)行相應(yīng)的調(diào)整,使其更接近真實的模體。經(jīng)過數(shù)次的迭代后,該模型最終收斂到一個局部最優(yōu)解。

其中:1990年La wrence等提出用EM 算法來解模體識別,但是它只能識別一個模體類型。于是在1995年Bailey和Elkan提出了改進(jìn)了的EM算法--ME ME算法, 通過擬合一個二元混合模型 ,優(yōu)化EM算法的初值來識別一個或多個模體的類型 。1999 年 , Hertz結(jié)合貪婪算法和E M算法編寫了CONSENSUS。 由于EM 算法常會陷入局部最優(yōu)解,在1993年La wrence等率先把吉布斯采樣法引入模體識別領(lǐng)域,吉布斯采樣算法是一種特殊的馬爾柯夫鏈蒙特卡羅方法。此后又現(xiàn)了很多基于吉布斯采樣算法的模體識別算法。如今已經(jīng)成為應(yīng)用最廣最成功的motif識別方法之一。

2000年,Pevzver和Sze 提出了植入(l,d)-motif模型,這具有里程碑的意義,i因為以上各個方法都不能完全解答這個模型,需要尋找一個全面系統(tǒng)的同時能夠展示出基因序列間的拓?fù)浣Y(jié)構(gòu)、聯(lián)系、功能及進(jìn)化的模型。 這樣就把早在1969年Kau ffman就利用布爾關(guān)系構(gòu)建了那個原始的具有猜測性質(zhì)的基因網(wǎng)絡(luò),具現(xiàn)到(l,d)-模體識別這個問題上了。同時圖論的思想也被大量引入到模體識別領(lǐng)域。

3 轉(zhuǎn)錄因子結(jié)合位點識別算法的分類

根據(jù)識別策略和搜索對象的不同,模體識別算法大致可分為三類:

第一類是de novo模體識別算法,該類算法是在沒有轉(zhuǎn)錄因子及其結(jié)合位點的先驗信息的情況下,完全依靠計算方法在一系列共表達(dá)或者共調(diào)控基因的上游區(qū)域中識別未知模體;我們在第2章轉(zhuǎn)錄因子結(jié)合位點識別研究歷程中所介紹的算法均屬于這一類。

第二類是結(jié)合ChIP-chip等高通量實驗數(shù)據(jù)的預(yù)測算法;這種方法非常高效,以至于業(yè)內(nèi)稱之為下一代模體識別算法。

第三類是系統(tǒng)發(fā)育足跡分析法(Phylogenetic Footprinting),該類算法通過比較不同物種的DNA序列來搜索在多個物種之間保守的模體。

下面分別對上述三類算法進(jìn)行具體介紹:

3.1 de novo模體識別算法

de novo模體識別算法是指以一組共調(diào)控的基因作為輸入,用計算的方法查找在這些基因的上游調(diào)控序列中富集的模體。從策略上分可細(xì)分為窮舉型和比對型。在上一章中所介紹的Oligo-analysis方法、模式驅(qū)動方法、dyad-analysis方法、YMF方法、Mitra方法和Weeder方法等等均屬于窮舉型;而EM方法、MEME方法、吉布斯采樣方法引申出的各種方法等等均為比對型。

兩種方法各有優(yōu)勢也各有弱點,窮舉法的弱點是所識別模體不可過長,否則耗費時間過長,比對法的弱點是容易陷入局部最優(yōu)解。同時由于de novo模體識別算法依賴共調(diào)控信息使得二者都局限于只能對單物種進(jìn)行識別。

de novo模體識別算法一直以來都是模體識別領(lǐng)域的主要組成,各種經(jīng)典算法層出不窮,是這一領(lǐng)域的核心研究力量,近幾年來圖論和聚類算法的進(jìn)入,又給此類算法帶來新的活力。同時由此類算法向下一代算法引申變化以期更好解決模體識別問題的研究也一直在進(jìn)行中。

比如我們接下來介紹的基于染色質(zhì)免疫共沉淀技術(shù)的ChIP-seq算法。有很多方法是源自de novo算法。另外側(cè)重進(jìn)化層面的系統(tǒng)發(fā)育足跡分析法也大量借鑒了de novo算法的思想。

3.2 基于染色質(zhì)免疫共沉淀技術(shù)的ChIP-seq算法

染色質(zhì)免疫共沉淀技術(shù)(ChIP)的出現(xiàn)帶來了基因技術(shù)上的革命,CHIP-chip技術(shù)是ChIP技術(shù)和基因芯片技術(shù)的結(jié)合,帶來了大量的調(diào)控實驗數(shù)據(jù),它可以間接確定DNA序列與轉(zhuǎn)錄因子結(jié)合與否,以及結(jié)合的強(qiáng)度。ChIP-chip技術(shù)的分辨率在800bp左右,遠(yuǎn)大于轉(zhuǎn)錄因子結(jié)合位點的長度,這樣就需要算法對其進(jìn)行進(jìn)一步的加工,在ChIP-tiling利用疊片式芯片進(jìn)一步增加了基因組的覆蓋率。將ChIP與第二代測序技術(shù)相結(jié)合的ChIP-Seq技術(shù),能夠高效地在全基因組范圍內(nèi)檢測與組蛋白、轉(zhuǎn)錄因子等互作的DNA區(qū)段。ChIP-seq

技術(shù)的分辨率可以達(dá)到100bp甚至更高。

ChIP-Seq算法是這樣工作的:首先將測序得到的短序列片段匹配到參考基因組序列上;考慮到有一部分短序列不能匹配到參考基因組上,有可能是未知的基因組序列;另一部分是能夠匹配到基因組上的短序列,通常要對這些段序列進(jìn)行覆蓋度計算;繼而從匹配到基因組上的短序列中進(jìn)行富集區(qū)域的掃描。通常掃描到的富集區(qū)即被認(rèn)為是蛋白質(zhì)與DNA相互結(jié)合的區(qū)域。此時已得到我們所關(guān)注的結(jié)果,至于將計算數(shù)據(jù)轉(zhuǎn)變?yōu)檎鎸崝?shù)據(jù)庫數(shù)據(jù)則是另一層面的問題。

和以往的de novo模體識別算法不同的是,以往的算法面對的是長度普遍在以千為數(shù)量級的,同源條數(shù)以幾十以內(nèi)的序列數(shù)據(jù),而ChIP-Seq算法面對的是長度為100左右而條數(shù)以十萬為數(shù)量級的序列數(shù)據(jù),這樣以往的算法就沒法照搬使用,針對這種情況,MEME算法、吉布斯采樣算法等經(jīng)典算法均做出了相應(yīng)的調(diào)整,形成了對ChIP技術(shù)的新變化。同時模式驅(qū)動和聚類求精之類的算法在ChIP技術(shù)的要求下形成了新型的算法...多種算法的形成不勝枚舉,在近一、兩年幾乎每天都有突破??梢哉fChIP-Seq算法的下一代模體識別算法的地位已經(jīng)奠定。

3.3 系統(tǒng)發(fā)育足跡分析法

隨著測序技術(shù)的發(fā)展,越來越多的基因組被測序,系統(tǒng)發(fā)育足跡分析法在轉(zhuǎn)

錄因子結(jié)合位點預(yù)測中變得越來越重要。它的基本假設(shè)是,轉(zhuǎn)錄因子結(jié)合位點有調(diào)控功能,在進(jìn)化中應(yīng)該相對保守,進(jìn)化速度要慢于其它沒有功能的非編碼序列,因此預(yù)測轉(zhuǎn)錄因子結(jié)合位點就是搜索同源基因在多個物種中的對應(yīng)基因序列上的保守模體。

2003年, Kellis、Cliften分別用此方法在酵母屬基因組中找到保守的模體, 2007 年,Kheradpour等對12個果蠅屬物種的全基因組進(jìn)行比較分析, 預(yù)測出若干保守模體存在于ChIP-Seq算法預(yù)測的有效富集區(qū)。均取得相應(yīng)的成果。

大部分此類算法思想是將共調(diào)控和進(jìn)化上保守兩種因素綜合起來,在de novo 預(yù)測算法的基礎(chǔ)上開發(fā)的,同時研究者將刻畫物種間進(jìn)化關(guān)系的進(jìn)化樹以及進(jìn)化距離等信息都添加到預(yù)測算法中,作為算法調(diào)控機(jī)制。以增加算法準(zhǔn)確率。其結(jié)果可以通過特定的ChIP-Seq算法驗證。

和前兩種算法不同,系統(tǒng)發(fā)育足跡分析法面對在更宏觀背景下的模體識別問題,de novo算法與ChIP-Seq算法的每次進(jìn)步總是要對其產(chǎn)生促進(jìn),同時它的發(fā)展也對前兩者提供了驗證信息和新的思路。最終生物信息學(xué)對生命的解讀將由這三類甚至更多、更新層級方法共同完成。

4 總結(jié)

可以看出轉(zhuǎn)錄因子結(jié)合位點識別研究歷經(jīng)簡單枚舉、局部搜索、網(wǎng)絡(luò)模型、 與DNA芯片技術(shù)結(jié)合、與物種進(jìn)化結(jié)合等等過程,逐步形成了研究體系,各個過程中間不是簡單的技術(shù)換代,而是在新的技術(shù)條件下各種經(jīng)典的方法的延伸和發(fā)展。也就是說我們不能簡單地認(rèn)為局部搜索就優(yōu)于枚舉,或是ChIP-Seq算法優(yōu)于de novo算法等等,它們各階段的發(fā)展都是對彼此的促進(jìn)。在相互促進(jìn)融合的過程中,新的更適合當(dāng)下技術(shù)條件的算法會逐步被人們發(fā)現(xiàn)。只有通過各種數(shù)據(jù)的融合和相互校正,才能挖掘出可靠的轉(zhuǎn)錄因子結(jié)合位點和它對DNA序列轉(zhuǎn)錄調(diào)控關(guān)系。

通過對各類算法的分析,可以看出今后一個階段的研究仍是圍繞著減少序列背景中的噪音信號對所關(guān)注的模體信號的干擾,以及提高算法的時間效率來進(jìn)行的,新的實驗技術(shù)和更多的同源序列信息被發(fā)現(xiàn),必將帶來更高效的轉(zhuǎn)錄因子結(jié)合位點識別算法。

參考文獻(xiàn)

[1]Patrik D'haeseleer,How does DNA sequence motif discovery work? Nature biotechnology volume 24 number 8 August 2006.

[2]Helden etc,Extracting regul atory sites from the upstream region of yeast genes by computational analysis of oligonucleotide frequencies. Journal of Mol ecular Biology, 1984, 281(5):527-842.

[3]Pesole etc,WORDUP:an efficient al gorithm for discovering statistically significant patterns in DNA sequences.Nucleic Acids Research, 1992,20(11):2871-2875.

[4]Helden etc,Discovering regulatory elements in non-coding sequences by analysis of spaced dyads.Nucl eic Acids Research,2000,28(8):1808-1818.

[5]Sinha,ect,Discovery of novel transcri ption factor binding sites by statistical overrespresentation. Nucleic Acids Research,2002, 30(24):5549-5560.

[6] Pavesi,G.,Mauri,G.ect Analgori thm for finding signals of unknown length in DNA sequences.Bi oinformat i cs,2002,17(1):207-214.

[7]Bailey,T.,L.and El kan,C.Fitting a mixture model by expectation maximizat i on to discover motifs in Bopolmers.Proc.of the 2th International Conference on Intelligent Systems for Molecular Biology,1994,pp28-36.

[8]Bailey ect,Unsupervised learning of multiple motifs in biopolymers using expectation maximization. Machine Learning.1995,21(1-2):51-80.

[9]Lawrence ect,Detecting subtle sequence signals:a gibbs samling strategy for multiple alignment. Science.1993,262:208-218.

[10]Pevzner PA,Sze SH(2000) Combinatorial approaches to finding subtle signals in DNA sequences. In: Altman R,Bailey TL,eds.Proceedings of the Eighth International Conference on Intelligent Systems for Molecular Biology.California:AAAI Press.269-278.

[11]Ren B,Robert F,ect Genome-wide location and function of DNA binding proteins.Science,2000,290(5500): 2306-2309.

[12]Johnson DS ect Genome- wide mapping of in vivoprotein-DNA interactions. Science,2007,316(5830):1497-1502.

第4篇:生物信息學(xué)的定義范文

[關(guān)鍵詞]中藥復(fù)方;組方設(shè)計;新藥研發(fā)

Drug design ideas and methods of Chinese herb prescriptions

REN Jun-guo, LIU Jian-xun*

(Institute of Basic Medical Sciences of Xiyuan Hospital, China Academy of Chinese Medical Sciences,

Beijing Key Laboratory of Pharmacology of Chinese Materia, Beijing 100091, China)

[Abstract]The new drug of Chinese herbal prescription, which is the best carrier for the syndrome differentiation and treatment of Chinese medicine and is the main form of the new drug research and development, plays a very important role in the new drug research and development. Although there are many sources of the prescriptions, whether it can become a new drug, the necessity, rationality and science of the prescriptions are the key to develop the new drug.In this article, aiming at the key issues in prescriptions design, the source, classification, composition design of new drug of Chinese herbal prescriptions are discussed, and provide a useful reference for research and development of new drugs.

[Key words]Chinese herbal prescription; prescription design; new drug research and development

doi:10.4268/cjcmm20151716

中藥復(fù)方是中醫(yī)臨床用藥的主要形式,也是中藥復(fù)方新藥研發(fā)的源泉。從目前中藥新藥的研發(fā)的現(xiàn)狀來看,由于中藥復(fù)方新藥不僅體現(xiàn)了中醫(yī)辨證論治的特點,還與國際上新藥研發(fā)的“雞尾酒療法”<sup>[1]</sup>或“固定劑量組合”<sup>[2]</sup>的研發(fā)趨勢一致,中藥復(fù)方新藥的研發(fā)在中藥新藥領(lǐng)域占據(jù)著比較大的比例,據(jù)統(tǒng)計,占2008―2013年中藥新藥注冊數(shù)量的85.76%<sup>[3]</sup>。2008年國家食品藥品監(jiān)督管理局(SFDA)頒發(fā)的《中藥注冊管理補充規(guī)定》第5條規(guī)定:中藥復(fù)方制劑應(yīng)在中醫(yī)藥理論指導(dǎo)下組方,其處方組成包括中藥飲片(藥材)、提取物、有效部位及有效成分<sup>[4]</sup>。因此,中藥復(fù)方新藥的關(guān)鍵是組方,即如何在中醫(yī)藥理論指導(dǎo)下,組成一個有效、安全、質(zhì)量可控的復(fù)方,則成為中藥復(fù)方新藥研發(fā)的關(guān)鍵科學(xué)問題。

1中藥復(fù)方新藥的分類

目前,有關(guān)中藥復(fù)方新藥的分類有許多種不同的提法,其主要的是2002年SFDA頒布的《中藥、天然藥物分類及申報資料要求》中的注冊分類標(biāo)準(zhǔn),在實際研發(fā)過程中,也有專家學(xué)者根據(jù)中藥復(fù)方新藥的某種特點提出了新的分類方法。

1.1SFDA中藥復(fù)方新藥注冊分類2002年SFDA頒布的《中藥、天然藥物分類及申報資料要求》中明確指出復(fù)方新藥主要指“未在國內(nèi)上市銷售的中藥、天然藥物制成的復(fù)方制劑”<sup>[5]</sup>,主要包括3類:①傳統(tǒng)中藥復(fù)方制劑;②現(xiàn)代中藥復(fù)方制劑;③天然藥物復(fù)方制劑。由于③完全脫離了傳統(tǒng)中醫(yī)藥學(xué)的理論指導(dǎo),中藥只是作為活性物質(zhì)的來源,該類復(fù)方已失去了中藥的內(nèi)涵,因此,僅①和②屬于中藥復(fù)方新藥的范疇。

傳統(tǒng)中藥復(fù)方制劑是指在中醫(yī)藥理論指導(dǎo)下的組方,如古方、經(jīng)典方、經(jīng)驗方等,其功能主治用傳統(tǒng)中醫(yī)術(shù)語表述,藥材必須具有法定標(biāo)準(zhǔn),其主治病證必須是國家中成藥標(biāo)準(zhǔn)中未收載的,并以傳統(tǒng)工藝(保持傳統(tǒng)的治療疾病的物質(zhì)基礎(chǔ)不變的工藝)制成的復(fù)方制劑。

現(xiàn)代中藥復(fù)方制劑是指在中醫(yī)藥理論指導(dǎo)下組方,功能主治用現(xiàn)代醫(yī)學(xué)術(shù)語表述,藥材可以是傳統(tǒng)或非傳統(tǒng)藥材,且以非傳統(tǒng)工藝制成的復(fù)方制劑。其中非傳統(tǒng)藥材包括天然藥物、有效成分或化學(xué)藥品。

1.2依據(jù)主治的中藥復(fù)方新藥分類辨證論治、病證結(jié)合是目前中醫(yī)臨床治療疾病的主要模式,相應(yīng)產(chǎn)生了以證候為主或病證結(jié)合為主的2種中藥復(fù)方組方方法,反映在中藥復(fù)方新藥研發(fā)上,就形成了根據(jù)主治的不同,形成了中藥復(fù)方新藥的分類方法。主要有證候中藥復(fù)方新藥和病證結(jié)合中藥復(fù)方新藥2種<sup>[6]</sup>。

證候中藥復(fù)方制劑(新藥)是指在中醫(yī)藥理論指導(dǎo)下,用于治療中醫(yī)證候的中藥復(fù)方制劑,包括治療中醫(yī)學(xué)的病或癥狀的中藥復(fù)方制劑。

病證結(jié)合中藥復(fù)方制劑(新藥)是指中醫(yī)藥理論指導(dǎo)下,結(jié)合現(xiàn)代醫(yī)藥學(xué)理論,針對現(xiàn)代醫(yī)學(xué)的疾病與中醫(yī)的證候為治療對象的中藥復(fù)方制劑,其功能用中醫(yī)專業(yè)術(shù)語表述、主治以現(xiàn)代醫(yī)學(xué)疾病與中醫(yī)證候相結(jié)合的方式表述。

1.3依據(jù)藥效成分組成的中藥復(fù)方新藥分類中藥復(fù)方發(fā)揮藥效的物質(zhì)基礎(chǔ)是其組成中藥含有的與其主治相關(guān)的有效成分,由于中藥復(fù)方新藥的提取、制劑工藝不同,中藥復(fù)方新藥所含的有效成分的種類與含量存在明顯的差異,據(jù)此,有學(xué)者在組分中藥的基礎(chǔ)上提出復(fù)方組分中藥的概念,其他則與此區(qū)分。

第418次香山科學(xué)會議“組分中藥研討會”上對組分中藥的定義是:組分中藥是指以中醫(yī)藥理論為基礎(chǔ),遵循中藥方劑的配伍理論與原則,由有效組分或有效部位配伍而成的現(xiàn)代中藥<sup>[7]</sup>??梢允菃挝端幍慕M分,也可以是復(fù)方的組分。復(fù)方組分中藥則是將2種或多種中藥材的有效組分提取出來,在中醫(yī)藥理論指導(dǎo)下,將這些有效組分組方配伍并制備成復(fù)方中藥制劑<sup>[8]</sup>。由于組分中藥的藥效成分基本明確,作用機(jī)制相對清楚,臨床適應(yīng)癥比較確切,而且針對性強(qiáng)、安全有效,質(zhì)量可控,成為中藥復(fù)方新藥的一個新的研究方向。

2中藥復(fù)方新藥的組方來源

中藥復(fù)方新藥的組方來源途徑比較多,但分析歸納后,主要有以下幾種:有些來源于古方、經(jīng)典方,有些源于中醫(yī)臨床應(yīng)用經(jīng)驗的驗方,有些源于藥理研究的科研方等。

2.1源于古方、經(jīng)典方的中藥復(fù)方制劑古方、經(jīng)典方是指數(shù)千年來中醫(yī)臨床所沿用的經(jīng)典方、古方,該類復(fù)方有長期臨床應(yīng)用的歷史和經(jīng)驗,其療效相對確切,但其臨床應(yīng)用多是加減方,固定組成的古方、經(jīng)典方的臨床療效仍有待確證。

2.2源于驗方的中藥復(fù)方制劑驗方是指中醫(yī)臨床實踐檢驗的確有療效的復(fù)方,有些是在古方的基礎(chǔ)上化裁而來,有些是祖?zhèn)鹘?jīng)驗方,有些在是中醫(yī)藥理論指導(dǎo)下并經(jīng)臨床應(yīng)用的基礎(chǔ)上組成的經(jīng)驗方。此類處方的有效性有一定的臨床應(yīng)用基礎(chǔ),但臨床驗方的組成不確定,中藥的劑量變化浮動較大。

2.3源于科研方的中藥復(fù)方制劑此類復(fù)方多是指在中藥有效部位(有效成分)的研究基礎(chǔ)上,依據(jù)現(xiàn)代藥理學(xué)的研究成果,結(jié)合疾病發(fā)病機(jī)制的研究進(jìn)展進(jìn)行的組方。此類處方的組方依據(jù)多缺乏中醫(yī)藥理論及臨床應(yīng)用經(jīng)驗的支持。

2.4源于數(shù)據(jù)挖掘的中藥復(fù)方制劑此類復(fù)方主要是指采用數(shù)據(jù)挖掘技術(shù),對數(shù)據(jù)庫中名老中醫(yī)醫(yī)案、驗方、古方等進(jìn)行數(shù)據(jù)挖掘,從數(shù)據(jù)中尋找復(fù)方的組方配伍規(guī)律,確定相應(yīng)的復(fù)方。此類處方的組方多缺乏臨床應(yīng)用經(jīng)驗與實驗數(shù)據(jù)的支持。

3中藥復(fù)方新藥組方設(shè)計思路

中藥復(fù)方新藥的最大特點就是配伍,就是體現(xiàn)“方有合群之妙用”,就是減毒、增效。因此,中藥復(fù)方新藥組方設(shè)計就是在中醫(yī)藥理論指導(dǎo)下,結(jié)合現(xiàn)代醫(yī)學(xué)理論,在中醫(yī)古方、經(jīng)典方、驗方、科研方等不同復(fù)方來源的基礎(chǔ)上,以中藥復(fù)方新藥的研發(fā)為導(dǎo)向,發(fā)現(xiàn)并優(yōu)化中藥復(fù)方,最終得到新的有效的中藥復(fù)方,為下一步的新藥研發(fā)奠定良好的基礎(chǔ)。

為此,作者在中藥復(fù)方新藥的研發(fā)過程中,依據(jù)中醫(yī)臨床理、法、藥、方的辨證論治過程,提出了中藥復(fù)方新藥組方設(shè)計的思路<sup>[9]</sup>,見圖1。此研究思路,不僅適用傳統(tǒng)的中藥復(fù)方新藥,也適用于現(xiàn)代中藥復(fù)方新藥,對于復(fù)方組分中藥同樣適合。

4中藥復(fù)方新藥組方設(shè)計方法

中藥復(fù)方新藥與其他新藥研發(fā)一樣,最關(guān)鍵的就是有效、安全、質(zhì)量可控,在上述研究思路的指導(dǎo)下,筆者針對新藥的具體要求,提出了幾種中藥復(fù)方新藥組方的設(shè)計方法,具體如下。

4.1中醫(yī)臨床循證的中藥組方設(shè)計近年來,中醫(yī)循證醫(yī)學(xué)的研究越來越多,但以中藥新藥為研究對象的研究多集中于中藥新藥的臨床療效評價(GCP)或中藥上市后再評價,而以中藥新藥處方篩選優(yōu)化為研究目標(biāo)的中醫(yī)臨床循證醫(yī)學(xué)研究比較少。作者所在團(tuán)隊在進(jìn)行國家重大新藥創(chuàng)制項目降糖消脂顆粒的研究中,以中醫(yī)臨床循證醫(yī)學(xué)研究為指導(dǎo),開展了中藥處方-循證研究-組方優(yōu)化等反復(fù)的臨床組方篩選優(yōu)化,建立了基于中醫(yī)臨床循證的中藥新藥組方的方法。此方法主要適合源于古方、經(jīng)典方、驗方的中藥復(fù)方新藥研發(fā)。

4.2中藥藥效循證的中藥組方優(yōu)化隨著中藥藥理學(xué)研究的不斷發(fā)展,通過正交設(shè)計、均勻設(shè)計等數(shù)理方法,以藥效學(xué)指標(biāo)為評價標(biāo)準(zhǔn)的中藥組方優(yōu)化的研究不斷涌現(xiàn)。但此種研究技術(shù)多以單一或多目標(biāo)的藥理學(xué)指標(biāo)為標(biāo)準(zhǔn),忽視了中醫(yī)藥的理論特征,篩選優(yōu)化的中藥新藥復(fù)方在動物實驗中具有非常好的藥效,但在臨床試驗中往往沒有理想的結(jié)果。為此,以治療冠心病痰瘀互結(jié)證的祛瘀化痰通脈顆粒的研發(fā)為范例,以中醫(yī)藥理論為指導(dǎo),與中醫(yī)臨床緊密結(jié)合,以中藥藥效循證研究為手段,建立了以中藥藥效實驗為主的中藥組方優(yōu)化方法<sup>[9]</sup>。此方法主要適合源于數(shù)據(jù)挖掘、科研的中藥復(fù)方新藥研發(fā)。

4.3中醫(yī)藥生物信息學(xué)的中藥組方優(yōu)化生物信息學(xué)技術(shù)的飛速發(fā)展使中醫(yī)藥信息學(xué)的發(fā)展也進(jìn)入了一個新的時期,以歷代中醫(yī)文獻(xiàn)數(shù)據(jù)庫、當(dāng)代臨床數(shù)據(jù)庫、現(xiàn)代生物信息數(shù)據(jù)庫等為數(shù)據(jù)源,采用關(guān)聯(lián)規(guī)則、復(fù)雜網(wǎng)絡(luò)、復(fù)雜系統(tǒng)熵聚類等數(shù)據(jù)挖掘技術(shù),研究中醫(yī)組方用藥規(guī)律、中藥組方組效關(guān)系,開展中藥組方優(yōu)化研究,成為目前中藥新藥研究中的亮點<sup>[10-11]</sup>。但此類方法最大的缺點是虛擬技術(shù),必須與臨床、實驗緊密結(jié)合,才能獲得驗證,同時,此類研究技術(shù)獲得的組方太寬泛,目標(biāo)性不強(qiáng)。

4.4靶位篩選的中藥組方優(yōu)化緊密結(jié)合中醫(yī)臨床用藥規(guī)律,以病變部位為研究靶位,運用中藥有效成分組織分布分析技術(shù),發(fā)現(xiàn)進(jìn)入靶位的中藥有效成分,結(jié)合中醫(yī)臨床辨證論治理論,按照中藥復(fù)方新藥技術(shù)要求,依據(jù)中藥組方原則組成候選復(fù)方,進(jìn)一步結(jié)合藥效學(xué)實驗,開展中藥組方優(yōu)化研究,開展中藥靶位篩選的組方優(yōu)化研究<sup>[12]</sup>。此法在作者所在團(tuán)隊承擔(dān)的國家重大新藥創(chuàng)制專項“基于靶位篩選的中藥新藥――通絡(luò)清腦注射粉針的研發(fā)”得到了應(yīng)用。

總之,中藥復(fù)方新藥作為中藥新藥研發(fā)的重要組成部分,是當(dāng)前乃至今后中藥新藥研發(fā)的重點,它極大體現(xiàn)了中醫(yī)的優(yōu)勢與特色。中藥復(fù)方組方是中藥復(fù)方新藥研發(fā)的第一步,是決定中藥復(fù)方新藥研發(fā)成功與失敗的關(guān)鍵。中藥復(fù)方組方本身是一個復(fù)雜的系統(tǒng)工程,涉及中醫(yī)臨床、中藥藥理、中藥化學(xué)、中藥藥代、生物信息學(xué)等多個學(xué)科,已經(jīng)引起了人們的關(guān)注<sup>[13]</sup>。今后,相信以中藥復(fù)方新藥研發(fā)為導(dǎo)向,不斷創(chuàng)新思路,充分考慮中藥復(fù)方的特點和我國中藥復(fù)方新藥的研究現(xiàn)狀,以中醫(yī)藥理論為指導(dǎo),結(jié)合現(xiàn)代醫(yī)學(xué)理論,中藥復(fù)方組方設(shè)計的研究會不斷深入,必將進(jìn)一步促進(jìn)中藥復(fù)方新藥的研發(fā)。

[參考文獻(xiàn)]

[1]汲軍,龐振英,于翠萍.“雞尾酒療法”與中醫(yī)[J].醫(yī)學(xué)信息,2009,22(12):2808.

[2]孫忠實.藥物降壓新潮流――固定劑量組合劑[J].中國藥房,2010(42):3941.

[3]張曉東,周躍華,劉璐,等.近年我國中藥新藥注冊申請情況分析[J].中國新藥雜志,2014,23(24):2845.

[4]國家食品藥品監(jiān)督管理局.中藥注冊管理補充規(guī)定[S]. 2008.

[5]國家食品藥品監(jiān)督管理局.中藥、天然藥物分類及申報資料要求[S].2002.

[6]王少卿,高穎.從證病結(jié)合模式探討證候類中藥新藥的臨床研究方法[J].環(huán)球中醫(yī)藥,2014(9):724.

[7]組分中藥:建立起現(xiàn)代中藥走向世界的橋梁[J].中醫(yī)藥導(dǎo)報, 2012(7):109.

[8]葉祖光.中藥復(fù)方與組分中藥[J].中國新藥雜志,2011(16):1487.

[9]馬永剛.中藥復(fù)方組方設(shè)計方法研究――祛瘀化痰通脈顆粒的新藥研究[D].北京:中國中醫(yī)科學(xué)院,2012.

[10]繆素芬,顏素容,郭維嘉,等.基于藥性組合模式的降壓組分中藥設(shè)計[J].中國中藥雜志, 2014, 39(13):2389.

[11]賀昱d,孫志一,張燕玲.基于醛固酮拮抗活性和專利檢索的降壓中藥組方設(shè)計[J].中國中藥雜志, 2014, 39(22):4411.

第5篇:生物信息學(xué)的定義范文

中醫(yī)藥學(xué)有著豐富的理論知識和臨床治病經(jīng)驗,具有重要的學(xué)術(shù)價值和開發(fā)利用的實用價值。但其傳統(tǒng)的知識組織方式不能適應(yīng)現(xiàn)代社會信息獲取的需求,阻礙了對中醫(yī)藥學(xué)知識與信息的有效利用。隨著計算機(jī)技術(shù)及其相關(guān)理論的發(fā)展,利用先進(jìn)的現(xiàn)代科技對中醫(yī)藥知識信息進(jìn)行重組和利用已得到認(rèn)同,相關(guān)研究也取得一定成果。將計算機(jī)領(lǐng)域先進(jìn)的本體理論與技術(shù)引入到中醫(yī)藥知識組織研究中,構(gòu)建中藥本體,實現(xiàn)中藥信息的知識化重組,可為中藥領(lǐng)域的數(shù)據(jù)挖掘和知識發(fā)現(xiàn)提供數(shù)據(jù)基礎(chǔ)[1]。

中醫(yī)藥學(xué)知識信息對現(xiàn)代生物醫(yī)學(xué)的醫(yī)療實踐和科研都有重要的意義。隨著計算機(jī)技術(shù)的發(fā)展,醫(yī)學(xué)信息研究工作也隨之逐步深入,例如在數(shù)據(jù)挖掘領(lǐng)域,醫(yī)學(xué)信息數(shù)據(jù)挖掘是比較活躍的領(lǐng)域之一,同樣在中醫(yī)領(lǐng)域也受到廣泛重視。但目前的醫(yī)學(xué)信息組織方式與數(shù)據(jù)挖掘之間存在著諸多“瓶頸”,尤其是中醫(yī)領(lǐng)域的數(shù)據(jù)挖掘研究,僅僅得到諸如“石膏與知母具有配對相關(guān)性”、“六味地黃丸可治療陰虛”等數(shù)據(jù)挖掘的結(jié)果,只是對簡單知識的簡單認(rèn)證,而其結(jié)果無法解釋。究其原因,“數(shù)據(jù)整理”是中醫(yī)藥數(shù)據(jù)挖掘研究的瓶頸。近年來,領(lǐng)域本體構(gòu)建技術(shù)已逐漸成熟,并迅速在各個領(lǐng)域形成研究熱點。構(gòu)建領(lǐng)域本體(Ontology)可以從數(shù)據(jù)整理與信息組織方面更好地實現(xiàn)數(shù)據(jù)挖掘與知識發(fā)現(xiàn)。在客觀需求和條件具備的雙重推動下,在中醫(yī)藥領(lǐng)域內(nèi)開展中藥本體構(gòu)建工作切實可行。

1 本體的概念及特點

Ontology是一個哲學(xué)概念,用于描述客觀事物的本質(zhì),通常譯為本體或本體論(在本文中稱為“本體”)。本體論與認(rèn)識論在哲學(xué)上是兩個相對的理論,認(rèn)識論指人對客觀存在的主觀認(rèn)識,而本體論則指客觀存在本身。

自20世紀(jì)90年代,Ontology引入計算機(jī)人工智能領(lǐng)域后,在計算機(jī)及相關(guān)領(lǐng)域迅速形成一個研究熱點。作為一種能在語義和知識層次上描述信息系統(tǒng)的概念模型建模工具,已被廣泛應(yīng)用于知識工程、系統(tǒng)建模、信息處理、數(shù)字圖書館、自然語言理解、語義web等領(lǐng)域之中[2]。研究人員從各自的專業(yè)角度出發(fā)對本體的理論和應(yīng)用進(jìn)行了深入研究,取得了豐富的研究成果,本體理論與技術(shù)也隨之日趨成熟。

目前得到普遍認(rèn)同的關(guān)于本體的定義是:本體是共享概念模型的、明確的、形式化的規(guī)范說明[3]。這個定義包含了概念模型、形式化、明確、共享4層含義。即本體的目標(biāo)是捕獲相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的概念或術(shù)語,并從不同層次的形式化模式上給出這些概念及概念間相互關(guān)系的明確定義。

本體不僅描述概念、術(shù)語,而且對概念、術(shù)語間的關(guān)系描述得更為廣泛、細(xì)致和全面。即,本體不僅明確了概念,同時也明確了概念間的屬性及屬性間的關(guān)系,它是從“屬性”的角度出發(fā)去確定一個概念,能夠在語義和知識層次上描述信息,從而真正達(dá)到知識理解的目的。這也是本體作為知識組織方式的最重要的特點??梢钥闯?,與傳統(tǒng)的MeSH表相比,本體描述的概念關(guān)系是網(wǎng)狀、立體的。在本體中可以描述的概念間關(guān)系有反義關(guān)系、上位關(guān)系、下位關(guān)系、整體-部分關(guān)系、部分-整體關(guān)系、轉(zhuǎn)指關(guān)系、近義關(guān)系、同義關(guān)系、動作關(guān)系等,而不僅是傳統(tǒng)的信息組織工具M(jìn)eSH中所描述的參照、用代、隸屬關(guān)系[4]。

在中醫(yī)藥領(lǐng)域中,中藥的概念術(shù)語相對較明確,選擇中藥作為突破點,首先構(gòu)建中藥本體,逐步實現(xiàn)中醫(yī)藥醫(yī)學(xué)信息的知識組織與構(gòu)建。

2 構(gòu)建意義

本體建設(shè)的目的是應(yīng)用,這方面的研究遍布人工智能、信息管理、知識管理相關(guān)的各個領(lǐng)域:①基于語義的信息檢索,特別是網(wǎng)絡(luò)搜索引擎和數(shù)字化圖書館。②基于本體的數(shù)據(jù)集成、機(jī)器學(xué)習(xí)等。③領(lǐng)域本體的應(yīng)用,比如,在生物信息學(xué)中已建成的GeneOntology,盡管只包括了part of等簡單的關(guān)系,但是對生物信息學(xué)界已經(jīng)有巨大的影響。④語義Web服務(wù)。⑤在線元數(shù)據(jù)管理和自動信息。⑥非相關(guān)文獻(xiàn)知識發(fā)現(xiàn)[5]。

中藥本體作為領(lǐng)域本體的一種,通過概念及概念間的關(guān)系全面描述中藥的本質(zhì),揭示中藥本身及中藥間復(fù)雜的功效與物質(zhì)關(guān)系,澄清中藥的知識結(jié)構(gòu),為中藥的知識表達(dá)提供數(shù)據(jù)基礎(chǔ)。例如:可以提供基于語義的信息服務(wù),通過語義檢索,為用戶提供知識層面的語義檢索服務(wù);定題服務(wù),進(jìn)行相關(guān)的數(shù)據(jù)挖掘,幫助人們發(fā)現(xiàn)隱含的知識,如通過數(shù)據(jù)挖掘分析研究,揭示藥性、藥效、物質(zhì)基礎(chǔ)間的關(guān)系,歸納構(gòu)建基于現(xiàn)代科學(xué)語言的中藥藥性表征理論體系等應(yīng)用型研究。中藥本體既具有專業(yè)領(lǐng)域性,亦具有普遍性,可應(yīng)用于其他信息工程與知識管理等方面。

3 中藥本體概念關(guān)系體系的構(gòu)建

3.1 構(gòu)建原則

領(lǐng)域本體的構(gòu)建至今沒有一個統(tǒng)一的標(biāo)準(zhǔn), Gruber在1995年提出的5條規(guī)則[6]得到較廣泛的公認(rèn)。中藥本體的構(gòu)建同樣遵循以下5條原則:①明確性和客觀性。Ontology應(yīng)該用自然語言對術(shù)語給出明確、客觀的語義定義。②完整性。所給出的定義是完整的,能表達(dá)特定術(shù)語的含義。③一致性。知識推理產(chǎn)生的結(jié)論與術(shù)語本身的含義不會產(chǎn)生矛盾。④最大單向可擴(kuò)展性。向Ontology中添加術(shù)語時,通常不需修改已有內(nèi)容。⑤最少約束。對待建模對象應(yīng)該盡可能少列出限定約束條件。

3.2 構(gòu)建方法

目前,利用現(xiàn)有的領(lǐng)域內(nèi)公認(rèn)的知識以及領(lǐng)域?qū)<业膮⑴c,是一致認(rèn)同的構(gòu)建領(lǐng)域本體的最優(yōu)方式[7]。

構(gòu)建中藥本體,首先需要解決的問題是概念關(guān)系體系的確立。在注重知識結(jié)構(gòu)關(guān)系的原則上,可借助已有的中藥分類法。中藥分類方法主要有按藥物功能、藥用部分、有效成分、藥材自然屬性和親緣關(guān)系分類等。中藥本體概念關(guān)系體系的構(gòu)建采用比較成熟的自然屬性分類法(主要參照《中華本草》[8]的現(xiàn)代自然屬性分類法),即采用植物學(xué)分類法、動物學(xué)分類法,能夠更好地反映中藥之間的內(nèi)在聯(lián)系及其變異特征。此外,該分類法還有以下優(yōu)點:對藥物來源、屬性、藥物部位等一目了然,條理清晰便于查檢,便于更新和修改,便于不同專業(yè)的人操作中藥本體的建設(shè)工具。

各個中藥類目下設(shè)定27個屬性,屬性設(shè)置包括:正名、異名、釋名、品種考證、發(fā)生發(fā)展史、產(chǎn)地、原植(動、礦)物、栽培(養(yǎng)殖)要點、采收加工、貯藏、藥材及產(chǎn)銷、藥材鑒別、化學(xué)成分、藥理、炮制、藥性、功能與主治、應(yīng)用與配伍、用法用量、使用注意、附方、制劑、現(xiàn)代臨床研究、藥論、集解、附注、參考文獻(xiàn)。中藥的屬性可以根據(jù)需要與新發(fā)現(xiàn)進(jìn)行修改。

通過屬性參數(shù),從各個角度盡可能全面地描述中藥,更精確、全面地確定概念,并顯示概念間的關(guān)系。其中,中藥藥性、藥理的研究有助于闡明中藥理論的科學(xué)實質(zhì),為中藥藥性研究提供數(shù)據(jù)挖掘的基礎(chǔ)資源,實現(xiàn)中藥藥性的知識發(fā)現(xiàn)與理論創(chuàng)新。

4 結(jié)語

領(lǐng)域本體的開發(fā)和完善是一個反復(fù)疊加的過程,沒有一種“唯一”的途徑或方法,但無論從客觀世界具體的角度或者是從邏輯抽象的角度出發(fā),領(lǐng)域本體中概念的設(shè)計都應(yīng)該貼近于研究者要研究的專業(yè)領(lǐng)域中客觀對象和對象間的關(guān)系法則[9]。因此,中藥本體構(gòu)建模式是一種探索,建成之后仍然需要維護(hù)和不斷進(jìn)化。據(jù)此還可以繼續(xù)構(gòu)建中醫(yī)本體,實現(xiàn)中醫(yī)藥領(lǐng)域內(nèi)知識信息的知識化組織與利用。

參考文獻(xiàn)

[1] 劉 耀,段慧明,穗志方.非相關(guān)文獻(xiàn)知識發(fā)現(xiàn)的數(shù)據(jù)基礎(chǔ)研究——以中醫(yī)藥古文獻(xiàn)語言知識庫的構(gòu)建為例[J].情報雜志,2006,(9):21―26.

[2] 曹樹金,馬利霞.論本體與本體語言及其在信息檢索領(lǐng)域的應(yīng)用[J].情報理論與實踐,2004,(6):632―637.

[3] Studer R, Benjamins VR, Fensel D. Knowledge engineering, principles and methods[J]. Data and knowledge engineering,1998, 25(1-2):161―197.

[4] 牟冬梅,崔艷玲.MeSH、本體論在醫(yī)學(xué)知識組織中的作用[J].情報雜志, 2005,(7):120-122.

[5] 袁 媛.領(lǐng)域本體建設(shè)的方法論和工具研究[D].中國人民大學(xué)碩士學(xué)位論文,2004.

[6] Peter D Karp, Thomas R Gruber. A generic knowledge-base access protocol[A]. Proceedings of the international joint conferences on artificial intelligence[C]. Montreal,1995.

[7] 劉 耀,穗志方.領(lǐng)域Ontology概念描述體系構(gòu)建方法研究[J].大學(xué)圖書館學(xué)報,2006,(5):28-33.

第6篇:生物信息學(xué)的定義范文

[關(guān)鍵詞]金融時間序列;相空間重構(gòu);預(yù)測

[中圖分類號]TP311[文獻(xiàn)標(biāo)識碼]A[文章編號]1005-6432(2014)43-0100-02

1引言

時間序列的預(yù)測問題已在各個領(lǐng)域得到廣泛關(guān)注,如生物信息學(xué)、神經(jīng)信息學(xué)、金融工程、經(jīng)濟(jì)學(xué)等。時間序列的最優(yōu)預(yù)測非常重要,它會為決策者進(jìn)行決策提供重要的參考信息。

行業(yè)指數(shù)與綜合指數(shù)都是證券市場這個復(fù)雜系統(tǒng)產(chǎn)生的時間序列,這些時間序列之間相互作用影響,一段時間內(nèi)會出現(xiàn)相同趨勢的演化而另一時刻則會產(chǎn)生相互背離的演化。這種演化中的背離現(xiàn)象說明多個時間序列中所包含的復(fù)雜系統(tǒng)演化信息不同,因此利用多個行業(yè)指數(shù)時間序列進(jìn)行證券市場的復(fù)雜系統(tǒng)重構(gòu)應(yīng)比簡單采用單一觀測量的重構(gòu)更加貼近真實系統(tǒng)。

2多元時間序列的定義

現(xiàn)實中,多元時間序列以各種形式廣泛存在,現(xiàn)首先給出多元時間序列的數(shù)學(xué)定義。

一系列按照時間先后順序記錄的值S={vi(1), vi(2), …, vi(t), …, vi(n)}稱為時間序列。其中t(t=1,2,…,n)表示時刻,i(i=1,2,…,m)表示變量,vi(t)表示第i個變量在t時刻上的記錄值當(dāng)m>1時,S為多元時間序列(MTS);此多元時間序列為確定性的數(shù)值類型的數(shù)據(jù),可以用m×n矩陣表示,m為變量數(shù),n為時間點數(shù)。

在多元時間序列中由于各變量間量綱等方面的差異,因此需先將數(shù)據(jù)正則化,以減少隨機(jī)波動干擾、降低算法計算復(fù)雜度。同時,為保證MTS相似的有效性和準(zhǔn)確性對MTS數(shù)據(jù)集也有一定的初始要求,因此這里給出同構(gòu)的MTS的定義,以限定研究對象范圍。

同構(gòu)的MTS需要滿足以下三個要求:①對于MTS數(shù)據(jù)集,各序列的變量維數(shù)相同,變量之間一一對應(yīng)且表示相同的含義;②對于某一MTS樣本,各變量數(shù)值的記錄時刻對應(yīng),且具有相同的時間粒度;③MTS需經(jīng)正則化處理。

3多變量相空間重構(gòu)參數(shù)的選取方法

在非線性多變量數(shù)據(jù)分析中,采用虛假鄰點法進(jìn)行相空間重構(gòu)是一種簡單易行的常用方法。該算法具有計算過程簡單、計算速度快等特點。虛假鄰點法是由 Kennel 等人提出的算法,該方法的基本思想是當(dāng)嵌入維數(shù)m變成m+1時,考察信號xn的鄰點中哪些是真實的,哪些是虛假的鄰點,當(dāng)沒有虛假鄰點時,可以認(rèn)為幾何結(jié)構(gòu)完全被打開,此時的m即為所求的最佳嵌入維數(shù)。設(shè)xn的最近鄰點為xη(n),當(dāng)m1增大到m1+1時,重新計算兩個信號之間的距離并求與原距離之間的比值:

xη(n)+xn(m1…ml+1…mL)-xη(n)-xn(m1…ml…ML)xη(n)-xn(m1…ml…mL)≥σ0

如果距離變化的比值大于σ0,則xη(n)是xn的虛假鄰點。對于多維信號(m1,…,ml,…mL)從(1,…,1,…,1)開始,每次ml增加1,直到虛假鄰點的比例小于δ,則可以認(rèn)為吸引子的幾何機(jī)構(gòu)完全打開,此時的(m1,…,ml,…mL)為最佳嵌入維數(shù)。根據(jù)經(jīng)驗通常預(yù)定義σ0=10,δ=5%。

4相空間重構(gòu)

相空間重構(gòu)理論是研究混沌理論的基礎(chǔ)。Takens和Packard 等人認(rèn)為系統(tǒng)中任意一分量的演化都是由與之相互作用的其他分量所決定的。因此,這些相關(guān)分量的信息隱含在任意一個分量的發(fā)展過程中,重構(gòu)系統(tǒng)相空間只需考察一個分量。

設(shè)X表示觀測到的混沌時間序列,x(t),t=1,2,…,n,根據(jù)Takens定理,進(jìn)行相空間重構(gòu),則在狀態(tài)空間中重構(gòu)后的狀態(tài)矢量可以表示為:Xi=(xi,xi+1,…,xi+(m-1)t)T(i=1,2,…,i+(m-1)t),其中i+(m-1)是重構(gòu)相空間中的相點個數(shù),t是延遲時間,m是嵌入維數(shù)。Takens 證明了可以找到一個合適的嵌入維數(shù),即如果延遲坐標(biāo)的維數(shù)m≥2d+1,d是動力系統(tǒng)的維數(shù),在這個嵌入維空間里就可以把吸引子恢復(fù)出來。

5復(fù)雜非線性時間序列預(yù)測

結(jié)構(gòu)復(fù)雜的非線性數(shù)據(jù),不適宜從數(shù)據(jù)特性出發(fā)分析建模,而唯象預(yù)測方法就不關(guān)心數(shù)據(jù)本身所具有的特性,只是利用現(xiàn)存歷史數(shù)據(jù)去逼近模型進(jìn)而預(yù)測未來。1989 年 Billings 等人提出的非線性自回歸滑動平均(NARMA)模型,具有形式簡潔、高度概括等特點。

主要建模步驟如下:

(1)對時間序列進(jìn)行零均值平穩(wěn)化處理。時間序列一般可分為平穩(wěn)時間序列和趨勢性序列。時間序列的趨勢又分為線性趨勢和非線性趨勢。若時間序列為非平穩(wěn)序列,具有向下或向上的趨勢,建模之前需要進(jìn)行序列平穩(wěn)化處理,即零均值化、平穩(wěn)化處理。

(2)逐漸增加模型階數(shù),擬合ARMA(n,n-1)模型。即一階、一階增加模型階數(shù),模型參數(shù)采用非線性最小二乘法估計,具體算法采用最速下降法。選擇殘差序列最小方差對應(yīng)的模型作為初選模型。

(3)模型適應(yīng)性檢驗。

(4)求最優(yōu)模型。系統(tǒng)意義上的最優(yōu)模型不僅是一個適應(yīng)模型,而且是一個經(jīng)濟(jì)的模型。因此還需要檢驗?zāi)P褪欠癜?shù),若有,可用F檢驗判斷是否可以刪去,擬合較低階模型,進(jìn)而得到系統(tǒng)意義上的最優(yōu)模型。

(5)時間序列預(yù)測。

6問題與展望

基于非線性動力學(xué)的時間序列分析和預(yù)測技術(shù)的主要支撐理論是20世紀(jì)80年代初PTakens和RMane提出的相空間延遲重構(gòu)技術(shù),這一方法后來由 TSaner等作了完善和推廣。實際環(huán)境中,對復(fù)雜系統(tǒng)的觀測時間序列通常是有限長的,甚至很短,具有噪聲,而另一方面觀測時間序列是同時產(chǎn)生的多維時間序列,這些時間序列中可能包含大量的冗余信息也可能包含著十分有用的復(fù)雜系統(tǒng)演化信息。本文研究無疑能為金融機(jī)構(gòu)與投資者深入認(rèn)識金融市場規(guī)律、有效地進(jìn)行金融管理、提高金融投融資效率等提供新的數(shù)量技術(shù)支撐,對促進(jìn)金融市場技術(shù)分析理論與方法的創(chuàng)新和發(fā)展具有重要的理論與現(xiàn)實意義。

參考文獻(xiàn):

[1]楊璐,高自友基于神經(jīng)網(wǎng)絡(luò)的時序預(yù)測模型研究[J].北方交通大學(xué)學(xué)報,1998,22(3):53-56

[2]李愛國,覃征大規(guī)模時間序列數(shù)據(jù)庫降維及相似搜索[J].計算機(jī)學(xué)報,2005,1(9):1447-1475.

[3]王達(dá),榮岡時間序列的模式距離[J].浙江大學(xué)學(xué)報(工學(xué)版),2004,39(7):795-798.

[4]李軍,劉君華一種新型廣義RBF神經(jīng)網(wǎng)絡(luò)在混沌時間序列預(yù)測中的研究[J].物理學(xué) 報,2005,54(10):4569-4957

[5]張勇,關(guān)偉基于最大Lyapunov指數(shù)的多變量混沌時間序列預(yù)測[J].物理學(xué)報,2009,58(02):756-763

第7篇:生物信息學(xué)的定義范文

關(guān)鍵詞:最大連通子圖;最大團(tuán);完美匹配

中圖分類號:TP18;O157 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2008)05-00ppp-0c

1 前言

圖論是組合數(shù)學(xué)和計算機(jī)理論科學(xué)的重要學(xué)科之一,也是數(shù)學(xué)和理論計算機(jī)中近年來發(fā)展最快的學(xué)科之一,其主要應(yīng)用除了在計算機(jī)領(lǐng)域外,還廣泛的應(yīng)用于其它學(xué)科,例如經(jīng)濟(jì)、生物、數(shù)學(xué)等等。這里我們主要介紹其在生物學(xué)中的有趣應(yīng)用。

2 圖論在生物學(xué)方面即研究蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的有效應(yīng)用

我們知道蛋白質(zhì)結(jié)構(gòu)預(yù)測問題就是如何從蛋白質(zhì)的氨基酸序列出發(fā)預(yù)測它的功能、構(gòu)象折疊等問題。這是一個人類破譯生命奧秘的重大問題。這個問題一旦得到解決,科學(xué)家們就可以最終闡明遺傳信息傳遞的全過程,從而大大有助于了解蛋白質(zhì)空間結(jié)構(gòu)與其功能之間的關(guān)系。近年來,“圖”的概念已被應(yīng)用于蛋白質(zhì)結(jié)構(gòu)預(yù)測的相關(guān)研究之中,如:尋找圖的最大連通子圖研究蛋白質(zhì)的自折疊問題、圖的連接矩陣的特征矢量分析研究蛋白質(zhì)的活性位點和配體結(jié)合位點的問題、圖的完美匹配方法預(yù)測二硫鍵的問題等,取得了一定的成果,本文主要對這些圖論方法在蛋白質(zhì)結(jié)構(gòu)預(yù)測中取得的一些新的研究進(jìn)展作以綜述。

2.1 最大連通子圖

若有圖G(V,E),如果有另一圖G’(V’,E’),且V’和E’分別是V和E的子集,且E’中的一條邊e’(vi,vj)必須與E中的一條邊e(vi,vj)相對應(yīng),稱G’為G的子圖。如果圖G’的任意兩個頂點之間均是連通的,則稱G’是一個連通圖。若G是不連通圖,它的每個連通的部分G’稱為G的一個連通子圖。

1997年我國學(xué)者彭征宇在‘蛋白質(zhì)中的自折疊單元’一文中,把一個蛋白質(zhì)的結(jié)構(gòu)用一個數(shù)學(xué)上的“圖”來表示。圖上的每一個頂點表示一個二級結(jié)構(gòu),而每一條邊則表示兩個二級結(jié)構(gòu)單元之間的相互作用。那么,這些相互作用的強(qiáng)度將通過每兩個二級結(jié)構(gòu)單元間有多少對重原子(指碳、氮、氧等)之間的距離在0.5nm(5埃)之內(nèi)來決定。兩個相鄰的或平行的二級結(jié)構(gòu)單元之間的相互作用將大于距離較遠(yuǎn)的或垂直的二級結(jié)構(gòu)之間的相互作用。然后,簡化“圖”:只保留對于每一個頂點最強(qiáng)的相互作用及超過這個最大值60%的那些相互作用。對每一個頂點來說,它的鄰點對它的相互作用密度定義為它與鄰點的相互作用除以代表這個頂點的二級結(jié)構(gòu)的長度。保留相互作用密度超過整個圖中最強(qiáng)相互作用密度20%的那一部分,其余的相互作用所對應(yīng)的那些邊將被舍棄。這樣所得到的圖將是非對稱的,即對某一頂點來說,它的鄰點對它來說可能是重要的,而同時這個頂點對它的鄰點來說卻是不重要的,因為它的鄰點與其他頂點有更強(qiáng)的相互作用。在經(jīng)過簡化的圖中,尋找具有自折疊能力的部分相當(dāng)于尋找這個圖的最大連通子圖。

他們通過對牛胰蛋白酶抑制蛋白(PDB5PTI 58amino acidsresidues)和嗜熱菌蛋白酶(thermolysin)用圖論的方法進(jìn)行了預(yù)測,這個預(yù)測與實驗結(jié)果相符合。他們認(rèn)為,總體上,這種方法對于預(yù)測已知結(jié)構(gòu)蛋白中的自折疊單元有大約70%的成功率。與以前的方法相比較,他們的方法的最大優(yōu)點是所預(yù)測的自折疊單元不需要由連續(xù)的氨基酸序列所組成。強(qiáng)調(diào)了理論與實驗的比較,以及盡可能少地引入能量參數(shù)等優(yōu)勢。

2.2 最大團(tuán)

若簡單圖G(V,E)的子圖S是完全圖,即滿足其任意兩個頂點之間均有且只有一條邊相連,則稱S是G的團(tuán)。1998年Samudrala R和Moult J,把一個蛋白質(zhì)的同源模建中的3D結(jié)構(gòu)預(yù)測問題成功地轉(zhuǎn)換為一個圖論中的尋找最大團(tuán)的問題。

在同源模建中,主鏈構(gòu)像的大部分可以從一個或多個相關(guān)的母板結(jié)構(gòu)獲得,僅僅是那些被認(rèn)為與母板結(jié)構(gòu)有明顯不同的主鏈和側(cè)鏈構(gòu)像,才用于轉(zhuǎn)換為尋找最大團(tuán)的問題。

在氨基酸序列中的一個殘基,它的每一個可能的構(gòu)象代表圖中的一個頂點。邊連接兩個頂點(殘基)。頂點和邊根據(jù)一些安排好的標(biāo)準(zhǔn)賦權(quán)。一旦這個圖被構(gòu)造出來,所有的團(tuán)中的極大團(tuán)就可用Bron & Kerbosch提出的CF(clique-finding)算法找到。那些權(quán)值最好的團(tuán)被認(rèn)為與天然結(jié)構(gòu)最相似。

一個殘基的每個可能的構(gòu)象在圖中表示一個頂點。頂點的權(quán)根據(jù)側(cè)鏈的原子與局部主鏈原子之間的相互作用程度賦權(quán)。要一直考慮到在代表頂點的殘基位置兩側(cè)的任意四個殘基的主鏈的原子和這個殘基的主鏈原子,被用來計算權(quán)值。邊連接一對頂點,邊的權(quán)根據(jù)代表頂點的殘基之間的相互作用程度賦權(quán)。對于空間彼此碰撞的頂點之間不連邊同一殘基具有不同的構(gòu)象之間不連邊。頂點和邊的權(quán)值通過一個全原子距離條件概率賦權(quán)。簡單地說,要求的概率通過在一個265個高清晰的X-射線測出的非同源蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中,計算原子類型對的距離的頻數(shù)而得到。計算公式如下:

給定一個具有n個頂點和m個邊的團(tuán),對應(yīng)構(gòu)像的分值用這個團(tuán)上面的邊和頂點的和來表示:

他們的方法與傳統(tǒng)的方法相比,不合適的構(gòu)像被提前舍棄,具有搜索適應(yīng)性構(gòu)像速度快的優(yōu)點,團(tuán)的方法克服了連續(xù)能量函數(shù)搜索方法遇到能量勢壘和過早掉入局部能量最小的

勢阱里的缺點。他們用這種圖論的方法對同源蛋白質(zhì)進(jìn)行了預(yù)測取得了令人鼓舞的結(jié)果,同時證明,這種方法應(yīng)用于同源模建的loop區(qū)域的預(yù)測具有較好的前景。

2.3 完美匹配

在無向圖G(V,E)中,對邊集E的任一子集MAE,如果M中任意兩條邊都不相鄰,則稱M為圖G的一個匹配。若G的每個頂點都是M飽和點,則稱M是G的完美匹配。2001年P(guān)iero Fariselli和Rita Casadio把預(yù)測二硫鍵連接問題等價為一個尋找圖的最大權(quán)的完美匹配問題。

在蛋白質(zhì)結(jié)構(gòu)預(yù)測中,一個主要的問題是在富含半胱氨酸的蛋白質(zhì)中準(zhǔn)確確定二硫鍵的位置。在組成蛋白質(zhì)的20個氨基酸中,半胱氨酸惟一的具有一種屬性,即它們之間可以形成二硫鍵有助于蛋白質(zhì)三維結(jié)構(gòu)的穩(wěn)定。它使多肽鏈的兩個不同的區(qū)域之間能夠緊密地靠攏起來。在蛋白質(zhì)折疊預(yù)測中,確定二硫鍵可以大大地減少搜索構(gòu)像空間。氨基酸序列中每一個半胱氨酸殘基代表圖中的一個頂點V,邊E連接一對頂點(Cys-Cys),邊依據(jù)相應(yīng)規(guī)定賦權(quán)W,構(gòu)成一個賦權(quán)的完全圖G,應(yīng)用Edmonds-Gabow的算法,找到G中具有

最大權(quán)的完美匹配。則這個完美匹配對應(yīng)正確的二硫鍵的連接方式。權(quán)值的獲得考慮一級結(jié)構(gòu)中半胱氨酸殘基位置前后的各5個殘基賦權(quán),數(shù)據(jù)來源于PDB蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中的726個高分辨率蛋白質(zhì)中二硫鍵的連接模式的統(tǒng)計結(jié)果。他們利用這種方法對蛋白質(zhì)折疊中的二硫鍵連接進(jìn)行了預(yù)測研究,結(jié)果說明二硫鍵的形成與其序列模式有這重要的聯(lián)系,通過研究半胱氨酸殘基在序列中局部環(huán)境因素,可以預(yù)測二硫鍵的結(jié)構(gòu)。對于具有4個二硫鍵的蛋白質(zhì)結(jié)構(gòu),這種方法的預(yù)測正確率高于隨機(jī)預(yù)測的17倍。

3 總結(jié)以及其他研究(other researches)

圖論的方法較早的文獻(xiàn)是應(yīng)用于二級結(jié)構(gòu)的模體比較和折疊片層的拓?fù)浣Y(jié)構(gòu)的分析;最近二十年,蛋白質(zhì)折疊問題已經(jīng)成為了許多理論學(xué)家和實驗學(xué)家極大關(guān)注的課題。圖論還應(yīng)用在蛋白質(zhì)折疊的酶動力學(xué)的表達(dá)分析上;Bahar等應(yīng)用Kirchoff’s矩陣去描述在蛋白質(zhì)中的空間相鄰殘基并且闡明了幾個屬性,比如:振動力學(xué)和蛋白質(zhì)中的熱波動等。PatraSM和Vishveshwara S用圖論的特征參數(shù)尋找蛋白質(zhì)中的主鏈團(tuán),同時發(fā)現(xiàn)在團(tuán)的相似區(qū)域蛋白質(zhì)結(jié)構(gòu)也相似。我們相信,隨著研究的深入,圖論在生物學(xué)中的應(yīng)用會越來越來廣泛和實際。讓我們翹首以待!

參考文獻(xiàn):

[1]郝柏林,張淑譽.生物信息學(xué)手冊[M].上海科學(xué)技術(shù)出版社,2000.

[2]Krane D E , Raymer M L. 孫嘯,陸祖宏,謝建明,譯.生物信息學(xué)概論[M].北京:清華大學(xué)出版社,2004.

[3]彭征宇.蛋白質(zhì)中的自折疊單元[A].見:郝柏林劉寄星.理論物理與生命科學(xué)[M] .上海:上??茖W(xué)技術(shù)出版社,1997.

[4]蘭家隆,劉軍.應(yīng)用圖論及算法[M].成都:電子科技大學(xué)出版社,1995.

[5]肖位樞.圖論及其算法[M].北京:航空工業(yè)出版社,1993.

[6]來魯華,等.蛋白質(zhì)的結(jié)構(gòu)預(yù)測與分子設(shè)計[M].北京:北京大學(xué)出版社,1993.

收稿日期:2007-12-10

第8篇:生物信息學(xué)的定義范文

關(guān)鍵詞:計算機(jī)軟件,數(shù)據(jù)集成,元數(shù)據(jù),異構(gòu)數(shù)據(jù)源

 

1 引言

隨著時代的不斷發(fā)展,人類對科學(xué)領(lǐng)域的研究也在不斷地深入。為了應(yīng)對具體研究領(lǐng)域技術(shù)(如生物信息學(xué))高速發(fā)展而引發(fā)的數(shù)據(jù)存儲、分析等的應(yīng)用需求,新的數(shù)據(jù)庫不斷建立,存儲的數(shù)據(jù)呈指數(shù)級增長,研究人員需要的數(shù)據(jù)也開始不只限于某個單一數(shù)據(jù)庫,而是分散在多個相關(guān)數(shù)據(jù)源中。對高度復(fù)雜的海量實驗數(shù)據(jù)進(jìn)行存儲、共享與整合成為了科學(xué)研究中最重要的問題之一。目前各個大型數(shù)據(jù)庫是由不同的研究機(jī)構(gòu)在不同技術(shù)與科研條件下根據(jù)其自身的需要建立的,研究或應(yīng)用的背景也各不相同,從而形成語法、語義、模式等方面的異構(gòu)[1]。除此之外,這些數(shù)據(jù)庫大都具有分布、自治和動態(tài)的特點,給科研人員的訪問和使用帶來了極大的影響。伴隨著研究發(fā)展而新建立的數(shù)據(jù)庫也有類似的問題。諸多的異構(gòu)數(shù)據(jù)源嚴(yán)重影響了數(shù)據(jù)的共享與整合,給研究工作造成了許多困難。

多年來,人們試圖通過各種辦法來解決數(shù)據(jù)整合的問題。聯(lián)邦數(shù)據(jù)庫、中間件和數(shù)據(jù)倉庫等技術(shù)在不同的著重點和應(yīng)用上部分解決了數(shù)據(jù)共享問題,然而數(shù)據(jù)源模式的異構(gòu)問題還是沒有從根本上得到解決。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),是對數(shù)據(jù)源所存儲數(shù)據(jù)的詳細(xì)描述,不僅包含了數(shù)據(jù)的名稱、類型等信息,還提供了數(shù)據(jù)的上下文描述信息,例如數(shù)據(jù)的來源、取值范圍、業(yè)務(wù)規(guī)則等。如果將各數(shù)據(jù)源的元數(shù)據(jù)按照一個統(tǒng)一的標(biāo)準(zhǔn)提取出來集中存放在一個元數(shù)據(jù)庫中,并映射到按照用戶的查詢要求而建立的用戶模式上,就能夠通過解析用戶模式得到對應(yīng)的各數(shù)據(jù)源模式查詢;對各數(shù)據(jù)源查詢結(jié)果進(jìn)行連接、合并等操作,并按用戶模式進(jìn)行輸出,就能夠?qū)崿F(xiàn)數(shù)據(jù)的共享和整合?;谝陨戏治觯覀兲岢隽嘶谠獢?shù)據(jù)的數(shù)據(jù)資源共享與整合方案,本文討論的內(nèi)容是整個方案中的一個組成部分,采用了用戶模式與數(shù)據(jù)源模式之間互相映射的方法解決數(shù)據(jù)集成的問題,主要對建立用戶模式、生成用戶模式與數(shù)據(jù)源元數(shù)據(jù)映射以及生成查詢語句完成查詢進(jìn)行闡述。

2工作基礎(chǔ)

在引言部分中已經(jīng)介紹過,元數(shù)據(jù)包含了對數(shù)據(jù)源中數(shù)據(jù)的詳細(xì)描述。因此,通過抽取各數(shù)據(jù)源的元數(shù)據(jù),可以對要集成的數(shù)據(jù)源在結(jié)構(gòu)上有一個更直觀的認(rèn)識。與數(shù)據(jù)倉庫的集成方法相比,使用元數(shù)據(jù)進(jìn)行數(shù)據(jù)集成有以下特點:(1)元數(shù)據(jù)庫中存儲的是各數(shù)據(jù)源的結(jié)構(gòu)信息,按照統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行描述后集中存放在元數(shù)據(jù)庫中,能夠保持各數(shù)據(jù)源的結(jié)構(gòu)特征。。(2)建立元數(shù)據(jù)庫所抽取的多個數(shù)據(jù)源的元數(shù)據(jù)與海量的實驗數(shù)據(jù)相比存儲壓力要小得多,而且由于各數(shù)據(jù)源的結(jié)構(gòu)相對保持穩(wěn)定,結(jié)構(gòu)基本不會變化或變化較小,元數(shù)據(jù)更新頻率遠(yuǎn)低于數(shù)據(jù)更新頻率,同時在查詢時是通過元數(shù)據(jù)直接訪問相關(guān)的數(shù)據(jù)源,能夠保證查詢結(jié)果的準(zhǔn)確與全面。

公共倉庫元模型(Common Warehouse Metamodel, CWM)是一個完整的描述數(shù)據(jù)倉庫和業(yè)務(wù)分析領(lǐng)域的元模型,提供了構(gòu)建元數(shù)據(jù)所需的語法和語義。CWM元模型具有良好的樹狀層次結(jié)構(gòu)和繼承機(jī)制,已經(jīng)獲得了廣泛的支持,成為了元數(shù)據(jù)的一個重要標(biāo)準(zhǔn)。劉文杰等設(shè)計并實現(xiàn)了一個元數(shù)據(jù)提取與導(dǎo)入工具M(jìn)etaPro 1.0[2],提供了一個基于CWM元模型的元數(shù)據(jù)集成解決方案,能夠根據(jù)各相關(guān)數(shù)據(jù)源DBMS的SQL腳本生成元數(shù)據(jù)庫,并針對不同DBMS生成的SQL腳本建立了相應(yīng)的處理模塊。由于CWM過于復(fù)雜和龐大,因此MetaPro 1.0對其進(jìn)行了適當(dāng)?shù)牟脺p,既保持了該元數(shù)據(jù)標(biāo)準(zhǔn)在數(shù)據(jù)整合應(yīng)用領(lǐng)域的通用型與兼容性,又剔除了CWM中與數(shù)據(jù)整合無關(guān)的部分,縮小了元數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)模,形成了一個適用于多數(shù)據(jù)源數(shù)據(jù)集成的公共元數(shù)據(jù)標(biāo)準(zhǔn)(圖1)。該工具是整個整合方案的基礎(chǔ)和重要組成部分。通過該工具生成的元數(shù)據(jù)庫可以訪問需要進(jìn)行集成的各異構(gòu)數(shù)據(jù)源,為本文討論的內(nèi)容奠定了基礎(chǔ)。

圖1 CWM體系結(jié)構(gòu)及裁減情況(深色區(qū)域為裁減后的部分)

3關(guān)鍵技術(shù)研究

元數(shù)據(jù)庫的建立解決了數(shù)據(jù)訪問的障礙,而按照用戶的查詢需求對異構(gòu)數(shù)據(jù)進(jìn)行整合則是最終目標(biāo)。本節(jié)將針對實現(xiàn)數(shù)據(jù)整合的關(guān)鍵問題進(jìn)行討論。

3.1建立用戶模式

由于研究的不斷深入,數(shù)據(jù)整合的需求使得相關(guān)知識領(lǐng)域內(nèi)出現(xiàn)了一些公認(rèn)的規(guī)范,例如生物信息學(xué)的基因本體(Gene Ontology,GO),使得各數(shù)據(jù)源對數(shù)據(jù)語義的描述有了統(tǒng)一的參照標(biāo)準(zhǔn),方便了研究人員對數(shù)據(jù)的訪問和理解,為數(shù)據(jù)集成奠定了軟件上的基礎(chǔ)。但是由于應(yīng)用目的和背景不同,“同一概念從不同數(shù)據(jù)源中可得到完全不同的屬性信息”[3]。因此對于用戶來說,數(shù)據(jù)集成就是將從各數(shù)據(jù)源得到的數(shù)據(jù)按照查詢需求進(jìn)行清理與整合,以GO等規(guī)范作為連接的媒介,轉(zhuǎn)換為用戶所希望的樣式。整合后的數(shù)據(jù)在概念上依然是按“表”或“視圖”的形式存在的,而且每列的數(shù)據(jù)都來源于各異構(gòu)數(shù)據(jù)源,整合時可能會因為類型不同而出現(xiàn)錯誤。因此,有必要根據(jù)用戶需求建立相應(yīng)的用戶模式,統(tǒng)一查詢的數(shù)據(jù)類型和名稱。。我們借鑒了DBMS對視圖的管理形式,用戶在建立自己的模式時類似于建立了一個虛擬的表,可以定義并管理“表名”、“字段名”、“類型”和“字段長度”等相關(guān)內(nèi)容,并且按照查詢需求的不同可以建立多個虛擬表,根據(jù)需要隨時可以進(jìn)行調(diào)整。用戶模式的“字段”就是用戶需要的屬性信息,其類型和長度體現(xiàn)了用戶對查詢結(jié)果的要求。這種建立虛擬表的方式相當(dāng)于定義了用戶模式的元數(shù)據(jù),因此在存儲上與數(shù)據(jù)源元數(shù)據(jù)的形式相同,都是整合方案數(shù)據(jù)庫中的數(shù)據(jù)。這也為建立用戶模式與數(shù)據(jù)源元數(shù)據(jù)之間的映射做了準(zhǔn)備。

3.2生成用戶模式與數(shù)據(jù)源元數(shù)據(jù)之間的映射

只有用戶模式是不夠的,它必須與數(shù)據(jù)源元數(shù)據(jù)產(chǎn)生關(guān)聯(lián)才能從數(shù)據(jù)源獲得需要的數(shù)據(jù)。因此,用戶模式與數(shù)據(jù)源元數(shù)據(jù)之間的映射就成為了一個不可缺少的重要步驟。映射的依據(jù)就是以用戶模式為參照,由用戶選擇需要整合的表,將需要集成的具有相同語義的數(shù)據(jù)源元數(shù)據(jù)關(guān)聯(lián)到相關(guān)的用戶模式“字段”上,這時不同的數(shù)據(jù)源就會以用戶模式為媒介相互產(chǎn)生一定的關(guān)聯(lián),只要對用戶模式及相應(yīng)的映射關(guān)系進(jìn)行分析就能得到各數(shù)據(jù)源的實際查詢語句,實現(xiàn)對異構(gòu)數(shù)據(jù)源的查詢。。需要注意的是這種映射對已確定的用戶模式和數(shù)據(jù)源來說是唯一的,不能出現(xiàn)用戶模式的同一“字段”與數(shù)據(jù)源表中多個字段對應(yīng)或數(shù)據(jù)源表中的同一字段與用戶模式的多個“字段”相對應(yīng)的情況。

3.3生成查詢語句完成查詢

通過分析用戶模式及其對應(yīng)的映射關(guān)系,就能把用戶模式的查詢分解為對各異構(gòu)數(shù)據(jù)源的查詢,再把各數(shù)據(jù)源的查詢結(jié)果按照用戶模式進(jìn)行整合及清理后,就是用戶模式所希望得到的結(jié)果。具體步驟如下:

(1)根據(jù)需要對用戶模式進(jìn)行裁減,生成用戶視圖,并選擇相應(yīng)的映射關(guān)系

(2)對用戶視圖進(jìn)行分析,根據(jù)用戶視圖的“字段”以及相應(yīng)的映射關(guān)系確定每個數(shù)據(jù)源需要查詢的字段,并用用戶視圖的“字段”作為數(shù)據(jù)源表的字段的別名;如果用戶視圖“字段”在數(shù)據(jù)源中沒有映射關(guān)系,則數(shù)據(jù)源字段以NULL或空值進(jìn)行代替

(3)根據(jù)確定的數(shù)據(jù)源字段生成各數(shù)據(jù)源的查詢語句

(4)按照各數(shù)據(jù)源在映射中的先后順序,從頭到尾依次對查詢語句以存放公認(rèn)的規(guī)范內(nèi)容的字段為關(guān)鍵字進(jìn)行外連接操作,并且每次的連接結(jié)果都作為新的查詢語句與下一個進(jìn)行外連接并消除重復(fù)字段,直到生成一個完整的查詢語句

(5)執(zhí)行生成的查詢語句,完成查詢,并按用戶視圖的樣式輸出

根據(jù)設(shè)計的構(gòu)想,集成查詢體系的示意圖如圖3所示。

圖3 集成查詢體系示意圖

4 問題及改進(jìn)

使用模式映射的方式,通過用戶模式連接各異構(gòu)數(shù)據(jù)源,在一定程度上實現(xiàn)了數(shù)據(jù)整合的目的。但是來自不同數(shù)據(jù)源的數(shù)據(jù),在數(shù)據(jù)內(nèi)容、數(shù)據(jù)格式、數(shù)據(jù)質(zhì)量等方面有著很大差別,無法保證數(shù)據(jù)的一致性;數(shù)據(jù)類型轉(zhuǎn)換是以用戶模式為標(biāo)準(zhǔn)的,如果用戶模式在建立時不完善,在實施數(shù)據(jù)整合時可能會遇到數(shù)據(jù)格式不能轉(zhuǎn)換(例如將VARCHAR型數(shù)據(jù)轉(zhuǎn)換為INT型)或數(shù)據(jù)轉(zhuǎn)換格式后丟失信息等棘手問題[4](例如用戶模式字段長度不夠);由于對事務(wù)認(rèn)識的角度不同,導(dǎo)致用戶對數(shù)據(jù)源模式語義的理解也可能會產(chǎn)生歧義,生成的用戶模式無法得到預(yù)計的結(jié)果。下一步工作將主要用來解決這些問題。由于數(shù)據(jù)存放于各數(shù)據(jù)源,內(nèi)容、格式、質(zhì)量無法由用戶模式修改,所以只能在建立用戶模式時通過使用長度足夠大的、兼容性較好的數(shù)據(jù)類型如VARCHAR等盡量保持?jǐn)?shù)據(jù)的原貌。語義理解的問題可以通過引入本體的方式來解決。使用本體來標(biāo)注數(shù)據(jù)源的元數(shù)據(jù)后,用戶不用在數(shù)據(jù)源模式和用戶模式之間進(jìn)行反復(fù)的映射操作,只要在建立用戶模式時對虛擬表的“字段”進(jìn)行本體術(shù)語的標(biāo)注就能和數(shù)據(jù)源元數(shù)據(jù)產(chǎn)生關(guān)聯(lián),用戶模式和數(shù)據(jù)源模式的語義都由本體來體現(xiàn),在理解上不會產(chǎn)生歧義;而且可以利用本體進(jìn)行推理,體現(xiàn)各數(shù)據(jù)源元數(shù)據(jù)之間在概念層次上的關(guān)系,進(jìn)一步擴(kuò)展應(yīng)用的范圍。除此之外,還要進(jìn)一步完善對用戶模式查詢語句的分析與重寫,改進(jìn)各數(shù)據(jù)源查詢結(jié)果的清理與連接等操作的性能,以提高運行的效率。

5 結(jié)束語

本文主要介紹了一種異構(gòu)數(shù)據(jù)源集成方案實現(xiàn)異構(gòu)數(shù)據(jù)源集成時的主要實現(xiàn)方法。作為基于元數(shù)據(jù)的集成辦法,它通過定義用戶模式與各數(shù)據(jù)源模式的映射解決數(shù)據(jù)異構(gòu)的問題,使各數(shù)據(jù)源中有關(guān)聯(lián)的數(shù)據(jù)在集成后能夠按照用戶希望的方式進(jìn)行展現(xiàn)。相關(guān)的工作將在后續(xù)文章中進(jìn)行介紹。

參考文獻(xiàn)

[1]黎建輝,佘懷化,閻保平. 基于元數(shù)據(jù)的關(guān)系數(shù)據(jù)庫語義集成方法.計算機(jī)工程[J], 2008, 34(6): 54-56.

[2]劉文杰,寧 洪,王 挺,等. 面向蛋白質(zhì)組學(xué)數(shù)據(jù)庫的元數(shù)據(jù)提取與導(dǎo)入工具[J]. 計算機(jī)工程與科學(xué), (已錄用).

[3]楊 森,夏 燕,曹順良,等. 語義異構(gòu)生物數(shù)據(jù)源中的數(shù)據(jù)集成與更新[J]. 計算機(jī)工程, 2008, 34(8): 38-40.

[4]丁建華,彭 政,王 飛. 生物數(shù)據(jù)倉庫研究及應(yīng)用[J].計算機(jī)工程與應(yīng)用. 2005, 12(5): 192-194.

[5]林 毅,寧 洪,王 挺,等.基于本體的生物信息集成研究[C]. 第五屆軟件工程大會論文集, 2008, 18-20.

第9篇:生物信息學(xué)的定義范文

【關(guān)鍵詞】 臨床免疫學(xué); 免疫檢驗; 實踐; 探索

臨床免疫學(xué)是免疫學(xué)與臨床醫(yī)學(xué)的重要連接環(huán)節(jié)。免疫學(xué)檢驗是以免疫學(xué)原理為基礎(chǔ),利用各種具有敏感特性的標(biāo)記技術(shù),對各種病理和生理的免疫學(xué)指標(biāo)行特異性、超微量地分析,包括細(xì)胞的、體液的診治及預(yù)后評估[1]。就免疫學(xué)檢驗進(jìn)行準(zhǔn)確定位,是臨床醫(yī)生依據(jù)檢驗結(jié)果對疾病進(jìn)行診治和防控的有效技術(shù)手段,具有非常重要的研究價值。本文就臨床免疫學(xué)和免疫檢驗的相關(guān)實施與探索進(jìn)行綜述如下。

1 臨床免疫學(xué)概念

臨床免疫學(xué)屬重要的免疫學(xué)分支部分,為免疫學(xué)應(yīng)用到臨床醫(yī)學(xué)的途徑。免疫學(xué)技術(shù)的發(fā)展和進(jìn)步與臨床免疫學(xué)技術(shù)的發(fā)展進(jìn)步有著密切相關(guān)性,為臨床及時、科學(xué)的應(yīng)用免疫學(xué)新技術(shù),在疾病的治療、監(jiān)測、確診、預(yù)后中均發(fā)揮重要的引導(dǎo)及參考作用[2]。隨著醫(yī)療科技的不斷進(jìn)步,臨床上多種免疫學(xué)技術(shù)已被普遍開展應(yīng)用,如流式細(xì)胞式和免疫細(xì)胞檢測及分類技術(shù)、血清蛋白電泳技術(shù)及各種肽類物質(zhì)、激素、細(xì)胞因子、腫瘤標(biāo)志的檢測技術(shù)等[3]。隨著目前檢驗項目在臨床的不斷增多,臨床醫(yī)務(wù)人員及患者自身都對臨床檢驗有更高的期待和要求,各種免疫學(xué)技術(shù)均需緊跟醫(yī)療科技發(fā)展步伐,更全面、迅速的發(fā)展,以盡快的與臨床應(yīng)用適宜,進(jìn)而開展臨床免疫學(xué)技術(shù)的嶄新局面。

2 臨床免疫學(xué)促進(jìn)新技術(shù)發(fā)展

技術(shù)的產(chǎn)生、發(fā)展和創(chuàng)新基礎(chǔ)均需有相應(yīng)的理論,如PCR技術(shù)、分子克隆技術(shù)等均為遺傳學(xué)或分子生物學(xué)重要的具有劃時代意義的技術(shù)。而這些技巧中,理論基礎(chǔ)為DNA的雙螺旋。同時免疫學(xué)的抗體理論與抗原對多種臨床免疫學(xué)新技術(shù)的產(chǎn)生也起到了推動作用,如標(biāo)記技術(shù)、沉淀、凝集等的發(fā)展進(jìn)展[4]。近年來,受細(xì)胞生物學(xué)、分子生物學(xué)的不斷滲透及免疫學(xué)的飛速積習(xí)難改展,使免疫學(xué)在理論上獲得了較大的突破。

3 臨床免疫學(xué)新技術(shù)發(fā)展特點分析

3.1 多學(xué)科交融 臨床免疫學(xué)經(jīng)典技術(shù)包括免疫標(biāo)記技術(shù)、溶血技術(shù)、中和技術(shù)、沉淀技術(shù)、凝集技術(shù)等。以上技術(shù)為臨床免疫學(xué)基礎(chǔ),在臨床免疫學(xué)傳統(tǒng)及現(xiàn)代的理論中均占有較重要的地位。以上技術(shù)或其基礎(chǔ)上發(fā)展創(chuàng)新的技術(shù)至今仍在科學(xué)研究和臨床檢驗中廣泛應(yīng)用。但生命科學(xué)在不斷發(fā)展,不同學(xué)科間漸較難明確區(qū)分和界定,形成廣泛的滲透和交叉的局面,而遺傳學(xué)和分子生物學(xué)的適體技術(shù)、分子雜交技術(shù)、PCR技術(shù)、染色質(zhì)沉淀技術(shù)等免疫學(xué)新技術(shù),使免疫應(yīng)用范圍和理論不斷拓展。另外,臨床免疫檢驗中,組織學(xué)、細(xì)胞學(xué)中的顯微鏡技術(shù)也為一項重要的技術(shù)手段。如由普通顯微鏡與免疫組織化學(xué)技術(shù)聯(lián)合對抗原進(jìn)行檢測,自身抗體采用熒光顯微鏡與熒光標(biāo)記技術(shù)聯(lián)合進(jìn)行檢測。且電子顯微鏡對細(xì)胞間的相互作用和免疫細(xì)胞的行為可直接行動態(tài)觀察。以上技術(shù)的應(yīng)用,使臨床免疫學(xué)技術(shù)得到了較大豐富,為發(fā)展提供了動力及方向[5]。同時免疫學(xué)檢測數(shù)據(jù)顯著多,用日益復(fù)雜,有效分析數(shù)據(jù)和正確應(yīng)用結(jié)果顯得較為重要故臨床免疫學(xué)與生物信息學(xué)、醫(yī)學(xué)統(tǒng)計學(xué)等學(xué)科的合作與交流也漸趨深入。

3.2 高通量、智能化、自動化的免疫新技術(shù) 臨床免疫學(xué)檢測具有同步化、智能化、自動化的特點,與傳統(tǒng)手工操作有較大的區(qū)別,如微粒子酶免疫技術(shù)、電化學(xué)發(fā)學(xué)分析技術(shù)等,毛細(xì)管電泳技術(shù)也在臨床廣泛應(yīng)用,目的,生物芯片技術(shù)使整個檢驗醫(yī)學(xué)檢測實現(xiàn)了大規(guī)模、平行化、高通量的要求。同時,組學(xué)技術(shù)、后基因技術(shù)、酶聯(lián)免疫斑點技術(shù)的研究也不斷深入,極大的滿足了臨床免疫學(xué)需要。

4 免疫學(xué)檢驗定義

4.1 臨床免疫學(xué)中免疫學(xué)檢驗為重要組織部分 以基礎(chǔ)免疫學(xué)理論作指導(dǎo),臨床免疫學(xué)對免疫學(xué)方法及技術(shù)不斷創(chuàng)新,在對疾病研究,特別是自身免疫病、腫瘤、傳染病、血液病、免疫缺陷病、變態(tài)反應(yīng)性疾病的病發(fā)機(jī)制、診治、預(yù)后評估中發(fā)揮著重要作用,屬免疫學(xué)分支學(xué)科,是基礎(chǔ)免疫學(xué)內(nèi)容與臨床免疫學(xué)內(nèi)容的中間環(huán)節(jié),為臨床醫(yī)師對疾病進(jìn)行研究的相關(guān)技術(shù)方法。

4.2 免疫學(xué)檢驗的相關(guān)定義 依據(jù)免疫學(xué)原理,特別是抗體與抗原反應(yīng)原理,對各種敏感標(biāo)記進(jìn)行利用,如熒光素、發(fā)光物質(zhì)、放射性同位素等,特異地、超微量的對各種病理和生理免疫學(xué)指標(biāo)進(jìn)行分析,包括細(xì)胞的和體液應(yīng)用,行疾病診治和評估的一組醫(yī)學(xué)臨床檢驗項目[6]。其要點為即對抗原抗體反應(yīng)原理加以利用,又可對免疫學(xué)參數(shù)的各種內(nèi)容進(jìn)行檢測。

5 免疫學(xué)檢驗存在的問題

5.1 定位 目前,有一定數(shù)量的醫(yī)療單位中,尚未設(shè)立免疫學(xué)檢驗專業(yè),無專業(yè)的檢驗設(shè)備,無實驗室,無固定的專業(yè)的檢驗人員,免疫學(xué)檢驗中的一些項目被分散在微生物實驗室和生化實驗室進(jìn)行檢驗,對專業(yè)的發(fā)展造成了一定影響。

5.2 質(zhì)量管理分析 雖免疫學(xué)檢驗中大部分項目在各大醫(yī)學(xué)中已參加了國家衛(wèi)生部相關(guān)室間質(zhì)量評估活動,但在對室內(nèi)質(zhì)量進(jìn)行控制的環(huán)節(jié)中,仍較為薄弱。對于大部分免疫學(xué)檢驗項目,在質(zhì)控品和標(biāo)準(zhǔn)品上,國內(nèi)尚未做到有效統(tǒng)一,雖部分有供應(yīng),但項目不全,價格昂貴[7]。故多數(shù)試驗室質(zhì)量控制不達(dá)標(biāo),導(dǎo)致檢驗質(zhì)量不穩(wěn)定。目前,尚普遍存在試劑缺乏統(tǒng)一的現(xiàn)象,檢驗結(jié)果中的假陰性、假陽性較難杜絕,為質(zhì)量管理及標(biāo)準(zhǔn)化檢查帶來了一定難度[8]。同時,專業(yè)的免疫學(xué)檢驗人員較少,缺乏高素質(zhì)、高學(xué)歷的帶頭人,同時也缺乏嫻熟操作的技術(shù)人員[9]。此外,還存在研究內(nèi)容與臨床缺乏有效結(jié)合等,在疾病診治中未發(fā)揮有效作用[10]。

6 發(fā)展建議

針對免疫檢驗的重要性,醫(yī)院領(lǐng)導(dǎo)和檢驗科需重視免疫學(xué)檢驗專業(yè)的設(shè)置,設(shè)備引進(jìn)、項目定位和人員配備,加強(qiáng)培訓(xùn),建全室內(nèi)質(zhì)量控制[11],同時成立免疫檢驗學(xué)小組,就相關(guān)問題進(jìn)行分析并制定解決方案,各級質(zhì)量部分需加強(qiáng)參考品、質(zhì)控品的管理,以提高檢驗效果,使臨床免疫學(xué)作用落到實處[12]。

7 小結(jié)

綜上,臨床檢驗為臨床免疫學(xué)的重要組成部分,各項技術(shù)的研發(fā)為臨床檢驗學(xué)發(fā)展提供了機(jī)遇,有效縮短了檢測時間,節(jié)約了樣本用量,實現(xiàn)了疾病準(zhǔn)確、快速、無創(chuàng)的診斷。同時也需正視存在的困難,對復(fù)雜的數(shù)據(jù)行合理和有效的應(yīng)用,以減輕患者負(fù)擔(dān),控制成本。同時加強(qiáng)基礎(chǔ)研究的合作與交流,讓從業(yè)者加強(qiáng)各種技術(shù)的培養(yǎng)和學(xué)習(xí),提高自身綜合素質(zhì),以滿足臨床免疫檢驗的要求。

參考文獻(xiàn)

[1] 王松華,羅識奇,周為民,等.28所醫(yī)療機(jī)構(gòu)檢驗免疫學(xué)部分指標(biāo)現(xiàn)場檢測調(diào)查[J].臨床檢驗雜志,2007,25(2):154.

[2] Beutler B,Casanova J L.New frontiers in immunology.Workshop on The Road Ahead:Future directions in fundamental and clinical immunology[J].EMBO(European Molecular Biology Organization),2005,6(7):620-623.

[3] 武建國.老年人抗病毒螺旋抗體測定的假陽性率偏高[J].臨床檢驗雜志,2006,24(4):241-243.

[4] Hartmann M,Schrenk M,Dottinger A,et al.Expanding assay dynamics:a combined competitive and direct assay system for the quantification of proteins in multiplexed immunoassays[J].Clin Chen,2009,54(1):956-963.

[5] 周鎮(zhèn)先,吳玉強(qiáng),黃茂萍,等.國產(chǎn)抗HBs抗體試劑檢測結(jié)果的評價[J].臨床檢驗雜志,2007,25(1):70.

[6] Shoshan S H,Admon A.Novel technologies for cancer biomarker discovery:humoral proteomics[J].Cancer Biomark,2007,3(1):141-154.

[7] 葉應(yīng)嫵,王毓三,申子瑜.全國臨床檢驗操作規(guī)程[M].第3版.南京:東南大學(xué)出版社,2006:559-712.

[8] 史俊敏,吳曉勇.臨床檢驗質(zhì)量管理的重要性[J].檢驗醫(yī)學(xué)與臨床,2011,12(8):2377-2378.

[9] 張偉民,宋超.落實質(zhì)量考核與監(jiān)督措施,促進(jìn)獨立實驗室健康發(fā)展-對醫(yī)學(xué)獨立實驗室管理模式的設(shè)想與探討[J].浙江檢驗醫(yī)學(xué),2009,7(3):285-287.

[10] 師建國,田玉梅,郭芝芳,等.量子共振檢測在精神分裂癥診斷中的應(yīng)用(摘要)[C].中國心理衛(wèi)生協(xié)會殘疾人心理衛(wèi)生分會第八屆學(xué)術(shù)交流會論文集,2010:288-289.

[11] 袁紅,黃文芳,楊明清,等.對四川省二級及二級以下醫(yī)療機(jī)構(gòu)臨床實驗室的檢查及指導(dǎo)效果[J].現(xiàn)代預(yù)防醫(yī)學(xué),2009,26(18):126.