前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機(jī)科學(xué)與生物學(xué)主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞: 離散數(shù)學(xué) 計算機(jī)科學(xué) 數(shù)據(jù)結(jié)構(gòu)
離散數(shù)學(xué)是計算機(jī)應(yīng)用必不可少的工具,例如數(shù)理邏輯在數(shù)據(jù)模型、計算機(jī)語義、人工智能等方面的應(yīng)用,集合論在數(shù)據(jù)庫技術(shù)中的應(yīng)用,代數(shù)系統(tǒng)在信息安全中的密碼學(xué)方面的應(yīng)用,圖論在信息檢索、網(wǎng)絡(luò)布線、指令系統(tǒng)優(yōu)化等方面的應(yīng)用。
1.離散數(shù)學(xué)與其他課程的關(guān)系
1.1離散數(shù)學(xué)與數(shù)據(jù)結(jié)構(gòu)的關(guān)系
離散數(shù)學(xué)與數(shù)據(jù)結(jié)構(gòu)的關(guān)系非常緊密,數(shù)據(jù)結(jié)構(gòu)課程描述的對象有四種,分別是線形結(jié)構(gòu)、集合、樹形結(jié)構(gòu)和圖結(jié)構(gòu),這些對象都是離散數(shù)學(xué)研究的內(nèi)容。線形結(jié)構(gòu)中的線形表、棧、隊列等都是根據(jù)數(shù)據(jù)元素之間關(guān)系的不同而建立的對象,離散數(shù)學(xué)中的關(guān)系這一章就是研究有關(guān)元素之間的不同關(guān)系的內(nèi)容;數(shù)據(jù)結(jié)構(gòu)中的集合對象及集合的各種運算都是離散數(shù)學(xué)中集合論研究的內(nèi)容;離散數(shù)學(xué)中的樹和圖論的內(nèi)容為數(shù)據(jù)結(jié)構(gòu)中的樹形結(jié)構(gòu)對象和圖結(jié)構(gòu)對象的研究提供很好的知識基礎(chǔ)。
1.2離散數(shù)學(xué)與數(shù)據(jù)庫原理的關(guān)系
目前數(shù)據(jù)庫原理主要研究的數(shù)據(jù)庫類型是關(guān)系數(shù)據(jù)庫。關(guān)系數(shù)據(jù)庫中的關(guān)系演算和關(guān)系模型需要用到離散數(shù)學(xué)中的謂詞邏輯的知識;關(guān)系數(shù)據(jù)庫的邏輯結(jié)構(gòu)是由行和列構(gòu)成的二維表,表之間的連接操作需要用到離散數(shù)學(xué)中的笛卡兒積的知識,表數(shù)據(jù)的查詢、插入、刪除和修改等操作都需要用到離散數(shù)學(xué)中的關(guān)系代數(shù)理論和數(shù)理邏輯中的知識。
1.3離散數(shù)學(xué)與數(shù)字邏輯的關(guān)系
數(shù)字邏輯為計算機(jī)硬件中的電路設(shè)計提供了重要理論,而離散數(shù)學(xué)中的數(shù)理邏輯部分為數(shù)字邏輯提供了重要的數(shù)學(xué)基礎(chǔ)。在離散數(shù)學(xué)中命題邏輯中的連結(jié)詞運算可以解決電路設(shè)計中的由高低電平表示的各信號之間的運算以及二進(jìn)制數(shù)的位運算等問題。
1.4離散數(shù)學(xué)與編譯原理的關(guān)系
編譯原理和技術(shù)是軟件工程技術(shù)人員很重要的基礎(chǔ)知識,編譯程序是非常復(fù)雜的系統(tǒng)程序,包括詞法分析、語法分析、語義分析、中間代碼生成、代碼優(yōu)化、目標(biāo)代碼生成、依賴機(jī)器的代碼優(yōu)化7個階段。離散數(shù)學(xué)中的計算模型[2]這一章的語言和文法、有限狀態(tài)機(jī)、語言的識別和圖靈機(jī)等知識點為編譯程序中的詞法分析和語法分析提供了基礎(chǔ)。
2.離散數(shù)學(xué)在計算機(jī)學(xué)科中的應(yīng)用
2.1數(shù)理邏輯在人工智能中的應(yīng)用
人工智能是計算機(jī)學(xué)科中一個非常重要的方向,離散數(shù)學(xué)在人工智能中的應(yīng)用主要是數(shù)理邏輯部分在人工智能中的應(yīng)用。人類的自然語言可以用符號進(jìn)行表示。語言的符號化就是數(shù)理邏輯研究的基本內(nèi)容,計算機(jī)智能化的前提就是將人類的語言符號化成機(jī)器可以識別的符號,這樣計算機(jī)才能進(jìn)行推理,才能具有智能。由此可見數(shù)理邏輯中重要的思想、方法及內(nèi)容已貫穿人工智能的整個學(xué)科。
2.2圖論在數(shù)據(jù)結(jié)構(gòu)中的應(yīng)用
離散數(shù)學(xué)在數(shù)據(jù)結(jié)構(gòu)中的應(yīng)用主要是圖論部分在數(shù)據(jù)結(jié)構(gòu)中的應(yīng)用,樹在圖論中具有重要的地位。樹是一種非線性數(shù)據(jù)結(jié)構(gòu),在現(xiàn)實生活中可以用樹表示某一家族的家譜或某公司的組織結(jié)構(gòu),也可以用它來表示計算機(jī)中文件的組織結(jié)構(gòu),樹中二叉樹在計算機(jī)科學(xué)中有著重要的應(yīng)用。二叉樹共有三種遍歷方法:前序遍歷法、中序遍歷法和后序遍歷法。
通過訪問不同的遍歷序列,可以得到不同的節(jié)點序列,通常在計算機(jī)中利用不同的遍歷方法讀出代數(shù)表達(dá)式,以便在計算機(jī)中對代數(shù)表達(dá)式進(jìn)行操作。
2.3集合論在數(shù)據(jù)庫系統(tǒng)理論中的應(yīng)用
集合論是離散數(shù)學(xué)中極其重要的一部分,它在數(shù)據(jù)庫中有廣泛的應(yīng)用。我們可以利用關(guān)系理論使數(shù)據(jù)庫從網(wǎng)絡(luò)型、層次型轉(zhuǎn)變成關(guān)系型,這樣使數(shù)據(jù)庫中的數(shù)據(jù)容易表示,并且易于存儲和處理,使邏輯結(jié)構(gòu)簡單、數(shù)據(jù)獨立性強(qiáng)、數(shù)據(jù)共享、數(shù)據(jù)冗余可控和操作簡單。當(dāng)數(shù)據(jù)庫中記錄較多時,集合中的笛卡兒積方便了記錄的查詢、插入、刪除和修改。
2.4代數(shù)系統(tǒng)在通信方面的應(yīng)用
代數(shù)系統(tǒng)在計算機(jī)中的應(yīng)用廣泛,例如有限機(jī),開關(guān)線路的計數(shù)等方面。但最常用的是在糾錯碼方面的應(yīng)用。在計算機(jī)和數(shù)據(jù)通信中,經(jīng)常需要將二進(jìn)制數(shù)字信號進(jìn)行傳遞,這種傳遞常常距離很遠(yuǎn),所以難免出現(xiàn)錯誤。通常采用糾錯碼避免這種錯誤的發(fā)生,而設(shè)計的這種糾錯碼的數(shù)學(xué)基礎(chǔ)就是代數(shù)系統(tǒng)。
2.5離散數(shù)學(xué)在生物信息學(xué)中的應(yīng)用
生物信息學(xué)是現(xiàn)代計算機(jī)科學(xué)中一個嶄新的分支,它是計算機(jī)科學(xué)與生物學(xué)相結(jié)合的產(chǎn)物。由于DNA是離散數(shù)學(xué)中的序列結(jié)構(gòu),美國科學(xué)院院士,近代離散數(shù)學(xué)的奠基人Rota教授預(yù)言,生物學(xué)中的組合問題將成為離散數(shù)學(xué)的一個前沿領(lǐng)域。DNA計算機(jī)的基本思想是:以DNA堿基序列作為信息編碼的載體,利用現(xiàn)代分子生物學(xué)技術(shù),在試管內(nèi)控制酶作用下的DNA序列反應(yīng),作為實現(xiàn)運算的過程;這樣,以反應(yīng)前DNA序列作為輸入的數(shù)據(jù),反應(yīng)后的DNA序列作為運算的結(jié)果,DNA計算機(jī)幾乎能夠解決所有的NP完全問題。
3.結(jié)語
現(xiàn)在我國每一所大學(xué)的計算機(jī)專業(yè)都開設(shè)離散數(shù)學(xué)課程,正因為離散數(shù)學(xué)在計算機(jī)科學(xué)中的重要性,可以說沒有離散數(shù)學(xué)就沒有計算機(jī)理論,也就沒有計算機(jī)科學(xué)。所以,應(yīng)努力學(xué)習(xí)離散數(shù)學(xué),推動離散數(shù)學(xué)的研究,使它在計算機(jī)中有更廣泛的應(yīng)用。
參考文獻(xiàn):
[1]朱家義,苗國義等.基于知識關(guān)系的離散數(shù)學(xué)教學(xué)內(nèi)容設(shè)計[J].計算機(jī)教育,2010(18):98-100.
[2]方世昌.離散數(shù)學(xué).西安電子科技大學(xué)出版社,1985.
[3]陳敏,李澤軍.離散數(shù)學(xué)在計算機(jī)學(xué)科中的應(yīng)用[J].電腦知識與技術(shù),2009,5(1):251-252.
[4]B.Kolman,R.Busby&S.Ross.Discrete Mathematical Structure.
關(guān)鍵詞:生物信息學(xué);教材;師范院校
20世紀(jì)80年代末以來,生物信息學(xué)以驚人的發(fā)展速度,獲得了很多突破性成就,正日益成為生命科學(xué)在21世紀(jì)發(fā)展的核心內(nèi)容。對于未來生物科學(xué)中堅力量的現(xiàn)代生物科學(xué)工作者而言,掌握生物信息學(xué)的相關(guān)知識尤為重要。
作為一門新興的課程,生物信息學(xué)課程在全國很多高等院校都已經(jīng)開設(shè),并進(jìn)行了一些卓有成效的探索和改革。我們結(jié)合自身的教學(xué)實踐和相關(guān)學(xué)校的教學(xué)現(xiàn)狀,對師范院校生物信息學(xué)課程教學(xué)內(nèi)容、師資力量、教學(xué)模式和方法、跨學(xué)科合作、教學(xué)實踐實施情況等方面的現(xiàn)狀進(jìn)行了積極分析和思考。目前,師范院校生物信息學(xué)教學(xué)的現(xiàn)狀如下。
一、教學(xué)內(nèi)容陳舊、教學(xué)資源缺乏
生物信息學(xué)是一門新興的學(xué)科,在高等院校開設(shè)時間較晚,我國對生物信息學(xué)專業(yè)精品課程的建設(shè)方面投入不夠,成熟的生物信息學(xué)教學(xué)大綱、教案、多媒體課件、教學(xué)視頻和習(xí)題等教學(xué)資源稀少。目前,市場上也缺乏相關(guān)的生物信息學(xué)教學(xué)多媒體課件和音像制品輔導(dǎo)材料等相關(guān)產(chǎn)品,造成生物信息學(xué)教學(xué)資源匱乏的現(xiàn)狀。
目前師范院校所用教材大多數(shù)是徐程主編的《生物信息與數(shù)據(jù)處理》,蔣彥等編著的《基礎(chǔ)生物信息學(xué)及應(yīng)用》等幾種不同版本的教材。這些教材在知識性、科學(xué)性和系統(tǒng)性方面還行,但是在教學(xué)內(nèi)容的新穎性、時效性和實踐性以及生物相關(guān)背景的介紹和對師范院校的適用性等方面有所欠缺。生物信息學(xué)的知識日新月異,新的數(shù)據(jù)庫、新的軟件、新的算法層出不窮,而生物信息學(xué)的課堂往往不能及時地將最新進(jìn)展呈現(xiàn)給學(xué)生,導(dǎo)致課堂內(nèi)容陳舊,不利于學(xué)生的發(fā)展和對生物信息知識的合理掌握,從而影響了生物信息學(xué)教學(xué)的質(zhì)量。
二、師資力量缺乏
生物信息學(xué)是一門新興的交叉學(xué)科,需要熟練掌握計算機(jī)與生物學(xué)知識的老師來授課。然而,實際上,由于缺少生物信息學(xué)的專業(yè)教師,教授該學(xué)科的教師多為生物學(xué)其他課程兼任,這些老師往往缺乏專門的生物信息學(xué)訓(xùn)練,在知識的傳授和應(yīng)用方面存在欠缺。與生物信息學(xué)教學(xué)要求存在著較大的差距,不能很好地滿足教學(xué)大綱的要求。另外,師范院校通常將生物信息學(xué)作為選修課來開設(shè),該課程在專業(yè)建設(shè)和人才培養(yǎng)方案中的地位偏低,造成相關(guān)部門對師資培養(yǎng)不夠重視。
三、教學(xué)模式和方法落后
由于生物信息學(xué)課程涉及大量的數(shù)據(jù)庫和軟件知識,教師普遍采用多媒體教學(xué)。而多媒體課件的容量通常很大,學(xué)生忙于筆記,難以把握重難點。同時,幻燈片展示的知識點猶如放電影一般一閃而過,學(xué)生沒有足夠的時間思考和消化,跟不上教師的進(jìn)度。教師進(jìn)行多媒體教學(xué)時,往往是一堂課上從頭講到尾,語調(diào)缺乏抑揚頓挫,沒有起伏,學(xué)生很容易昏昏欲睡。因此,教師雖然使用的是先進(jìn)的教學(xué)工具,采用模式的卻是傳統(tǒng)的灌輸式教學(xué),只管埋頭照本宣科,不管學(xué)生接收領(lǐng)悟多少。學(xué)生為了達(dá)到期末考試標(biāo)準(zhǔn),只顧死記硬背,這樣的教育讓學(xué)生失去創(chuàng)新精神和主動思考的能力,失去對生物信息課程的興趣。
四、缺乏與相關(guān)學(xué)科的合作交流
生物信息學(xué)實際上是生物學(xué)與計算機(jī)科學(xué)的交叉學(xué)科。然而一般高校往往只在生命科學(xué)學(xué)院開設(shè)生物信息學(xué),由生物學(xué)老師來擔(dān)任授課老師。由于對計算機(jī)科學(xué)知識的缺乏,導(dǎo)致生物專業(yè)教師對生物信息學(xué)課程很難深入開展;另一方面,計算機(jī)科學(xué)專業(yè)由于沒有開設(shè)生物信息學(xué)課程,使學(xué)生不能了解到生物信息學(xué)的重要性,以及如何使計算機(jī)科學(xué)更快更好地發(fā)揮其在生物信息學(xué)中的作用??偟膩碚f,生物信息學(xué)課程的建設(shè)欠缺相關(guān)學(xué)科的協(xié)作,不能有效地整合資源,不利于培養(yǎng)復(fù)合型人才。
五、缺乏實踐教學(xué)內(nèi)容
現(xiàn)有的生物信息學(xué)課程也有一些實踐內(nèi)容,但實踐課時數(shù)少,內(nèi)容相對簡單,缺乏系統(tǒng)完善的實踐過程。教師為學(xué)生講授具體知識時,通常只通過多媒體課件演示操作,并沒有為學(xué)生設(shè)置具體的動手操作步驟。使得學(xué)生對信息反饋遲鈍,印象不深刻,不容易掌握方法。生物信息學(xué)實踐教學(xué)并不需要價格昂貴的實驗設(shè)備,只需要一網(wǎng)的電腦和一些相關(guān)的分析軟件便可以進(jìn)行實驗。然而,目前的狀況是,生物信息學(xué)課程中真正開展實踐性教學(xué)的內(nèi)容少之又少。
生物信息學(xué)的學(xué)習(xí)是一個長期積累的過程,教學(xué)水平的提高也需要在大量的教學(xué)實踐中不斷總結(jié)和完善。我們通過分析發(fā)現(xiàn),在師范院校生物信息學(xué)教學(xué)中仍存在很多問題,其原因是多方面的,需要教學(xué)工作者進(jìn)一步深入探討并提出切實可行的策略。
參考文獻(xiàn):
[1]湯麗華.淺談大學(xué)本科生物信息學(xué)課程建設(shè)與教學(xué)[J].科技
信息,2010(1).
[2]賈小平,孔祥生.生物信息學(xué)實踐教學(xué)初探[J].陜西教育,
2010(3).
[3]軍.農(nóng)學(xué)專業(yè)生物信息學(xué)課程教學(xué)改革探析[J].現(xiàn)代農(nóng)
業(yè)科技,2010(5).
[4]郝新保.充分利用網(wǎng)絡(luò)資源開展生物信息學(xué)教育[J].中國醫(yī)
關(guān)鍵詞:高性能計算;應(yīng)用;中醫(yī)藥
中圖分類號:R-3 文獻(xiàn)標(biāo)識碼:A 文章編號:2095-5707(2016)06-0010-03
Abstract: High performance computing (HPC), as a new and important research tool, has been applied in many fields successfully. Application of HPC in the TCM field is still in the exploratory stage. HPC in the future may be innovatively applied in the field of genomics Chinese herbal medicine, virtual medicine screening of new TCM, TCM data mining and big data analytics, modeling and simulation and so on.
Key words: high performance computing (HPC); application; TCM
高性能計算是計算機(jī)科學(xué)的一個分支,研究并行算法和開發(fā)相關(guān)軟件,致力于開發(fā)高性能計算機(jī)。高性能計算是世界各國競相發(fā)展的前沿技術(shù),是體現(xiàn)一個國家綜合實力和科技競爭力的重要指標(biāo)。
科學(xué)計算作為科研方法變革的產(chǎn)物,已經(jīng)發(fā)展成為與傳統(tǒng)的理論、實驗并駕齊驅(qū)的第三種科研方法,并且日益成為越來越重要的科研方法??茖W(xué)計算方法的運用,是高性能計算應(yīng)用的基礎(chǔ)和前提條件,而使高性能計算真正發(fā)揮作用主要取決于高性能計算的應(yīng)用研究水平[1]。本文對于促進(jìn)高性能計算未來在中醫(yī)藥領(lǐng)域的應(yīng)用、豐富中醫(yī)藥信息學(xué)的研究內(nèi)容及由此產(chǎn)生的中醫(yī)藥科研方法的創(chuàng)新具有推動作用。
1 高性能計算應(yīng)用概況
1.1 我國在高性能計算應(yīng)用領(lǐng)域仍處于落后水平
在高性能計算的研發(fā)和應(yīng)用領(lǐng)域美國一直處于世界領(lǐng)先水平,日本和歐洲國家緊隨其后長期位居世界先進(jìn)行列。近年來,我國在高性能計算硬件的研發(fā)方面取得了突破性進(jìn)展,通過自主創(chuàng)新逐步掌握了一批硬件研發(fā)的關(guān)鍵技術(shù)。中國國防科技大學(xué)研制的天河系列超級計算機(jī)連續(xù)多次在世界超級計算機(jī)排行榜中名列首位,標(biāo)志著我國高性能計算的硬件研究水平目前已經(jīng)接近國際先進(jìn)水平。但在應(yīng)用軟件方面的發(fā)展嚴(yán)重滯后于硬件的發(fā)展水平,自主開發(fā)的高性能計算應(yīng)用軟件嚴(yán)重匱乏,需要大量購買和引進(jìn)國外開發(fā)的應(yīng)用軟件,重要和關(guān)鍵部門的應(yīng)用受制于人[2]。應(yīng)用軟件是高性能計算應(yīng)用的基礎(chǔ),由于應(yīng)用軟件研發(fā)水平的嚴(yán)重落后,目前我國在高性能計算應(yīng)用領(lǐng)域仍處于落后水平。
1.2 國內(nèi)外高性能計算主要的應(yīng)用領(lǐng)域
高性能計算作為嶄新和重要的科研工具,目前已經(jīng)在眾多的領(lǐng)域得到了成功應(yīng)用,各種前沿科學(xué)研究、技術(shù)開發(fā)和工程設(shè)計都越來越多地使用了高性能計算,高性能計算已經(jīng)日益成為科技創(chuàng)新的重要力量。目前主要的應(yīng)用領(lǐng)域包括氣象數(shù)值模擬與預(yù)報、地震預(yù)報、納米技術(shù)、生物醫(yī)學(xué)、環(huán)境科學(xué)、空間科學(xué)、材料科學(xué)、計算物理、計算化學(xué)、流體力學(xué)、地震三維成像、石油勘探、天體星系模擬、大氣與海洋模擬、固體地球模擬、工業(yè)設(shè)計、核武器研究、全球氣候模型、湍流分析、飛行動力學(xué)、海洋環(huán)流、流體力學(xué)和超導(dǎo)模型等[1]。在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用目前主要集中在人類基因組學(xué)、蛋白質(zhì)組學(xué)、藥物設(shè)計、分子動力學(xué)模擬等方面。
1.3 高性能計算應(yīng)用的瓶頸
高性能計算雖然已經(jīng)在眾多領(lǐng)域得到了成功應(yīng)用,但由于技術(shù)難度等的限制,仍然屬于高投入高產(chǎn)出的非普及型應(yīng)用。目前制約高性能計算應(yīng)用的主要問題包括軟件開發(fā)的技術(shù)難度非常大,系統(tǒng)使用成本過高,不僅體現(xiàn)在軟硬件購置費用昂貴,而且系統(tǒng)運行維護(hù)成本過高,大型系統(tǒng)的年電費需上千萬元[2]。比較高精尖的應(yīng)用范圍、非常高的技術(shù)要求和過高的使用成本,這些都限制了高性能計算的廣泛應(yīng)用。
2 高性能計算在中醫(yī)藥領(lǐng)域應(yīng)用的可行性分析
2.1 高性能計算在領(lǐng)域應(yīng)用的前提條件
高性能計算在領(lǐng)域應(yīng)用的條件首先需要應(yīng)用領(lǐng)域具有較高的科研水平,特別是能夠通過科學(xué)計算的方法建立相應(yīng)的數(shù)學(xué)物理模型和應(yīng)用軟件來解決實際問題,利用高性能計算才有可能促成應(yīng)用領(lǐng)域研究水平的大幅度提高。通過對高性能計算應(yīng)用領(lǐng)域的最高學(xué)術(shù)獎戈登獎獲獎項目的分析,這些獲獎的應(yīng)用項目絕大多數(shù)都具有多學(xué)科交叉融合的背景,這反映了高性能計算的應(yīng)用需要應(yīng)用領(lǐng)域與計算機(jī)科學(xué)、數(shù)學(xué)等學(xué)科的跨學(xué)科合作[3]。隨著高性能計算的應(yīng)用,近些年高性能計算與應(yīng)用學(xué)科的交叉學(xué)科不斷涌現(xiàn),產(chǎn)生了計算化學(xué)、計算物理學(xué)、計算生物學(xué)等許多新興學(xué)科,這些交叉學(xué)科的產(chǎn)生標(biāo)志著高性能計算在這些領(lǐng)域得到了高水平應(yīng)用。
2.2 計算生物學(xué)的啟示
計算生物學(xué)是一門以生命科學(xué)中的現(xiàn)象和規(guī)律作為研究對象,以解決生物學(xué)問題為最終目標(biāo),通過模擬和仿真的方法對生物學(xué)問題進(jìn)行定量和定性研究的新興學(xué)科。計算生物學(xué)與生物信息學(xué)比較,最大的不同之處在于生物信息學(xué)側(cè)重于生物信息的采集、存儲、處理和分析,而計算生物學(xué)側(cè)重于對生命現(xiàn)象進(jìn)行研究、解決生物學(xué)問題[4]。目前計算生物學(xué)領(lǐng)域的研究主要集中在蛋白質(zhì)行為的模擬、藥物分子的篩選、基因測序等方面。
雖然目前中醫(yī)藥領(lǐng)域還不滿足高性能計算的應(yīng)用條件,但通過借鑒計算生物學(xué)的研究方法,未來有可能在中醫(yī)藥領(lǐng)域開展具有創(chuàng)新性的高性能計算的應(yīng)用研究。
3 高性能計算在中醫(yī)藥領(lǐng)域應(yīng)用的展望
3.1 中藥植物藥的基因組學(xué)
基因組學(xué)是遺傳學(xué)的一個分支,研究生物基因組和如何利用基因,涉及基因作圖、測序和整個基因組功能分析,研究內(nèi)容包括以全基因組測序為目標(biāo)的結(jié)構(gòu)基因組學(xué)和以基因功能鑒定為目標(biāo)的功能基因組學(xué)?;蚪M學(xué)是高性能計算應(yīng)用的一個重要方向,沒有高性能計算人類的基因組計劃就不可能實現(xiàn),高性能計算已經(jīng)成為基因組學(xué)研究不可或缺的科研工具。隨著基因組學(xué)研究的深入、技術(shù)的成熟和成本的大幅度下降,使得基因組學(xué)的研究逐漸由人類的基因組學(xué)擴(kuò)展到動物、植物等多個相近領(lǐng)域。利用高性能計算在基因組學(xué)方面成熟的應(yīng)用軟件開展中藥植物藥的基因組學(xué)研究未來有可能是高性能計算在中醫(yī)藥領(lǐng)域的重要應(yīng)用。
3.2 中藥新藥的虛擬藥物篩選
利用高性能計算進(jìn)行虛擬藥物篩選目前已經(jīng)成為西藥新藥開發(fā)的一條嶄新和重要的途徑。新藥研發(fā)的核心工作之一是從大量的化合物樣品庫中發(fā)現(xiàn)有藥理活性的化合物,計算機(jī)虛擬篩選輔助新藥開發(fā)是利用統(tǒng)計學(xué)和分子模型化技術(shù)來指導(dǎo)新的先導(dǎo)結(jié)構(gòu)的發(fā)現(xiàn)或設(shè)計,從而減少實驗室的工作量,縮短開發(fā)周期、降低開發(fā)成本。近年來對多靶點藥物的研究已經(jīng)成為國際上新藥開發(fā)的一個重要的研究熱點,中藥是天然的多靶點藥物,蘊含著巨大的新藥創(chuàng)制的潛力[5-6]。應(yīng)用高性能計算開展中藥新藥的虛擬藥物篩選有可能成為中藥新藥開發(fā)的嶄新途徑。
3.3 中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。大數(shù)據(jù)分析是指對規(guī)模巨大的數(shù)據(jù)進(jìn)行分析,目前世界各國對大數(shù)據(jù)分析技術(shù)高度重視,大數(shù)據(jù)被視為國家重要的戰(zhàn)略資源。數(shù)據(jù)挖掘和大數(shù)據(jù)分析是高性能計算應(yīng)用的重要領(lǐng)域之一。目前中醫(yī)藥領(lǐng)域的數(shù)據(jù)挖掘和大數(shù)據(jù)分析主要集中在對方劑配伍規(guī)律、中醫(yī)證治規(guī)律等的研究,現(xiàn)有的研究水平還不能構(gòu)成對高性能計算的迫切需求。隨著數(shù)據(jù)挖掘和大數(shù)據(jù)分析在中醫(yī)藥領(lǐng)域應(yīng)用水平的提高,數(shù)據(jù)研究的內(nèi)容、方法和結(jié)果的日趨豐富,隨著數(shù)據(jù)量的積累和研究方法復(fù)雜度的提高,中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析未來有可能成為高性能計算在中醫(yī)藥領(lǐng)域富有潛力的應(yīng)用。
3.4 模擬與仿真
模擬與仿真是依靠計算機(jī)通過數(shù)值計算和圖像顯示的方法,對工程、物理、生物等各類問題進(jìn)行研究。高性能計算不僅具有強(qiáng)大的計算功能,還可以模擬或代替由于受經(jīng)濟(jì)或者其他條件限制不能進(jìn)行的實驗。2013年10月,哈佛大學(xué)教授Martin Karplus、斯坦福大學(xué)教授Michael Levitt和南加州大學(xué)教授Arieh Warshel因“為復(fù)雜化學(xué)系統(tǒng)創(chuàng)立了多尺度模型”而獲得諾貝爾獎,評委會聲明中稱這一成果意味著對于化學(xué)家來說計算機(jī)已經(jīng)成為同試管一樣重要的工具[1]。
計算機(jī)模擬方法在生命科學(xué)中已經(jīng)得到了迅速的發(fā)展和廣泛的應(yīng)用。高性能計算應(yīng)用領(lǐng)域的最高學(xué)術(shù)獎戈登獎獲獎項目“在20萬CPU核和異構(gòu)體系結(jié)構(gòu)上的千萬億次持續(xù)性能血流模擬”,該項目模擬了血液流動狀態(tài),可以輔助血栓的早期病理學(xué)診斷及抗血栓藥物的研究。另一項獲獎項目“呼之欲出的貓:包含109規(guī)模神經(jīng)元、1013規(guī)模突觸的大腦皮質(zhì)模擬”,對神經(jīng)元和突觸規(guī)模與貓大腦相當(dāng)?shù)拇竽X皮質(zhì)功能進(jìn)行了模擬,并以此為基礎(chǔ)開展了認(rèn)知計算的研究[3]。此外國內(nèi)外大量的高性能計算被用于分子動力學(xué)模擬,分子動力學(xué)模擬是一種數(shù)值模擬方法,通過將分子抽象為由化學(xué)鍵連接的質(zhì)點按照基于牛頓力學(xué)的數(shù)學(xué)模型迭代求解分子體系的行為。利用高性能計算進(jìn)行分子動力學(xué)模擬已經(jīng)成為化學(xué)和生物學(xué)研究中與實驗手段相當(dāng)?shù)臉?biāo)準(zhǔn)研究方式[7-8]。模擬和仿真技術(shù)在中醫(yī)藥研究中的應(yīng)用未來有可能成為高性能計算在中醫(yī)藥領(lǐng)域創(chuàng)新性的應(yīng)用。
4 小結(jié)
高性能計算的應(yīng)用是使高性能計算真正發(fā)揮作用的軟實力,是高性能計算領(lǐng)域重要的研究內(nèi)容。高性能計算的應(yīng)用需要多學(xué)科的交叉與合作,計算生物學(xué)的產(chǎn)生標(biāo)志著高性能計算在生物醫(yī)學(xué)領(lǐng)域得到了成功應(yīng)用。
高性能計算在中醫(yī)藥領(lǐng)域的應(yīng)用目前還處于探索階段,尚不具備大規(guī)模應(yīng)用的條件和基礎(chǔ)。未來有可能通過借鑒計算生物學(xué)的研究方法在中藥植物藥的基因組學(xué)、中藥新藥的虛擬藥物篩選、中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析、模擬與仿真等領(lǐng)域進(jìn)行開創(chuàng)性的應(yīng)用研究。高性能計算在中醫(yī)藥領(lǐng)域的應(yīng)用將會對中醫(yī)藥科研方法的創(chuàng)新與發(fā)展產(chǎn)生深刻的影響。
參考文獻(xiàn)
[1] 顧蓓蓓,武虹,遲學(xué)斌,等.國內(nèi)外高性能計算應(yīng)用發(fā)展概況分析[J].科研信息化技術(shù)與應(yīng)用,2014,5(4):82-91.
[2] 周興銘.高性能計算技術(shù)發(fā)展[J].自然雜志,2011,33(5):249-254.
[3] 張理論,鄧小剛.戈登獎――分析與思考[J].計算機(jī)工程與科學(xué), 2012,34(8):44-52.
[4] 徐書華,金力.計算生物學(xué)[J].科學(xué),2009,61(4):34-37.
[5] 朱偉,羅頌平.治療輸卵管阻塞性不孕的中藥多靶活性成分計算機(jī)虛擬篩選[J].時珍國醫(yī)國藥,2012,23(6):1531-1532.
[6] ,孫曉波.網(wǎng)絡(luò)藥理學(xué):中醫(yī)藥現(xiàn)代化的新機(jī)遇[J].藥學(xué)學(xué)報,2012,47(6):696-703.
關(guān)鍵詞 生物科學(xué);交叉學(xué)科;編輯加工
中圖分類號Q-0 文獻(xiàn)標(biāo)識碼 A 文章編號 1674-6708(2015)131-0034-02
生物科學(xué)是研究生物的結(jié)構(gòu)、功能、發(fā)生和發(fā)展規(guī)律的一門自然學(xué)科,它既研究各種生命活動的現(xiàn)象和本質(zhì),又研究生物與生物之間、生物與環(huán)境之間的相互關(guān)系,以及生命科學(xué)原理和技術(shù)在人類經(jīng)濟(jì)、社會活動中的應(yīng)用。目前,科學(xué)的協(xié)同作用及相互激勵作用逐漸被人們所認(rèn)識,隨著各國政府和科學(xué)界對生命科學(xué)的日益重視,化學(xué)家、物理學(xué)家和數(shù)學(xué)家從已經(jīng)獲取的新的生命信息中,不斷修改、增添各自學(xué)科的理論、定義,從而使得一大批生物科學(xué)交叉學(xué)科蓬勃發(fā)展,如生物地理學(xué)、生物力學(xué)、生物光學(xué)、結(jié)構(gòu)生物學(xué)、納米生物學(xué)、計算生物學(xué)、生物信息學(xué)、耦合仿生學(xué)、合成生物學(xué)、生物醫(yī)學(xué)工程學(xué)、系統(tǒng)生物學(xué)、生物倫理學(xué)等。
加工這類交叉學(xué)科的稿件,對編輯人員的業(yè)務(wù)能力要求較高,如知識結(jié)構(gòu)、科學(xué)認(rèn)知能力、邏輯分析能力、文字表達(dá)能力等。尤其是進(jìn)行規(guī)范性編輯加工時,要求編輯具有掌握不同學(xué)科行業(yè)規(guī)范的能力。下面根據(jù)生物學(xué)與所交叉學(xué)科的不同,舉例子說明編輯加工此類稿件的要點。需要說明的是,本文主要介紹稿件中遇到的相關(guān)學(xué)科內(nèi)容的加工重點,至于生物學(xué)范疇內(nèi)的基礎(chǔ)知識加工規(guī)范,在此不再贅述。
1 與物理學(xué)的交叉
生物學(xué)與物理學(xué)交叉的學(xué)科主要有生物力學(xué)、生物光學(xué)、生物聲學(xué)等,這類稿件中,除了對生物學(xué)基礎(chǔ)知識的加工外,主要涉及對數(shù)學(xué)公式、數(shù)學(xué)符號規(guī)范方面的加工。
數(shù)學(xué)公式和數(shù)學(xué)符號的特點是字母多(英文、希文等)、符號多(各種運算符號和數(shù)學(xué)符號)、層次多(上下角標(biāo)、行列式、矩陣等),因此編輯加工難度較大,且極易出現(xiàn)錯誤。為了使科技類圖書做到標(biāo)準(zhǔn)化、規(guī)范化,使數(shù)學(xué)公式更加簡明、規(guī)范、準(zhǔn)確、直觀,下面從數(shù)學(xué)公式和數(shù)學(xué)符號兩個方面介紹加工要點。
1.1 數(shù)學(xué)公式
1)數(shù)學(xué)公式一般以另行居中排為原則。
2)公式前面,如上行末文字是“令”、“為”、“有”、“是”、“得”等字時,其后不加任何標(biāo)點符號。
3)公式中常用的括號有圓括號、方括號、花括號,三種括號多重使用時,一般是圓括號外套方括號,外再套花括號。
4)一般情況下,如果公式不是特別復(fù)雜,則符號說明可在“式中,”之后按接排式的版式排(中間用分號隔開)。
5)公式需加排序號,采用阿拉伯?dāng)?shù)碼,并用圓括號括起,放在公式右邊行末版口處。
6)公式中的主輔線要分清(一般主線比輔線長),并且主線要與運算符號在同一水平線上。
7)方程組在編排時應(yīng)盡量排在一面上。
8)編排行列式和矩陣時,應(yīng)特別注意元素的行列要上下對齊,每一行的間距要均勻一致,行距通常為半個字距;對角矩陣的對角元素所在的列應(yīng)明顯區(qū)分,不能上下重疊,混淆不清。
1.2 數(shù)學(xué)符號
數(shù)學(xué)符號的字體以國家標(biāo)準(zhǔn)為依據(jù),主要有大、小寫的區(qū)別,白、黑體的區(qū)別,正、斜體的區(qū)別。
1)未知量的符號,表示變量的字母、變量符號,以及表示點、線段的符號用白斜體。
2)集合符號用黑正體,如集合B。
3)矢量(向量)符號、張量符號、矩陣符號都用黑斜體表示,如力F、張量T、矩陣A。
交叉類稿件的加工中還應(yīng)特別注意公式里出現(xiàn)的容易混淆的字符,如英文字母的大小寫容易混淆、英文字母O和阿拉伯?dāng)?shù)字0容易混淆、英文字母a和希臘文字α等。因此編輯在加工時一定要認(rèn)真、仔細(xì)地標(biāo)識清楚,以避免排版人員在排版時出錯。
另外,一些物理學(xué)和數(shù)學(xué)家的名字也會有常用錯別字,如“傅利葉”應(yīng)該為“傅里葉”、“笛卡爾”應(yīng)該為“笛卡兒”。
當(dāng)然,關(guān)于數(shù)學(xué)公式和數(shù)學(xué)符號的使用還有很多詳細(xì)的要求,以上列出的僅是生物類交叉學(xué)科圖書中最容易遇到的問題。
2 與化學(xué)的交叉
生物學(xué)與化學(xué)交叉的學(xué)科中,主要任務(wù)是對化學(xué)式的加工,最容易出問題的主要有以下幾處。
1)單箭頭表示反應(yīng)單向進(jìn)行,雙箭頭表示反應(yīng)雙向進(jìn)行。
2)化學(xué)元素符號用整體,表示反應(yīng)組分?jǐn)?shù)量的變量符號用斜體。
3)有機(jī)化學(xué)式中,化學(xué)鍵的鍵長要統(tǒng)一。
4)有機(jī)化學(xué)式中,元素符號和鍵號必須對準(zhǔn)。
3 與計算機(jī)科學(xué)的交叉
隨著后基因組時代的到來,生物學(xué)與計算機(jī)科學(xué)的交叉學(xué)科應(yīng)運而生,包括生物信息學(xué)、計算生物學(xué)、合成生物學(xué)等。這類稿件的加工通常注意以下幾點。
1)會出現(xiàn)數(shù)學(xué)公式和符號,加工重點見上。
2)有較多的計算機(jī)軟件生成圖或者屏幕抓圖,因此加工時一定要注意圖片的清晰度,圖片模糊的話需要作者重新提供。
3)稿件中會出現(xiàn)較多的縮略詞、簡寫,包括計算模型的縮略詞、研究機(jī)構(gòu)的縮略詞、數(shù)據(jù)庫的縮略詞等,因此加工時要注意這些縮略詞是否前后一致;同時要盡量保證這些縮略詞的拼寫正確。例如,“GenBank數(shù)據(jù)庫”不能寫成“GeneBank數(shù)據(jù)庫”。
4)稿件中有時會出現(xiàn)一些代碼程序,特別注意,這時不能根據(jù)我們已有的編輯加工知識去隨意修改,因為代碼有其本身固有的格式。
4 與醫(yī)學(xué)的交叉
生物學(xué)與醫(yī)學(xué)的交叉學(xué)科包括生物醫(yī)學(xué)工程學(xué)、生物醫(yī)學(xué)影像學(xué)、生物制藥、醫(yī)學(xué)細(xì)胞生物學(xué)等。這類稿件的加工難點主要是一些常見醫(yī)學(xué)術(shù)語的規(guī)范。例如,“羅音”應(yīng)該為“音”、“愛滋病”應(yīng)該為“艾滋病”、“抗菌素”應(yīng)改為“抗生素”、“心肌梗塞”應(yīng)改為“心肌梗死”等。
4.1 與環(huán)境科學(xué)、地理學(xué)的交叉
生物學(xué)與環(huán)境科學(xué)、地理學(xué)的交叉主要涉及一些生態(tài)學(xué)科類的圖書,如水資源、森林資源、農(nóng)業(yè)氣候資源等。這類稿件的加工中,除了涉及生物學(xué)的基礎(chǔ)知識外,加工的重點主要為地圖、插圖類問題和數(shù)據(jù)錯誤。
1)地圖、插圖類問題。
(1)島點差錯(漏標(biāo)主要島點)。
(2)界限畫法錯誤(國界、未定界)。
(3)注記差錯(級別、字色、錯別字)。
(4)區(qū)域設(shè)色差錯(如臺灣底色)。
(5)比例尺差錯。
2)數(shù)據(jù)錯誤。
(1)求和、求平均值、計算增長率等錯誤。
(2)正文中的數(shù)據(jù)與表中的數(shù)據(jù)不一致。
(3)同一個數(shù)據(jù),前后文不一致。
(4)文字描述與數(shù)據(jù)不一致,如“第一年是272t,第二年是230t,增長了……”。
5 與社會科學(xué)的交叉
生命倫理學(xué)關(guān)注的是生物學(xué)、醫(yī)學(xué)、控制論、政治、法律、哲學(xué)和神學(xué)這些領(lǐng)域的相互關(guān)系中產(chǎn)生的問題。因此其通常會存在較大的爭議。在這類稿件的加工過程中要特別留意是否存在宗教、信仰方面的敏感問題。這類問題可能并不多見,一旦出現(xiàn)就要特別引起重視,屬于政治性差錯的范疇。
另外需要注意的是,在科技類圖書中會出現(xiàn)很多專業(yè)名詞,特別是交叉學(xué)科的圖書,涉及的專業(yè)類別很廣,編輯的知識不肯能面面俱到,如果遇到不太熟悉的專業(yè)名詞,一定要核查準(zhǔn)確,確定是錯誤的字、詞才可以改動,絕對不能妄改。關(guān)于專業(yè)名詞,可以在全國科學(xué)技術(shù)名詞審定委員會網(wǎng)站上進(jìn)行核實。
隨著我國科學(xué)技術(shù)的不斷進(jìn)步和發(fā)展,科技類圖書承載“介紹新知、推廣技術(shù)、傳播資訊、傳承文化”的使命不斷增強(qiáng)。因此,科技類圖書的編輯應(yīng)當(dāng)密切跟蹤相關(guān)學(xué)科發(fā)展前沿,以此為基礎(chǔ)增強(qiáng)科技類稿件的科學(xué)性,判斷稿件的真理性,提高稿件的邏輯性。作為聯(lián)系作者與讀者的橋梁,科技類圖書的編輯要著力拓寬自己的知識領(lǐng)域,只有這樣才能編輯加工出高質(zhì)量、高水平的科技稿件。
參考文獻(xiàn)
[1]張祖權(quán).科技文獻(xiàn)中插圖編輯加工芻議.科技期刊編輯研究文集(第四集),1996.
1SIS計算機(jī)病毒傳播模型
人們發(fā)現(xiàn)計算機(jī)病毒的傳播特性與生物學(xué)中的流行病病毒有很多共性之處,所以有可能根據(jù)流行病的數(shù)學(xué)模型推出計算機(jī)病毒傳播的數(shù)學(xué)模型。1991年,J.O.Kephart和S.R.White[1]聯(lián)想到這種共性,首次用流行病的數(shù)學(xué)模型對計算機(jī)病毒的傳播進(jìn)行了分析,根據(jù)Kermach-Mchendrick生物病毒傳播模型提出了計算機(jī)病毒的傳播模型——SIS模型,如(1)式。Kermach-Mchendrick生物病毒傳播模型描述了一定范圍下的生物體在t時刻下處于兩種狀態(tài)之一:易感染狀態(tài)(Susceptible)和感染狀態(tài)(Infectious),而易感染者受到病毒感染變成感染者。SIS計算機(jī)病毒傳播模型與Kermach-Mchendric模型不同之處[2]主要在于計算機(jī)病毒感染者能夠以一定的治愈率δ被治愈馬上轉(zhuǎn)化為易感染狀態(tài),而生物體被感染后則可能死亡或獲得免疫力,因此計算機(jī)狀態(tài)轉(zhuǎn)變過程是:SusceptibleInfectiousSusceptible。在當(dāng)今云概念可能廣泛實際應(yīng)用的情況下,原有SIS模型的缺點——將所有的計算機(jī)被感染的比率和治愈率都規(guī)定為一定的,有可能得到改觀。由于所有區(qū)域內(nèi)的計算機(jī)都由一個功能強(qiáng)大的云端后臺來控制,計算機(jī)病毒還有可能進(jìn)行遠(yuǎn)程感染,各計算機(jī)被感染的概率會比較接近,受每臺計算機(jī)的感染特征和連接率的影響減小,同時治愈率也是比較接近的。但另一方面,SIS模型所提出的“計算機(jī)病毒感染者被治愈后馬上轉(zhuǎn)化為易感染狀態(tài)”與現(xiàn)實網(wǎng)絡(luò)病毒傳播特性相比變得更加不符。由于互聯(lián)網(wǎng)提供云服務(wù),執(zhí)行云安全,被治愈后的計算機(jī)系統(tǒng)會集體升級殺毒軟件、安裝漏洞補(bǔ)丁,增強(qiáng)對病毒的防范、免疫能力,不會立刻轉(zhuǎn)化為易感染狀態(tài)。
2SIR計算機(jī)病毒傳播模型
在計算機(jī)病毒傳播和控制策略的研究中,一些是基于SusceptibleInfectiousRemoved(SIR)模型進(jìn)行的。計算機(jī)病毒傳播的SIR模型[3],又被稱為經(jīng)典普通傳播模型:計算機(jī)被感染后可能癱瘓或獲得免疫力,在一段時間內(nèi)不會被其他感染者感染,屬于“被移除狀態(tài)”,則在確定范圍下的計算機(jī)被劃分為3個狀態(tài),易感染狀態(tài)(Susceptible)、感染狀態(tài)(Infectious)和被移除狀態(tài)(Removed),如(2)式。計算機(jī)的狀態(tài)轉(zhuǎn)變過程為:SusceptibleInfectiousRemoved。由于SIR模型對項軌線和閥值進(jìn)行了較為仔細(xì)的分析和研究,分析了計算機(jī)被感染后的變化,因而要比SIS模型有了提高[4]。當(dāng)云端后臺控制區(qū)域內(nèi)的所有計算機(jī)時,已感染病毒的計算機(jī)可能會被“移除”出體系外,進(jìn)行隔離,也就是SIR模型中所說的被移除狀態(tài)(Removed)。但SIR模型并沒有考慮到在云安全已逐步得到應(yīng)用的情況下,未被病毒感染的計算機(jī)會在感染前就得到病毒信息,下載相應(yīng)的漏洞補(bǔ)丁,升級殺毒軟件,使計算機(jī)對此種病毒具有預(yù)免疫能力;實際中,不僅已被病毒感染的計算機(jī)可以從傳染中被移除,未被病毒感染的計算機(jī)也有可能從傳染中被移除。
3SIRS計算機(jī)病毒傳播模型
RPastor-Satorras等[5]使用平均場理論研究了在均勻網(wǎng)絡(luò)上的計算機(jī)病毒傳播過程,認(rèn)為感染病毒后癱瘓或獲得免疫力的計算機(jī),可以一定的生還率μ再次變成易感染者,則計算機(jī)的狀態(tài)轉(zhuǎn)變過程為:Sus-ceptibleInfectiousRemovedSusceptible,提出了SIRS計算機(jī)病毒傳播模型:其中,β表示一個已感染病毒的計算機(jī)將病毒傳染給與其它易感計算機(jī)的概率,δ表示一個已感染病毒的計算機(jī)可以被治愈的概率。假如感染率β比較高,病毒則會大量傳播;假如治愈率δ比較高,病毒傳播則會得到抑制。SIRS模型考慮了更加具體一些,注意到癱瘓或獲得免疫力的計算機(jī)有可能再次變成易感染者,但在云概念的實際應(yīng)用中,這種可能性變小,雖然病毒感染有可能出現(xiàn)成片爆發(fā)的趨勢,而由于云安全的執(zhí)行,對病毒的控制也會進(jìn)行較為系統(tǒng)的組織。
[論文摘要]生物信息學(xué)是80年代以來新興的一門邊緣學(xué)科,信息在其中具有廣闊的前景。伴隨著人類基因組計劃的勝利完成與生物信息學(xué)的發(fā)展有著密不可分的聯(lián)系,生物信息學(xué)的發(fā)展為生命科學(xué)的發(fā)展為生命科學(xué)的研究帶來了諸多的便利,對此作了簡單的分析。
一、生物信息學(xué)的產(chǎn)生
21世紀(jì)是生命科學(xué)的世紀(jì),伴隨著人類基因組計劃的勝利完成,與此同時,諸如大腸桿菌、結(jié)核桿菌、啤酒酵母、線蟲、果蠅、小鼠、擬南芥、水稻、玉米等等其它一些模式生物的基因組計劃也都相繼完成或正在順利進(jìn)行。人類基因組以及其它模式生物基因組計劃的全面實施,使分子生物數(shù)據(jù)以爆炸性速度增長。在計算機(jī)科學(xué)領(lǐng)域,按照摩爾定律飛速前進(jìn)的計算機(jī)硬件,以及逐步受到各國政府重視的信息高速公路計劃的實施,為生物信息資源的研究和應(yīng)用帶來了福音。及時、充分、有效地利用網(wǎng)絡(luò)上不斷增長的生物信息數(shù)據(jù)庫資源,已經(jīng)成為生命科學(xué)和生物技術(shù)研究開發(fā)的必要手段,從而誕生了生物信息學(xué)。
二、生物信息學(xué)研究內(nèi)容
(一)序列比對
比較兩個或兩個以上符號序列的相似性或不相似性。序列比對是生物信息學(xué)的基礎(chǔ)。兩個序列的比對現(xiàn)在已有較成熟的動態(tài)規(guī)劃算法,以及在此基礎(chǔ)上編寫的比對軟件包BALST和FASTA,可以免費下載使用。這些軟件在數(shù)據(jù)庫查詢和搜索中有重要的應(yīng)用。有時兩個序列總體并不很相似,但某些局部片斷相似性很高。Smith-Waterman算法是解決局部比對的好算法,缺點是速度較慢。兩個以上序列的多重序列比對目前還缺乏快速而又十分有效的算法。
(二)結(jié)構(gòu)比對
比較兩個或兩個以上蛋白質(zhì)分子空間結(jié)構(gòu)的相似性或不相似性。
(三)蛋白質(zhì)結(jié)構(gòu)預(yù)測
從方法上來看有演繹法和歸納法兩種途徑。前者主要是從一些基本原理或假設(shè)出發(fā)來預(yù)測和研究蛋白質(zhì)的結(jié)構(gòu)和折疊過程。分子力學(xué)和分子動力學(xué)屬這一范疇。后者主要是從觀察和總結(jié)已知結(jié)構(gòu)的蛋白質(zhì)結(jié)構(gòu)規(guī)律出發(fā)來預(yù)測未知蛋白質(zhì)的結(jié)構(gòu)。同源模建和指認(rèn)(Threading)方法屬于這一范疇。雖然經(jīng)過30余年的努力,蛋白結(jié)構(gòu)預(yù)測研究現(xiàn)狀遠(yuǎn)遠(yuǎn)不能滿足實際需要。
(四)計算機(jī)輔助基因識別
給定基因組序列后,正確識別基因的范圍和在基因組序列中的精確位置.這是最重要的課題之一,而且越來越重要。經(jīng)過20余年的努力,提出了數(shù)十種算法,有十種左右重要的算法和相應(yīng)軟件上網(wǎng)提供免費服務(wù)。原核生物計算機(jī)輔助基因識別相對容易些,結(jié)果好一些。從具有較多內(nèi)含子的真核生物基因組序列中正確識別出起始密碼子、剪切位點和終止密碼子,是個相當(dāng)困難的問題,研究現(xiàn)狀不能令人滿意,仍有大量的工作要做。
(五)非編碼區(qū)分析和DNA語言研究
在人類基因組中,編碼部分進(jìn)展總序列的3-5%,其它通常稱為“垃圾”DNA,其實一點也不是垃圾,只是我們暫時還不知道其重要的功能。分析非編碼區(qū)DNA序列需要大膽的想象和嶄新的研究思路和方法。DNA序列作為一種遺傳語言,不僅體現(xiàn)在編碼序列之中,而且隱含在非編碼序列之中。
三、生物信息學(xué)的新技術(shù)
(一)Lipshutz(Affymetrix,Santaclara,CA,USA)
描述了一種利用DNA探針陣列進(jìn)行基因組研究的方法,其原理是通過更有效有作圖、表達(dá)檢測和多態(tài)性篩選方法,可以實現(xiàn)對人類基因組的測序。光介導(dǎo)的化學(xué)合成法被應(yīng)用于制造小型化的高密度寡核苷酸探針的陣列,這種通過軟件包件設(shè)計的寡核苷酸探針陣列可用于多態(tài)性篩查、基因分型和表達(dá)檢測。然后這些陣列就可以直接用于并行DNA雜交分析,以獲得序列、表達(dá)和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介紹了一種新的基于專用定量表達(dá)分析方法的基因表達(dá)檢測系統(tǒng),以及一種發(fā)現(xiàn)基因的系統(tǒng)GeneScape。為了有效地抽樣表達(dá),特意制作片段模式以了解特定基因的子序列的發(fā)生和冗余程度。他在酵母差異基因表達(dá)的大規(guī)模研究中對該技術(shù)的性能進(jìn)行了驗證,并論述了技術(shù)在基因的表達(dá)、生物學(xué)功能以及疾病的基礎(chǔ)研究中的應(yīng)用。(二)基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)論述了人類基因組計劃的下一階段的任務(wù)基因組水平的基因功能分析。這一階段產(chǎn)生的數(shù)據(jù)的分析、管理和可視性將毫無疑問地比第一階段更為復(fù)雜。他介紹了一種用于脊椎動物造血系統(tǒng)紅系發(fā)生的功能分析的原型系統(tǒng)E-poDB,它包括了用于集成數(shù)據(jù)資源的Kleisli系統(tǒng)和建立internet或intranet上視覺化工具的bioWidget圖形用戶界面。EpoDB有可能指導(dǎo)實驗人員發(fā)現(xiàn)不可能用傳統(tǒng)實驗方法得到的紅系發(fā)育的新的藥物靶,制藥業(yè)所感興趣的是全新的藥物靶,EpoDB提供了這樣一個機(jī)會,這可能是它最令人激動的地方。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)討論了通過數(shù)據(jù)庫搜索來識別遠(yuǎn)緣蛋白質(zhì)的方法。對蛋白質(zhì)超家族的結(jié)構(gòu)和功能的相互依賴性的理解,要求了解自然所塑造的一個特定結(jié)構(gòu)模板的隱含限制。蛋白質(zhì)結(jié)構(gòu)之間的最有趣的關(guān)系經(jīng)常在分歧的序列中得以表現(xiàn),因而區(qū)分得分低(low-scoring)但生物學(xué)關(guān)系顯著的序列與得分高而生物學(xué)關(guān)系較不顯著的序列是重要的。Babbit證明了通過使用BLAST檢索,可以在數(shù)據(jù)庫搜索所得的低得分區(qū)識別遠(yuǎn)緣關(guān)系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)討論了蛋白質(zhì)結(jié)構(gòu)預(yù)測和一種僅從序列數(shù)據(jù)對功能自動模建的方法?;蚬δ苋Q于基因編碼的蛋白質(zhì)的三級結(jié)構(gòu),但數(shù)據(jù)庫中蛋白質(zhì)序列的數(shù)目每18個月翻一番。為了確定這些序列的功能,結(jié)構(gòu)必須確定。同源模建和從頭折疊(abinitiofolding)方法是兩種現(xiàn)有的互為補(bǔ)充的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法;同源模建是通過片段匹配(segmentmatching)來完成的,計算機(jī)程棄SegMod就是基于同源模建方法的。
(三)新的數(shù)據(jù)工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介紹了GDB數(shù)據(jù)庫,它由每條人類染色體的許多不同圖譜組成,包括細(xì)胞遺傳學(xué)、遺傳學(xué)、放射雜交和序列標(biāo)簽位點(STS)的內(nèi)容,以及由不同研究者用同種方法得到的圖譜。就位置查詢而言,如果不論其類型(type)和來源(source),或者是否它們正好包含用以批定感興趣的區(qū)域的標(biāo)志(markers),能夠搜索所有圖譜是有用的。為此目的,該數(shù)據(jù)庫使用了一種公用坐標(biāo)系統(tǒng)(commoncoordinatesystem)來排列這些圖譜。數(shù)據(jù)庫還提供了一張高分辨率的和與其他圖譜共享許多標(biāo)志的圖譜作為標(biāo)準(zhǔn)。共享標(biāo)志的標(biāo)之間的對應(yīng)性容許同等于所有其它圖譜的標(biāo)準(zhǔn)圖譜的分配。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介紹了一種新的存儲直接來自ABⅠPrismdNA測序儀的數(shù)據(jù)的關(guān)系數(shù)據(jù)庫系統(tǒng)BioLIMS。該系統(tǒng)可以與其它測序儀的數(shù)據(jù)集成,并可方便地與其它軟件包自動調(diào)用,為測序儀與序列數(shù)據(jù)的集成提供了一種開放的、可擴(kuò)展的生物信息學(xué)平臺。
參考文獻(xiàn):
關(guān)鍵詞:DNA計算機(jī);計算方式;生命觀
1 DNA計算的理論、特點和問題
1994年11月美國計算機(jī)科學(xué)家 L.阿德勒曼(L.Adleman)在《科學(xué)》上公布了DNA計算機(jī)的理論,并成功的運用DNA計算機(jī)解決了一個有向哈密爾頓路徑問題[1]。這一成果迅速在國際上產(chǎn)生了巨大反響[2],同時也引起了國內(nèi)學(xué)者的關(guān)注[3]。一些人相信,DNA計算蘊含的理念可使計算的方式產(chǎn)生“進(jìn)化”。另一些人則看到DNA計算的理念將有助于揭示生命的本質(zhì)與演化??傊@一全新的計算理論,將在數(shù)學(xué)與生命科學(xué)中產(chǎn)生極其深遠(yuǎn)而廣大的影響。同時它也提出了一系列值得我們深思的哲學(xué)性問題。
DNA計算機(jī)目前尚處在理論研究階段,一旦它在實用意義上獲得成功,DNA計算將徹底改變計算機(jī)硬件的性質(zhì)。在過去的半個世紀(jì)里,計算機(jī)完全就是物理芯片的同義詞。但阿德勒曼DNA計算機(jī)則是一種化學(xué)反應(yīng)計算機(jī)[4]。它的基本構(gòu)想是:以DNA堿基序列作為信息編碼的載體,利用現(xiàn)代分子生物學(xué)技術(shù),在試管內(nèi)控制酶作用下的DNA序列反應(yīng),作為實現(xiàn)運算的過程;這樣,以反應(yīng)前DNA序列作為輸入的數(shù)據(jù),反應(yīng)后的DNA序列作為運算的結(jié)果。阿德勒曼具體應(yīng)用哈密爾頓有向圖這個經(jīng)典NPC問題,詳細(xì)描述了他的理論。
DNA計算機(jī)的提出,產(chǎn)生于這樣一個發(fā)現(xiàn),即生物與數(shù)學(xué)的相似性:①生物體異常復(fù)雜的結(jié)構(gòu)是對由DNA序列表示的初始信息執(zhí)行簡單操作(復(fù)制、剪接)的結(jié)果;②可計算函數(shù)f(w)的結(jié)果可以通過在w上執(zhí)行一系列基本的簡單函數(shù)而獲得。阿德勒曼不僅意識到這兩個過程的相似性,而且意識到可以利用生物過程來模擬數(shù)學(xué)過程,更確切地說是,DNA串可用于表示信息,酶可用于模擬簡單的計算。這是因為:①DNA是由稱作核苷酸的一些單元組成,這些核苷酸隨著附在其上的化學(xué)組或基的不同而不同。共有四種基:腺瞟吟、鳥瞟吟、胞嘧啶和胸腺嘧啶,分別用A、G、C、T表示。一些單個的核苷酸順序連在一起形成DNA鏈。單鏈DNA可以看作是由符合A、G、C、T組成的字符串。從數(shù)學(xué)上講,這意味著我們可以用一個含有四個字符的字符集∑=A、G、C、T來為信息編碼(電子計算機(jī)僅使用0和1這兩個數(shù)字)。②DNA序列上的一些簡單操作需要酶的協(xié)助,不同的酶發(fā)揮不同的作用。起作用的有四種酶:a.限制性內(nèi)切酶,主要功能是切開包含限制性位點的雙鏈DNA;b.DNA連接酶,它主要是把一個DNA鏈的端點同另一個鏈連接在一起;c.DNA聚合酶,它的功能包括DNA的復(fù)制與促進(jìn)DNA的合成;d.外切酶,它可以有選擇地破壞雙鏈或單鏈DNA分子。正是基于這四種酶的協(xié)作實現(xiàn)了DNA計算。
自阿德勒曼用DNA計算機(jī)解決了哈密爾頓有向圖問題,隨后很快便有人用DNA計算機(jī)相繼解決了其他一些疑難問題(NPC完全問題),如可滿足性問題等。與電子計算機(jī)相比,DNA計算機(jī)有明顯的優(yōu)勢。不過,這些還僅僅是利用分子技術(shù)解決的幾個特定問題,是為解決特定問題而進(jìn)行的一次性實驗。DNA計算機(jī)還沒有一個固定的程式。由于問題的多樣性導(dǎo)致所采用的分子生物學(xué)技術(shù)的多樣性,具體問題需要設(shè)計具體的實驗方案。于是,便引出了兩個根本性的問題,阿德勒曼最早就意識到了它們:①DNA計算機(jī)可以解決哪些問題?確切地說,DNA計算機(jī)是完備的嗎?即通過操縱DNA能完成所有的(圖靈機(jī))可計算函數(shù)嗎?②是否可設(shè)計出可編程序的DNA計算機(jī)?即是否存在類似于電子計算機(jī)的通用計算模型——圖靈機(jī)——那樣的通用DNA系統(tǒng)(模型)?目前,人們正處在對這兩個根本性問題的研究過程之中。在我們看來,這就類似于在電子計算機(jī)誕生之前的20世紀(jì)三四十年代——理論計算機(jī)的研究階段。如今,已經(jīng)提出了多種DNA計算模型,但各有千秋,公認(rèn)的DNA計算機(jī)的“圖靈機(jī)”還沒有誕生。相對而言,一種被稱為“剪接系統(tǒng)”的DNA計算機(jī)模型較為成功[5]。
由于DNA鏈可以比作在四字符集上的串,為DNA計算建模的自然方式就是利用專門處理字符和字符串的形式語言理論。建模的關(guān)鍵就是要將實際的DNA重組抽象為數(shù)學(xué)上的剪接操作。實際的DNA重組,就是在前面所提到的四種“工具酶”的作用下,對DNA鏈的切割和粘貼的組合過程。其數(shù)學(xué)抽象稱為剪接操作。大體可做如下描述:給定字符集∑(其元素為符號)及其上的兩個字符串x、y,利用剪接規(guī)則r剪接x和y的過程可以分為:①在由剪接規(guī)則r決定的位置上切割x和y;②分別將結(jié)果中x的前段和y的后段、y的前段和x的后段連在一起?!?的剪接規(guī)則 r是形如α1#β1$α2#β2的詞,其中α1、β1、α2、β2是∑的串,#和$是∑外的標(biāo)記符。我們稱z和w是根據(jù)剪接規(guī)則r=α1#β1$α2#β2剪接x和y的結(jié)果,當(dāng)且僅當(dāng)存在∑上的x1、x?、y2、y?使得
x=x1α1β1x?, y=y(tǒng)2α2β2y?
且 z=x1α1β2y?, w=y2α2β1x?
并記作(x,y) (z,w)。α1β1和α2β2這兩個串稱為剪接位點;x和y稱為剪接項。剪接規(guī)則r決定了切割的位點和位置:第一項在α1和β1之間,第二項在α2和β2之間。值得注意的是位點α1β1和α2β2會分別在x和y中出現(xiàn)多次,如果這樣,選擇哪一個位點是不確定的。結(jié)果會造成對x和y剪接的結(jié)果是(z,w)的一個集合。
將剪接操作當(dāng)作基本工具來構(gòu)建一種生成機(jī)制,便形成了剪接系統(tǒng)。給定一個字符串集A,A∑*,∑*為字符集∑上由連接操作生成的字符串的集合(∑*中的元素為串),以及一個剪接現(xiàn)則集R(r∈R∑*#∑*$∑*?!?),由此所生成的東西是由如下方法得到的串組成;從集A開始,在A和已獲得的串上重復(fù)使用剪接規(guī)則。另外,應(yīng)該說明一點,通常剪接x和y得到z和w后,仍可以將x和y當(dāng)作剪接項,與此相似,對新生成的z和x也沒有數(shù)量上的限制。但對某些串僅可使用有限次。故在數(shù)學(xué)上不用集合來表示剪接項,而用多重集——在每個時刻都應(yīng)當(dāng)記錄每個串可用的個數(shù)。至此,可以給出剪接系統(tǒng)的一個簡潔而又嚴(yán)格的定義:剪接系統(tǒng)是一個四元組r=(∑、T、A、R),其中∑是一個字符集,T ∑是終結(jié)字符集,A是∑*上的多重集,R是剪接規(guī)則的集合。
定義了DNA計算的數(shù)學(xué)模型后,便可以來回答前面提出的DNA計算的完備性與通用性問題。在計算機(jī)科學(xué)中,眾所周知的丘奇一圖靈論點深刻地刻畫了任何實際計算機(jī)的計算能力——任何可計算函數(shù)都是可由圖靈機(jī)計算的函數(shù)(一般遞歸函數(shù))。現(xiàn)已證明:剪接系統(tǒng)是計算完備的,即任何可計算函數(shù)都可以用剪接系統(tǒng)來計算。換句話說就是,任何圖靈機(jī)可計算的函數(shù)都可以由這種DNA計算模型來計算。反之亦然。這就回答了DNA計算機(jī)可以解決哪些問題——全部圖靈機(jī)可計算問題。
對于第二個問題——是否存在基于剪接的可編程計算機(jī)——也有了肯定的答案:對每個給定的字符集T,都存在一個剪接系統(tǒng),其公理集和規(guī)則集都是有限的,而且對于以T為終結(jié)字符集的一類系統(tǒng)是通用的。這就是說,理論上存在一個基于剪接操作的通用可編程的DNA計算機(jī)。程序由往通用計算機(jī)公理集中添加的字符串組成。程序會有多個,而可利用的公理集合有無窮多個。這些計算機(jī)使用的生物操作只有合成、剪接(切割一連接)和抽取。
理論上DNA計算機(jī)具有現(xiàn)代電子計算機(jī)同樣的計算能力,但它具有的巨大潛力(功能)卻是電子計算機(jī)不可比擬的:DNA計算機(jī)運算速度極快,其幾天的運算量就相當(dāng)于計算機(jī)問世以來世界上所有計算機(jī)的總運算量;它的貯存容量非常大,1立方分米的DNA溶液可以存儲1萬億億位二進(jìn)制的數(shù)據(jù),超過目前所有計算機(jī)的存儲容量;它的能量消耗只有一臺普通計算機(jī)的十億分之一。如此優(yōu)越的分子計算機(jī)當(dāng)然是激動人心的。然而它離開發(fā)、實際應(yīng)用還有相當(dāng)?shù)木嚯x,尚有許多現(xiàn)實的技術(shù)性問題需要去解決。如生物操作的困難,有時輕微的振蕩就會使DNA斷裂;有些DNA會粘在試管壁、抽筒尖上,從而就在計算中丟失了。盡管DNA計算機(jī)面對著許許多多的質(zhì)疑,但它的提出者阿德勒曼教授依然是極其樂觀的:DNA計算機(jī)剛剛提出,尚在胚胎時期,與發(fā)展了半個世紀(jì)的電子計算機(jī)相比,確實相形見細(xì)。在他看來,提出DNA計算機(jī)并不就是要與電子計算機(jī)競爭。首先,分子計算的觀念拓寬了人們對自然計算現(xiàn)象的理解,特別是生物學(xué)中基本算法的理解。另外,DNA計算的觀念向現(xiàn)有的計算機(jī)科學(xué)和數(shù)學(xué)提出了挑戰(zhàn),相信它所蘊涵的理念可以使計算的方式發(fā)生進(jìn)化。
DNA計算理論是目前西方發(fā)達(dá)國家的一個研究熱點,有些困難已經(jīng)通過新的程序設(shè)計技術(shù)(無須等待生物技術(shù)的發(fā)展),采用概率算法及修改數(shù)學(xué)問題等傳統(tǒng)的解決方案得以解決。人們大都相信,分子計算的實際應(yīng)用在未來是可行的。另外,要知道,類似合成雜交、抽取等所有生物操作的問題,都已被大自然中的生物系統(tǒng)所涉及,而且這些問題在生物體內(nèi)已成功的解決了,這就不會在生物體外解決不了。向大自然學(xué)習(xí),問題就會得到解決。
2 DNA計算:計算方式的進(jìn)化
1994年11月阿得勒曼在提出DNA計算機(jī)的時候就相信:DNA計算機(jī)所蘊涵的理念可使計算的方式產(chǎn)生進(jìn)化。后來的研究者就更堅信這一點了。如加拿大的卡爾(L.Kari)就更明確的指出:“DNA計算是考察計算問題的一種全新的方式?;蛟S這正是大自然做數(shù)學(xué)的方法:不是用加和減,而是用切割和粘貼、用插入和刪除。正如用十進(jìn)制計數(shù)是因為我們有十個手指那樣,或許我們目前計算中的基本功能僅因為人類歷史使然。正如人們已經(jīng)采用其它進(jìn)制計數(shù)一樣,或許現(xiàn)在是考慮其它的計算方式的時候了”[6]。我們以為,這一說法是很有啟示性的。確實,仔細(xì)回顧一下人類計算方式或計算技術(shù)的歷史,就不難體會到目前人們的計算方式確實是一種歷史的結(jié)果,而非計算本性的邏輯必然。不過為了進(jìn)一步論證和拓展這一觀點,下面有必要就什么是計算。計算的方式是什么等問題給予一個簡要的回答。
計算的本質(zhì)是什么?應(yīng)該說人類對其已經(jīng)有了一個基本的清晰的認(rèn)識,這就是遞歸論或可計算性理論中所揭示的一個基本內(nèi)容:計算就是依據(jù)一定的法則對有關(guān)符號串的變換過程。根據(jù)丘奇一圖靈論點,一切可計算的函數(shù)都是遞歸函數(shù)。抽象地說,計算的本質(zhì)就是遞歸。不過這里我們想給出一個直觀的描述:計算就是從已知符號開始,一步一步地改變符號串,經(jīng)過有限步驟后,最終得到一個滿足預(yù)定條件的符號串的過程。這樣一種有限的符號串的變換過程與遞歸過程是等價的、一致的。所謂計算方式就是符號變換的操作方式,尤其指最基本的動作方式。廣義地講,還應(yīng)包括符號的載體或符號的外在表現(xiàn)形式。從中國古代的籌算方式(一組竹棍表征)、珠算方式,到后來的筆算方式就是一系列的計算方式的變化(它們各自具有各自的操作方式)。相對于后來的機(jī)器計算方式,這些計算的方式均可歸結(jié)為“手工計算方式”,其特點是用手工操作符號,實施符號的變換——擺排竹棍、撥弄算珠或書寫符號。機(jī)器計算的歷史可以追溯到1641年,當(dāng)年18歲的法國數(shù)學(xué)家帕斯卡爾從機(jī)械時鐘得到啟示——齒輪也能計數(shù),成功地制作了一臺齒輪傳動的八位加法計算機(jī)。這使人類計算方式、計算技術(shù)進(jìn)入了一個新的階段。后來經(jīng)過人們數(shù)百年的艱辛努力,終于在1945年成功地研制出了世界上第一臺電子計算機(jī)。從此,人類進(jìn)入了一個全新的計算技術(shù)時代。就電子計算機(jī)而言,至今它也經(jīng)歷了四個大的時期。從最早的帕斯卡爾齒輪機(jī)到今天最先進(jìn)的電子計算機(jī),計算技術(shù)有了長足的發(fā)展。這是一個計算方式發(fā)生重大變革的歷史時期。這時計算表現(xiàn)為一種物理性質(zhì)的機(jī)械的操作過程。但是,無論是手工計算還是機(jī)器計算,其計算方式——操作的基本動作都是一種物理性質(zhì)的符號變換,具體是由“加”和“減”這種基本動作構(gòu)成的。二者的區(qū)別就在于前者是手工的,后者是自動的。
然而,如今出現(xiàn)的DNA計算則有了更大的本質(zhì)性的變化。計算不再是一種物理性質(zhì)的符號變換,而是一種化學(xué)性質(zhì)的符號變換,即不再是物理性質(zhì)的‘“加”、“減”操作,而是化學(xué)性質(zhì)的切割和粘貼、插入和刪除。這種計算方式的變革是前所未有的,具有劃時代的意義。它將徹底改變計算機(jī)硬件的性質(zhì),改變計算機(jī)基本的運作方式,其意義將是極為深遠(yuǎn)的。我們完全可以做這樣一番想象,一旦DNA計算機(jī)全面實現(xiàn),那么真正的“人機(jī)合一”就會實現(xiàn)。到那時,人們最不需要的就是電腦,因為大腦本身就是一臺自然的DNA計算機(jī),人們真正需要的只是一個接口。DNA計算機(jī)蘊涵的理念不僅可以使計算的方式產(chǎn)生進(jìn)化,而且可以使人類的大腦、思維產(chǎn)生進(jìn)化。這是我們對阿德勒曼認(rèn)識的一點補(bǔ)充。然而,盡管DNA計算較之以往的各種計算有了重大的變革,但是,在計算本質(zhì)上,它同人類有史以來的一切計算都是等價的、一致的。這是因為:任何可計算函數(shù)都可由剪接系統(tǒng)來實現(xiàn),即任何圖靈機(jī)可計算的函數(shù)也可以由DNA計算機(jī)來計算。反之,任何由剪接系統(tǒng)計算的函數(shù)都可由留靈機(jī)計算。這就是說,DNA計算也是一種遞歸計算。這一結(jié)論有著重要的數(shù)學(xué)意義。它一方面使人們認(rèn)識了DNA計算的本質(zhì);另一方面進(jìn)一步證實或支持了丘奇一圖靈論點,使丘奇一圖靈論點首次獲得了電子計算機(jī)之外的生物計算機(jī)的證實,這種證實自然是更加有力的。
綜上所述,我們看到,計算之所以為計算,在于它具有一種根本的遞歸性,或在于它是一種可一步一步進(jìn)行的符號串變換操作。至于這種符號變換的操作方式如何,以及符號的載體或其外在表現(xiàn)形式如何,都不是本質(zhì)性的東西,它們無不是一種歷史的結(jié)果,無不處于一種不斷變革或進(jìn)化的過程之中。符號可以用一組竹棍表征、用一組算珠表征、用一組字母表征,也可以用齒輪表征、用電流表征,還可以分子表征、電子表征等等。不同表征下的符號變換有著不同的操作方式,甚至同一種表征下的符號變換都可以有不同的操作方式。在此,計算本質(zhì)的統(tǒng)一性與計算方式的多樣性得到了深刻的體現(xiàn)。我們相信,隨著科學(xué)技術(shù)的不斷發(fā)展,計算方式的多樣性還會有新的表現(xiàn)。既然DNA計算機(jī)的出現(xiàn)已經(jīng)打開了人們暢想未來計算方式的思維視窗,那么就讓我們翹首以待吧。
3 DNA計算:生命進(jìn)化的方式
生命是什么?生命是怎樣進(jìn)化的?這是人類一個永恒的話題。隨著自然科學(xué)的不斷發(fā)展,生命問題也在不斷變換著其形式,人們對它的理解、認(rèn)識也在不斷地更新,以適應(yīng)新的理論的發(fā)展與進(jìn)步。在20世紀(jì)八九十年代,由于人類基因組計劃、計算機(jī)人工生命、遺傳方法和DNA計算機(jī)等一系列全新的理論和觀念的出現(xiàn),使人們對生命是什么、生命是怎樣進(jìn)化的等重大基礎(chǔ)性問題再一次產(chǎn)生了新的理解。這種理解的核心內(nèi)容是:生命就是一臺自然計算機(jī)。生命的法則就是算法,生命就是以計算的方式在進(jìn)化著。DNA計算對這樣一種生命觀給予了強(qiáng)有力的支持。DNA計算表明了計算存在于生物學(xué)的根基上,計算處于生命的核心,生命本身就是由一系列復(fù)雜的計算組成的。下面我們對此作一個簡要的論述。
什么是算法?簡單地說,算法就是求解某類問題的通用法則或方法。通常要求用它能夠在有限步驟內(nèi)一步一步地完成對問題的求解。換句話說,算法也就是對有關(guān)數(shù)據(jù)或符號進(jìn)行變換的方法規(guī)則。計算就是對算法的執(zhí)行或?qū)?shù)據(jù)、符號依據(jù)有關(guān)規(guī)則進(jìn)行的變換操作。長期以來,計算、算法一直是數(shù)學(xué)的專有概念。但如今由于電子計算機(jī)深刻而廣泛的運用,使人們對這兩個基本概念有了更寬泛地認(rèn)識,使它們泛化到了整個自然界。認(rèn)為自然界就是一臺巨型自然計算機(jī)。任何一種自然過程都是自然規(guī)律作用于一定條件下的物理或信息過程,其本質(zhì)上都體現(xiàn)了一種嚴(yán)格的計算和算法特征。在此,自然系統(tǒng)相當(dāng)于計算機(jī)的硬件,自然規(guī)律相當(dāng)于計算機(jī)的軟件,而自然過程就是計算機(jī)的計算過程。生命系統(tǒng)作為自然界中最復(fù)雜最有特色的系統(tǒng),它也就是形形的自然計算機(jī)中的一種。
DNA計算機(jī)就是對生命這種自然機(jī)的一種表征。這是因為,DNA是生命的信息庫和程序庫,既是一套自復(fù)制的程序,同時又是一個以進(jìn)化論為基礎(chǔ)發(fā)展過來并正在發(fā)展的程序。它構(gòu)成了遺傳、發(fā)育、進(jìn)化統(tǒng)一的物質(zhì)基礎(chǔ)。現(xiàn)代生物學(xué)表明,一方面DNA可以看作是由A、G、C、T四個字符組成的字符串。從數(shù)學(xué)上講,這意味著我們可以用一個含有四個字符的字符集∑={A、G、C、T}為信息編碼。DNA代碼與計算機(jī)代碼所不同的只是它不是二進(jìn)制的,而是一種四進(jìn)制代碼。有人甚至指出:除了專業(yè)術(shù)語不同之外,分子生物學(xué)雜志里面的每一頁都可以換成計算機(jī)技術(shù)雜志的內(nèi)容。另一方面,DNA能夠?qū)υ撔畔⑤d體進(jìn)行一系列可控制的變換(即化學(xué)反應(yīng))。變換的具體方式是DNA的復(fù)制、剪切、連接、修復(fù),變換的過程就是一種生命過程,也即生命的自構(gòu)造性特征。因此,我們完全可以把生命看作是一臺自然計算機(jī),生命的進(jìn)化法則就是算法。另外,DNA作為一種自然語言,和計算機(jī)程序語言一樣,具有不同的層次,具有遞歸、并行、模塊化的基本特征?,F(xiàn)代生物學(xué)表明,一維線性分子在特定的環(huán)境中通過復(fù)雜而準(zhǔn)確的信息處理,可拓展為一個豐富的四維時空生命體,這種展現(xiàn)過程所獲得的新信息反過來又不斷地反映到一維線性分子中,導(dǎo)致生物物種的不斷進(jìn)化。這正是DNA程序語言層次性的表現(xiàn)。一維DNA序列只不過是最低級的生命機(jī)器語言,所有的高級語言都必須編譯成DNA序列語言才能執(zhí)行。目前,DNA這種自然語言的詞法、句法規(guī)則我們尚不清楚,但本質(zhì)上是一種程序化語言[7] 。
DNA計算機(jī)的提出,就是一種分子算法的化學(xué)實現(xiàn)。以前分子算法,如自復(fù)制自動機(jī)、胞格自動機(jī)、遺傳算法、人工生命等全都是在電子計算機(jī)上實現(xiàn)的,DNA計算機(jī)的出現(xiàn)是分子算法的化學(xué)實現(xiàn)的開端。這種立足于可控的生物化學(xué)反應(yīng)或反應(yīng)系統(tǒng),無疑更加有力地直接地表明了生物現(xiàn)象與過程的計算特征。而這對于現(xiàn)代生物學(xué)的研究自然有著十分積極的影響。正如阿得勒曼所說:DNA計算機(jī)的構(gòu)想,是從另一個角度出發(fā)啟示人們用算法的觀念研究生命?!八惴▽τ谏囊饬x,就在于以過程或程序描述代替對生物的狀態(tài)或結(jié)構(gòu)描述,將生命表示為一種算法的邏輯,把對生命的研究轉(zhuǎn)換成為對算法的研究”[8]。在這個意義上,生命就是程序、就是算法——一種能夠?qū)崿F(xiàn)自我復(fù)制、自我構(gòu)造和自我進(jìn)化的算法。在尼葛洛龐帝的《數(shù)字化生存》中,有一個已是眾所周知的主題論斷:計算不再只和計算機(jī)有關(guān),它決定我們的生存。但是,尼葛洛龐帝僅是從社會生活的意義上說這番話的。我們在這里則要賦予它另一種新的含義——生理生存,即計算決定我們的肉體的生存。
生物學(xué)界這種算法觀念的廣泛運用,更增強(qiáng)了人們運用算法觀念看待整個自然界的信心,拓展了人們對自然現(xiàn)象的理解。要知道生命是最復(fù)雜的自然現(xiàn)象之一,是自然界進(jìn)化的最高代表。因此,我們完全有理由猜想:整個宇宙也是按算法構(gòu)成的,是按算法演化的。現(xiàn)實世界之萬事萬物只不過是算法的復(fù)雜程度的多樣性。從虛無到存在、從非生命到生命、從感覺到意識,或許整個世界的進(jìn)化過程就是一個計算復(fù)雜性不斷增長的過程。看來畢達(dá)哥拉斯或許真是對的:萬物皆數(shù)!應(yīng)該說,這便是DNA計算機(jī)所蘊涵的最深奧的哲學(xué)理念:數(shù)學(xué)可能是萬物的基礎(chǔ),數(shù)學(xué)可能是現(xiàn)實世界和可能世界的核心。今天,我們或許應(yīng)該將畢達(dá)哥拉斯的哲學(xué)再向前推進(jìn)一步:存在的意識就是數(shù)學(xué)意識。因為DNA計算宣稱數(shù)學(xué)處于生命的核心。
參考文獻(xiàn)
[1]L M Adleman. Molecular Computation of Solutions to Combinatorial Problems [J].Science, 1994.266. Science, 1994. 266.
[2]M Linial. On the Potential of Molecular Computing [J]. Science, 1995.268.
[3]鄧少平,等.DNA計算的一些基本問題[J].科學(xué)(中文版),1996(5).
[4]Barry Cipra.Computer Science discovers DNA[J].What's Happening in the Mathematical Science.AMS,1996(3).
關(guān)鍵詞:人工生命;人工智能;人造生命;物理主義
中圖分類號:N031 文獻(xiàn)標(biāo)識碼:A 文章編號:16711165(2011)02002104
一般認(rèn)為,“人工生命”、“人工智能”和“人造生命”是三個分別從計算機(jī)科學(xué)領(lǐng)域、智能研究和基因工程領(lǐng)域提出的概念。20世紀(jì)90年代未,中科院曾邦哲提出人工生物系統(tǒng)(artificial biosystem)的工程生物系統(tǒng)概念,用以整合計算機(jī)領(lǐng)域和遺傳工程領(lǐng)域的兩個概念。概念上的整合一方面體現(xiàn)了“人工生命”與“人造生命”兩者之間的承接性,另一方面也預(yù)示著“人工生命”發(fā)展與生物學(xué)理論發(fā)展之間的密切關(guān)聯(lián)。誠如“人工生命是具有自然生命現(xiàn)象的人造系統(tǒng)”[1],那么進(jìn)入微觀領(lǐng)域,生命規(guī)律的探索與對生命分子的操作使得“人工生命”具有了反身性。這種反身性恰恰體現(xiàn)了“人工生命”研究并不在于使人“非人化”[2],使生命也成為技術(shù)的對象,而是包含了一定生命認(rèn)識的特殊生命活動。那么,剖析人類基因組計劃的推進(jìn)過程,就可能找到“人工生命”概念演進(jìn)背后內(nèi)在思想動因,從而為洞悉生命科學(xué)發(fā)展趨勢提供一條線索。
一、“人工生命”階段:肯定物理主義
在人體細(xì)胞核內(nèi),質(zhì)量只有0.0000005毫克,寬度僅為0.02微米的DNA包含著大約30億個堿基排列??茖W(xué)家相信人類DNA序列是人類生命的決定因素,人類生命活動中發(fā)生一切事情都與這一序列息息相關(guān)。[3]除了特殊情況之外,DNA中含有的龐大信息能夠被一字不差地復(fù)制,然后傳給后代。要想獲得這些信息,就需要測定DNA序列的堿基序列,這也是人類基因組計劃的核心工作。那么,測序工作則成為“人工生命”的一個階段,對生命信息傳遞過程的模擬也就構(gòu)成了“人工生命”研究的起點。
基于人類全部24條染色體中3×109個堿基具有固定性的化學(xué)關(guān)系即A-T、G-C,于是DNA堿基序列的測定工作實際上可以被描述為科學(xué)家接受生命分子信號的過程。應(yīng)用申農(nóng)所建立的一般信息系統(tǒng)模型,在一定的指令下進(jìn)行信號傳遞成為“人工生命”的最初目標(biāo)。強(qiáng)人工生命觀念將“生命系統(tǒng)的演化作為一個可以從任何特殊媒介物中抽象出來的過程”(John Von Neumann)。以搶占計算機(jī)存儲的方式,生命演化過程被計算機(jī)程序模擬出來。人們相信,如果生命遵循既定的程序,那么只要編寫好程序,生命就能進(jìn)行準(zhǔn)確的信號傳遞,也就實現(xiàn)了“人工生命”。首先試圖為生命編寫程序的是生物學(xué)家林登邁爾。20世紀(jì)60年代中期,林登邁爾為紅海藻、青苔等植物的生長發(fā)育建立模型,提出了一種被稱為“L-系統(tǒng)”的形態(tài)發(fā)生系統(tǒng),又被稱為“繁殖(發(fā)生)算法”。在編寫好的程序下,生命系統(tǒng)轉(zhuǎn)化為信號系統(tǒng)。生命信號模型以量化或模型化的方式來展示生命的屬性。這意味著:“如果具有馮•諾伊曼式的自我復(fù)制能力或繁殖的能力,那么這個實體就是有生命的?!保?]
馮•諾伊曼所證明的自我繁殖的生命信號系統(tǒng)應(yīng)和了人們對微觀生命分子世界的物理主義觀點,其實質(zhì)是將諸如細(xì)胞這樣一個具有新陳代謝功能的生命單元放在既定的關(guān)系下。盡管將生命活動視為一種生命信號傳遞顛覆了傳統(tǒng)的生命物質(zhì)實體論,卻仍然將生命置于某種固定關(guān)系下,意味著其也不可能跳出物理主義的決定論框架。一方面,“人工生命”研究進(jìn)行了生命信號傳遞模,并在計算機(jī)領(lǐng)域中建立虛擬生命系統(tǒng);另一方面,人們在質(zhì)疑申農(nóng)的一般信息模型的同時也開始質(zhì)疑“人工生命”。針對申農(nóng)的一般信息模型,有學(xué)者認(rèn)為:“申農(nóng)通訊信息系統(tǒng)模型具有兩方面的重大缺陷:一是該模型未能注意信息系統(tǒng)的一般反饋性機(jī)制;二是該模型描述的還僅僅是信息接收系統(tǒng)?!保?]可見,申農(nóng)的一般信息模型不具有反饋性機(jī)制或不能夠自創(chuàng)生。于是,這樣一種生命的信息論觀點,即“在生命運動之中物質(zhì)實體-載體是流動的,組織形式-信息才是穩(wěn)定保持的”[6],表明“人工生命”所模擬的對象是在既定關(guān)系之下的生命信號的傳遞過程。
面對人類基因組計劃這樣巨大的基因工程項目,測定了組成人類DNA的約30億個堿基中85%的堿基序列只是完成了所謂工作草圖。獲得的基因草圖只是為給基因命名、分析基因創(chuàng)造了條件,需要進(jìn)一步找到能夠提供信息的標(biāo)記基因,進(jìn)行基因追蹤,但尋找基因的工作卻相當(dāng)復(fù)雜。一般信息模型不可能作為模擬這一活動的基礎(chǔ)。
二、“人工智能”階段:懷疑物理主義
一般認(rèn)為,人類共有5萬~10萬個基因,如果某個基因發(fā)生了變異或者產(chǎn)生缺陷,必然會引起機(jī)能上的障礙。根據(jù)變異的DNA標(biāo)記基因來確定另外一個基因的位置,這樣就可以將其位置制成詳細(xì)的地圖,通過檢查DNA序列來識別基因突變。學(xué)者們以DNA標(biāo)記為基礎(chǔ)的DNA基因圖譜尋找致病基因。在一階段,“人工生命”模擬的對象是尋找基因,而尋找基因的關(guān)鍵則體現(xiàn)為對信息的識別。人類基因組計劃在此階段的工作可以反映“人工智能”的研究。
盡管早在1956年,美國的麥卡錫就提出“人工智能”(artificial intelligence)概念,但直到20世紀(jì)80年代末,人們才將“人工智能”作為“人工生命”的一種形式?!叭斯ぶ悄堋彪A段需要計算機(jī)能夠準(zhǔn)確識別信息。對于智能的研究涉及諸如意識(consciouness)、自我(self)、心靈(mind)、無意識(unconscious mind)等問題。對此,之前將生命作為信號系統(tǒng)的一般信息模型顯然無法發(fā)揮作用。面對信息的識別和反饋機(jī)制等一系列問題,人們試圖將信息學(xué)、控制論、自動化、仿生學(xué)、生物學(xué)、心理學(xué)、數(shù)理邏輯、語言學(xué)、醫(yī)學(xué)和哲學(xué)各學(xué)科整合,并在計算機(jī)領(lǐng)域?qū)嵺`,甚至在機(jī)器人、經(jīng)濟(jì)政治決策、控制系統(tǒng)、仿真系統(tǒng)中應(yīng)用。然而,這種學(xué)科上的整合并沒有使人們找到合適的模型來取代之前的信號模型用以描述識別信息過程所具有的非線性特征。
對此,一部分學(xué)者試圖通過重新定義“人工智能”概念,區(qū)分出強(qiáng)“人工智能”和弱“人工智能”的方式來解決問題。弱“人工智能”用模擬識別信息后所表現(xiàn)出的行為來反推對信息的識別,也就是讓機(jī)器的行為看起來就像是人所表現(xiàn)出的智能行為一樣。而強(qiáng)“人工智能”則將識別信息的功能強(qiáng)加于計算機(jī),如約翰•羅杰斯•希爾勒(John Rogers Searle)就計算機(jī)和其他信息處理機(jī)器的工作形式提出“計算機(jī)不僅是用來研究人的思維的一種工具;相反,只要運行適當(dāng)?shù)某绦?,計算機(jī)本身就是有思維的”[7]。無論是強(qiáng)“人工智能”還是弱“人工智能”,都將“人工智能”劃分為四類:機(jī)器“像人一樣思考”、 “像人一樣行動”、“理性地思考”和“理性地行動”。但是,這兩種觀點都沒有進(jìn)一步對任何一種類型進(jìn)行模型化。這就表明盡管在觀念上人們已經(jīng)不再將生命系統(tǒng)作為信號系統(tǒng),但其仍成為“人工生命”模擬的對象。
1999年,獲得了諾貝爾生理學(xué)或醫(yī)學(xué)獎的布洛貝爾創(chuàng)立了著名的“蛋白質(zhì)的命運”假說,即關(guān)于新生成的蛋白質(zhì)去向的“信號假說”。他認(rèn)為細(xì)胞內(nèi)存在某種信號,這種信號決定了新生成的蛋白質(zhì)的去向。這意味著每個蛋白質(zhì)都能夠獲得向某個地方移動的信息,就像郵編一樣,可以讓蛋白質(zhì)找到準(zhǔn)確位置。也就是說,由十幾個氨基酸組成的“信號肽”使得蛋白質(zhì)能夠識別信息,并在某種程度上具有了主動性。這種主動性與物理主義的決定論觀點發(fā)生了沖突。
弄清各種基因各自會生成何種蛋白質(zhì)成為需找基因的重要環(huán)節(jié),因為如果知道了信號肽的基因,就可以知道周圍的基因是決定何種蛋白質(zhì)的基因。“信號肽”的發(fā)現(xiàn)大大推進(jìn)了人類基因計劃,然而,“人工智能”研究中并沒有明確給出一個可以超越一般信息模型的新模型。
三、“人造生命”階段:突破物理主義
在識別了基因信息之后,就需要對基因突變作出解釋。人們已經(jīng)發(fā)現(xiàn),致命的基因突變由于地域特征和環(huán)境不同,其結(jié)果也會各不相同。這就意味著,人們在對待人類基因時必須考慮環(huán)境的因素:一方面,環(huán)境可能使基因突變形成惡性基因,另一方面則也能促使發(fā)生有益的突變,從而形成更為適應(yīng)環(huán)境的基因整體。從后者來看,環(huán)境如何引發(fā)新基因整體的形成就成為對基因與環(huán)境之間關(guān)系所進(jìn)行的解釋,這也就成為人類基因組計劃的后期工作,此階段的“人工生命”研究也將面臨更為深入的問題。
“對基因整體性的認(rèn)識大體有兩類。一類是在分子遺傳學(xué)堅信基因獨立性存在的前提下,根據(jù)不同功能種類的基因間的協(xié)同關(guān)系詮釋基因系統(tǒng)的整體存在。而今,這一方向已在原核生物領(lǐng)域取得輝煌的成果;另一類是在關(guān)注物種(種群)的發(fā)育和進(jìn)化并結(jié)合分子生物學(xué)的基礎(chǔ)上,探究基因的整體存在,即基因集成、基因組織單元及其關(guān)系的研究。目前,這一方向已受到綜合進(jìn)化論者及其他一些生物學(xué)者的高度重視?!保?]后者恰恰體現(xiàn)了環(huán)境對基因的作用?!叭嗽焐钡奶岢鰟t將這種作用的意義凸顯出來。從其他生命體中提取基因建立新染色體的操作,實際上就是將特定基因從已有的環(huán)境中分離開來,再將提取的基因染色體放入新的環(huán)境之中,即嵌入已經(jīng)被剔除了遺傳密碼的細(xì)胞中,這樣染色體在新環(huán)境中形成新的基因組織,控制這個細(xì)胞,發(fā)育變成新的生命體。2010年5月20日,美國私立科研機(jī)構(gòu)克雷格•文特爾研究所宣布:世界首例人造生命――完全由人造基因控制的單細(xì)胞細(xì)菌誕生,并將“人造生命”起名為“辛西婭”。這項具有里程碑意義的實驗表明:新的生命體可以在實驗室里“被創(chuàng)造”,而不是一定要通過“進(jìn)化”來完成。“辛西婭”的產(chǎn)生在一定意義上證明了可以通過人工環(huán)境能夠?qū)崿F(xiàn)對基因的作用。
“人造生命”為“人工生命”提出了更深層次的問題?!叭斯ど备拍畈煌趥鹘y(tǒng)生命觀和科學(xué)觀?!皞鹘y(tǒng)生物學(xué)用分析方法研究生命。通過分析,解剖現(xiàn)有生命的物種、生物體、器官、細(xì)胞、細(xì)胞器,即通過分析現(xiàn)有生命的最小部件來理解生命。人工生命用綜合方法研究生命,在人工系統(tǒng)中對簡單的零件進(jìn)行組合,使其產(chǎn)生類同生命的行為,力圖在計算機(jī)或其他媒體中合成生命?!保?]“人造生命”則進(jìn)一步模擬生命整體功能如何形成。這也改變了對生命的認(rèn)識,從“如吾所說的生命(lifeasweknowit)”轉(zhuǎn)變?yōu)椤叭缙渌艿纳╨ifeasitcouldbe)”[10]。生命作為各個功能疊加的物理主義觀念被打破,取而代之的是一種功能整體性觀念。
“人造生命”已有的成果在一定程度上揭示了環(huán)境對基因整體功能的作用機(jī)制,如果能夠找到體現(xiàn)這種機(jī)制的模型,就將推動生命科學(xué)的發(fā)展。事實上,人類基因組計劃都是建立在DNA分子序列的符號化前提下的。沒有這種符號操作,人們就不可能應(yīng)用計算機(jī)來獲得、識別并整合生命信息。而這一符號學(xué)思路恰恰應(yīng)和了美國著名的科學(xué)家、認(rèn)知心理學(xué)家、人工智能學(xué)家西蒙(Simon Blackurn)的理論。西蒙的“物理符號系統(tǒng)假設(shè)”進(jìn)一步闡釋了這一思路?!拔锢矸栂到y(tǒng)假設(shè)”強(qiáng)調(diào)“所研究的對象是一個具體的物質(zhì)系統(tǒng),如計算機(jī)的構(gòu)造系統(tǒng)、人的神經(jīng)系統(tǒng)、大腦的神經(jīng)元等。所謂符號就是模式,如任何一個模式,只要它能和其他模式相區(qū)別,他就是一個符號?!保?1]“物理符號系統(tǒng)假設(shè)”從信息論模型進(jìn)入了符號學(xué)模型?!叭斯ど睆膶Α吧憩F(xiàn)出的行為的功能模擬”轉(zhuǎn)向?qū)Α吧鼉?nèi)在創(chuàng)造機(jī)制的功能模擬”。
這種符號學(xué)模型提示,在經(jīng)常變化的環(huán)境作用下,微觀生命分子形成了不同的功能整體,具有內(nèi)在的適應(yīng)性意義。人們在無法支配環(huán)境的情況下支配基因,就可能造成有害的影響。從“人工生命”、“人工智能”到“人造生命”的概念演進(jìn),可以得出承認(rèn)生命本身具有內(nèi)在意義,具有一定的主動性將成為未來生命科學(xué)理論發(fā)展的一種趨勢。
參考文獻(xiàn):
[1]班曉娟.人工智能與人工生命[J].計算機(jī)工程與應(yīng)用,2002(15):1-7.
[2]林德宏.評人的“非人化”――一種現(xiàn)代技術(shù)機(jī)械論[J].自然辯證法研究,1999(3):23-27.
[3]孫嘯,陸祖宏,謝建明.生物信息學(xué)基礎(chǔ)[M].北京:清華大學(xué)出版社,2005:9.
[4]李建會.生命科學(xué)哲學(xué)[M].北京:北京師范大學(xué)出版社,2006:127.
[5]鄔.信息哲學(xué)――理論、體系、方法[M].北京:商務(wù)印書館,2005:75.
[6]沈驪天.生命信息與信息生命觀[J].系統(tǒng)辯證學(xué)學(xué)報,1998(4):71-73.
[7]JOHN R. Minds, brains, and programs[J]. Behavioral and Brain Sciences, 1980, 3 (3): 417-457.
[8]董華,李恒靈.基因整體實在論[J].科學(xué)技術(shù)與辯證法,1997(6):31-34.
[9]林德宏.科學(xué)思想史[M].南京:江蘇科學(xué)技術(shù)出版社,2004:326.
關(guān)鍵詞:自然計算;自然辯證法;一元論;物質(zhì)智能
一、引言
自然計算(Nature Inspired Computation)具有模仿自然界的特點,通常是一類具有自適應(yīng)、自組織、自學(xué)習(xí)能力的模型與算法,能夠解決傳統(tǒng)計算方法難于解決的各種復(fù)雜問題。自然計算的應(yīng)用領(lǐng)域包括復(fù)雜優(yōu)化問題求解、智能控制、模式識別、網(wǎng)絡(luò)安全、硬件設(shè)計、社會經(jīng)濟(jì)、生態(tài)環(huán)境等各個方面[1,2]。在哲學(xué)領(lǐng)域也被有些自學(xué)科學(xué)家稱為“人工生命”[3]。目前在哲學(xué)研究領(lǐng)域有提法為“計算主義”,認(rèn)為“宇宙是一個巨大的計算系統(tǒng)”,自然界的運行規(guī)律即“計算”[4]。本文對自然計算的形成、發(fā)展和本質(zhì)規(guī)律進(jìn)行分析,指出其中所包含的自然辯證法思想。
二、自然計算的發(fā)展規(guī)律
計算方法從經(jīng)典算法到自然計算的發(fā)展過程,是人類對事物的本質(zhì)認(rèn)識過程。人類早期在生產(chǎn)生活中,為了合理利用資源,提高生產(chǎn)效率,降低成本,想出了用最少的代價換取最高的效率的方法,即優(yōu)化計算。通常把研究最優(yōu)(或近優(yōu))解及其求解方法的學(xué)科稱為優(yōu)化計算。它是一種以數(shù)學(xué)為基礎(chǔ),用于求解各種工程問題優(yōu)化解的應(yīng)用技術(shù)?,F(xiàn)代優(yōu)化算法的主要應(yīng)用對象是優(yōu)化問題中的難解問題,也就是優(yōu)化理論中的NP-hard問題[5]。
優(yōu)化計算的理論和方法的形成分為三個階段:古典極值理論、近代數(shù)值優(yōu)化理論、自然計算?;跀?shù)學(xué)演繹和推理的微分法和變分法是早期古典極值理論的代表性方法,其中比較著名的有柯西(Cauchy)最速下降法、拉格朗日(Lagrangian)數(shù)乘法。隨著社會生產(chǎn)力的發(fā)展,在本世紀(jì)40年代,針對運輸和生產(chǎn)問題的線性規(guī)劃求解方法被蘇聯(lián)科學(xué)家康托洛維奇提出,而且隨后由于電子計算機(jī)的發(fā)明和飛速發(fā)展,基于計算機(jī)的近代數(shù)值優(yōu)化方法占據(jù)了優(yōu)化計算的主導(dǎo)地位。牛頓法、單純形法、共軛梯度、變尺度法和模式搜索法等一系列有代表性的數(shù)值計算方法相繼涌現(xiàn)并不斷完善,使得優(yōu)化理論形成為一門獨立和完整的學(xué)科分支[6]。盡管在近代已經(jīng)有大量的數(shù)值優(yōu)化算法,但是這些理論和方法都是基于嚴(yán)格的數(shù)學(xué)模型,當(dāng)模型中變量維數(shù)增高、約束方程較多且非線性較強(qiáng),或者模型無法用現(xiàn)實的方程來描述時,這些數(shù)值優(yōu)化算法都出現(xiàn)如下問題:不能進(jìn)行有效求解;求解時間復(fù)雜度過高、求解精度較低(如陷入局部最優(yōu)、解不穩(wěn)定等)。而且由于問題的增加,形成了NP-hard理論,目前已經(jīng)證明了傳統(tǒng)的優(yōu)化算法無法處理NP-hard問題。
進(jìn)入80年代以來,生命科學(xué)與工程科學(xué)相互交叉、相互滲透和相互促進(jìn),優(yōu)化技術(shù)和理論中神經(jīng)網(wǎng)絡(luò)、進(jìn)化計算和群體智能計算等新興算法相繼出現(xiàn)和不斷完善,形成了適應(yīng)處理復(fù)雜問題并能夠在非確定性、非精確環(huán)境中進(jìn)行概率推理和學(xué)習(xí)的現(xiàn)代優(yōu)化方法——自然計算[1,2]。自然計算從提出就受到各個領(lǐng)域?qū)<覍W(xué)者的廣泛關(guān)注,成為眾多學(xué)科及其相互的交叉學(xué)科的研究熱點。近年來,自然計算與生物學(xué)原理、腦神經(jīng)科學(xué)等學(xué)科研究相互融合,在實際研究和應(yīng)用中發(fā)現(xiàn),它們之間的相互補(bǔ)充可以有效地表示和解決實際問題。隨著近十年來智能計算理論的發(fā)展與豐富,智能計算的應(yīng)用領(lǐng)域日漸寬廣,在生物醫(yī)學(xué)、工業(yè)控制、經(jīng)濟(jì)管理、數(shù)據(jù)挖掘、模式識別、網(wǎng)絡(luò)智能控制等眾多領(lǐng)域都取得了令人矚目的研究成果和應(yīng)用。
三、自然計算與一元論
早期人類算法是基于純粹的數(shù)學(xué)理論演繹和推理的微分法和變分法,這些方法從本質(zhì)上來說是人類對一部分自然規(guī)律的提取和抽象,是對自然界的不完全認(rèn)識。隨著生產(chǎn)力的提高和生產(chǎn)規(guī)模的擴(kuò)大,人類遇到更多更復(fù)雜的問題,盡管這時候已經(jīng)從最初的極值理論發(fā)展為數(shù)值算法理論,但是對于NP-hard這類問題人類還是束手無策。一部分科學(xué)家想到的是模仿人腦的思維方式去解決問題,即人工神經(jīng)網(wǎng)絡(luò)算法。最初的想法是認(rèn)為如果研究清楚了大腦思考問題和解決問題的方式,構(gòu)造出類似大腦的計算機(jī)神經(jīng)系統(tǒng),就可以讓神經(jīng)網(wǎng)絡(luò)解決所有問題。其中有代表性的有兩種神經(jīng)網(wǎng)絡(luò)構(gòu)造方法,第一種是采用自上而下的方式,首先抽取大腦的思考問題的規(guī)則和方式,但由于人類還沒有搞清楚大腦生理結(jié)構(gòu)上的諸多奧秘,對人腦思考解決問題的規(guī)則更不可能完全獲取,所以研究出來的神經(jīng)網(wǎng)絡(luò)有很多缺陷,造成對很多問題無法解決;第二種是采用自下而上的方式,模仿人類智能的產(chǎn)生過程。人類獲取智能是從嬰兒時期的遺傳反應(yīng)式智能,到通過學(xué)習(xí)、記憶獲取知識,通過推理產(chǎn)生新智能[7]。這種方式較前一種方式更加接近人類智能的產(chǎn)生過程,但由于對人類智能產(chǎn)生過程的探索還不完全,這種方式構(gòu)造的神經(jīng)網(wǎng)絡(luò),也只能部分解決問題。
在智能計算被提出之前,生命科學(xué)家和計算機(jī)科學(xué)家通過探索,發(fā)現(xiàn)不只有人腦解決問題的方式具有智能,很多自然界的生物解決問題都具有智能。如群體智能算法,是從一些群體生物協(xié)作解決問題得到啟發(fā)而形成。典型的例子如蜜蜂群體可以蓋出規(guī)則的蜂巢,而且蜂巢的形狀、大小以及其他特征都非常規(guī)則,似乎是預(yù)先計算好而用機(jī)械方式產(chǎn)生的[8]。同時期科學(xué)發(fā)發(fā)現(xiàn)生物的免疫系統(tǒng)也具有智能,在病毒入侵后,會產(chǎn)生免疫反應(yīng),產(chǎn)生具有記憶能力的抗體。當(dāng)下次相同的病毒入侵后,能夠迅速產(chǎn)生免疫反應(yīng),清除病毒。此外,免疫系統(tǒng)還能夠分辨哪些組織細(xì)胞屬于自身,哪些組織細(xì)胞被感染或者變異,并自動進(jìn)行清除。結(jié)合這種方式,科學(xué)家發(fā)明了人工免疫算法[9]。隨著越來越多的自然界物質(zhì)(有機(jī)物和無機(jī)物都具有智能行為)的智能行為被發(fā)現(xiàn),人類認(rèn)識到以前的各種算法都只是自然界運行規(guī)律的部分體現(xiàn),人類想要解決所有的NP-hard問題或者解決所有的計算優(yōu)化問題,必須要認(rèn)識到自然界運行規(guī)律的本質(zhì),自然界運行規(guī)律包含著解決所有問題的機(jī)制,于是將諸如神經(jīng)網(wǎng)絡(luò)計算、人工免疫計算、蟻群計算、人工魚群計算、DNA計算等諸多智能計算都?xì)w結(jié)到自然計算。目前哲學(xué)家、生命科學(xué)家和計算機(jī)科學(xué)家都致力于研究自然界運行規(guī)律,獲取自然界運行的本質(zhì),以便解決所有問題。
從自然計算的發(fā)展過程來看,人類提出諸多的算法,如經(jīng)典的極值理論算法、數(shù)值理論算法,這些算法最后都被證明是自然界運行規(guī)律的部分體現(xiàn),為了解決所有的計算問題,必須要用自然計算去解決。算法統(tǒng)一于自然計算,這正是辯證唯物論中一元論的體現(xiàn)。