前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺研究的目的主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:雙目視覺;匹配算法;計算機視覺;立體匹配;相位一致性
1.計算機視覺系統(tǒng)分析研究
1.1計算機視覺技術(shù)及雙目立體視覺
計算機視覺是通過計算機技術(shù)實現(xiàn)對視覺信息處理的整個過程,是一門新的學(xué)科。視覺是人們認知事物的重要途徑,視覺是人們對視覺信息獲取、處理和存儲的過程。隨著計算機技術(shù)的發(fā)展,信號處理技術(shù)的應(yīng)用,人們通過照相機來把實際的事物拍攝下來轉(zhuǎn)變?yōu)閿?shù)字信息,并通過計算機信號處理技術(shù)隊獲取的視覺信號進行處理。計算機視覺技術(shù)對圖像的處理分為獲取圖像、特征抽象選取、事物識別及分類和對三維信息的理解。獲取圖像主要是通過攝像機和紅外線等技術(shù)對周圍視覺事物進行獲取,并通過計算得到和真實事物相應(yīng)的二維圖像,二維圖像主要是數(shù)字圖像。計算機視覺系統(tǒng)的最基本的功能是數(shù)字圖像的獲取。可以看出計算機視覺研究最基本內(nèi)容是三維場景距離信息的獲取。在計算機被動測量距離方法中,有一種重要的距離感知技術(shù)叫作雙目立體視覺。雙目立體視覺技術(shù)是其他計算機視覺技術(shù)無法取代的一種技術(shù),對雙目立體視覺技術(shù)的研究在計算機視覺技術(shù)和工程應(yīng)用方面都是非常重要的。
1.2計算機視覺理論框架
第一個視覺系統(tǒng)理論框架的提出是以信息處理為基礎(chǔ),綜合了圖像處理和神經(jīng)生理學(xué)等研究內(nèi)容而建立的。這個視覺系統(tǒng)理論框架是計算機視覺系統(tǒng)的基本框架,與計算機視覺技術(shù)有著密切的關(guān)系。視覺系統(tǒng)的研究是以信息處理為基礎(chǔ)的,從理論層次、算法層次和硬件層次3個層次進行研究。計算機理論層次主要是表達系統(tǒng)各個部分計算的目的和方法,對視覺系統(tǒng)的輸入和輸出進行規(guī)定,輸入作為二維圖像,輸出是以二維圖像為基礎(chǔ)建立起來的三維物體,視覺系統(tǒng)的目的就是對三維物體進行分析和識別,通過計算對二維物置和形狀進行重新建立。算法層次對計算機規(guī)定的目標進行計算,算法和計算機表達有關(guān),不同的表達可以通過不同的算法進行實現(xiàn),在計算機理論的層次上,算法和表達比計算機理論的層次要低。硬件層次是通過硬件來實現(xiàn)算法的一種表達方法。計算機理論層次在計算機信息處理中時最高的層次,取決于計算機的本質(zhì)是解決計算機的自身問題,不是取決于計算問題的計算機硬件。要更好地對計算機系統(tǒng)和框架進行理解最好的方法就是要區(qū)分3個不同的層次,計算機理論的含義和主要解決的問題是計算機的目的,表達算法含義和主要解決的問題是實現(xiàn)計算理論的方法和輸入輸出的表達,硬件的實現(xiàn)的含義和主要解決的問題是如何在物理上對表達和算法進行實現(xiàn)。計算機視覺處理的可以分為3個階段,對視覺信息的處理過程從最初的二維圖像的原始數(shù)據(jù),到三維環(huán)境的表達。第一階段基元圖的構(gòu)成,基元圖是用來表示二維圖像中的重要信息,主要是圖像中亮度變化位置及其幾何分布和組織結(jié)構(gòu),圖像中每點的亮度值包括零交叉、斑點、端點和不連續(xù)點、邊緣等。第二階段2.5維圖描述,在以觀測者為中心的坐標中,表示可見表面的方向、深度值和不連續(xù)的輪廓,基元是局部表面朝向離觀測者的距離深度上的不連續(xù)點表面朝向的不連續(xù)點。第三階段三維模型表示,在以物體為中心的坐標系中,有由體積單元和面積單元構(gòu)成的模塊化多層次表示,描述形狀及其空間組織形式,分層次組成若干三維模型,每個三維模型都是在幾個軸線空間的基礎(chǔ)上構(gòu)成的,所有體積單元或面積形狀基元都附著在軸線上。視覺理論框架圖如圖1所示。
2.基于計算機的視覺立體匹配算法研究
視覺立體匹配算法是基于人類視覺系統(tǒng)的一種計算機算法。立體匹配算法作為計算機立體視覺問題研究的重點,快速地實現(xiàn)圖像對應(yīng)點的匹配來獲得視差圖是當(dāng)今研究的熱點問題。立體視覺匹配算法根據(jù)基元匹配的不同可以分為相位匹配、區(qū)域匹配和特征匹配3種,其中區(qū)域匹配算法可以減少計算負擔(dān),區(qū)域匹配算法實時性高,應(yīng)用前景廣闊。計算機立體視覺通過對人的雙眼進行模仿,在雙眼的立體感知中獲得信息,從攝像機拍攝的圖像中獲取物體的三維深度信息,這就是深度圖的獲取,把深度圖經(jīng)過處理得到三維空間信息數(shù)據(jù),二維圖像到三維空間實現(xiàn)轉(zhuǎn)換。深度的獲取在雙目立體成像視覺系統(tǒng)中分為兩步,首先在雙目立體圖像與圖像之間建立點對點的對象關(guān)系,雙目立體視覺算法研究的重點問題是解決對應(yīng)點之間的匹配問題。其次以對應(yīng)點之間的視差為依據(jù)對深度值進行計算。雙目成像是獲取同一場景中兩幅不同的圖像,兩個單目成像模型構(gòu)成一個雙目成像模型。雙目成像示意圖如圖2所示。系統(tǒng)的基線B是兩個鏡頭中心的連接線,空間點w(z,y,z)作為世界坐標的值由(x1,y1)與(x2,y2)進行確定,如果攝像機的坐標位置和空間點w世界坐標的位置重合,圖像平面和世界坐標軸xY的平面就是平行的。如果兩個攝像機在坐標系統(tǒng)中的原點不同但是它們的光軸平行,那么雙目成像計算人們可以看圖3所示,圖3表示的是兩個攝像頭連線在平臺xY的示意。
立體視覺的成像過程是成像的逆過程,具有一定的不確定性。大量的數(shù)據(jù)信息在從三維影像向二維圖像進行投影的過程會出現(xiàn)丟失的現(xiàn)象,所以視覺系統(tǒng)要通過自然的約束條件才能保證獲取正確的解。這些約束條件在減少匹配的計算量方面可以提供有利的幫助。針對基于區(qū)域匹配快速算法,還可以應(yīng)用基于視差梯度的匹配算法,這種匹配算法應(yīng)用較大的搜索范圍在邊緣的特征點上進行搜索,采用視差梯度在非邊緣區(qū)減少搜索范圍。應(yīng)用計算機視覺立體匹配算法可以減少成像匹配時間,大大提高了工作效率。計算機立體匹配算法征點的提取是算法的關(guān)鍵問題,今后的研究方向重點是對有效特征點提取方法的研究。
關(guān)鍵詞: 計算機視覺;快速開發(fā);框架;模塊化;模塊耦合;底層剝離
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)29-7084-04
在視覺分析實際應(yīng)用項目中,如何通過建立計算機視覺分析快速開發(fā)框架,搭建一個分工明確,快捷有效的圖像學(xué)應(yīng)用處理平臺,提高開發(fā)效率,縮短開發(fā)時間,已成為項目開發(fā)人員關(guān)注的重點內(nèi)容之一。本框架從項目應(yīng)用和實際需求出發(fā),將計算機視覺技術(shù)的核心算法從底層研究工作中剝離,可極大的縮短開發(fā)時間,提高開發(fā)效率。
在本框架下,開發(fā)人員可各司其職,分工、構(gòu)成和職能劃分明確,框架開發(fā)人員只專注于框架接口的定義;算法開發(fā)人員只專注于圖像處理與識別等算法的開發(fā);上層應(yīng)用開發(fā)人員只負責(zé)抽取出一般的處理流程,專注于項目的具體實現(xiàn)和功能模塊的組合應(yīng)用。
1 研究與應(yīng)用
1.1背景
計算機視覺是用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量的機器視覺。系統(tǒng)將獲取的視頻或圖像資料,通過計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像,其中包括圖像處理、模式識別或圖像識別、景物分析、圖像理解等相關(guān)內(nèi)容,它們之間既有差別,又有相互重疊。
在計算機視覺分析技術(shù)中,對于一些復(fù)雜的問題,往往不是某單一學(xué)科能夠解決的,它需要一系列相關(guān)技術(shù)的支持。例如:對航道中船舶的識別,獲取的視頻流往往要經(jīng)過平滑、去噪等圖像處理操作后,便于下一步運用基于直方圖分類器的圖像識別算法來區(qū)分船舶和水面,通過圖像分割技術(shù)來提取檢測目標。而這些方案的實現(xiàn)中,同一個問題的解決又往往需要有一系列的算法來支持。還是以船舶識別為例,圖像平滑有領(lǐng)域平均、低通濾波等算法;圖像去噪有各種濾波器算法;基于直方圖的分類器也存在決策樹、貝葉斯、SVM等等算法。雖然上述的算法本身沒有優(yōu)劣之分,但在特定的環(huán)境下一定會有某個最佳算法。
因此,在實際應(yīng)用項目中如何找出其最優(yōu)路徑,除了需要開發(fā)者擁有深厚的圖像學(xué)功底,更需要的是通過大量的對比實驗來找出該最優(yōu)路徑的解決方案。即便如此,也只能解決特定環(huán)境下的計算機視覺需求,換個應(yīng)用場景,上述步驟又需要重新進行,此類過程的重復(fù),既增加了開發(fā)成本,又延長了開發(fā)時間。
本框架從工程化的角度出發(fā),在不同項目中的計算機視覺軟件開發(fā)中,研究如何提高開發(fā)結(jié)果的復(fù)用性,盡量降低上述各條件間的相互依賴關(guān)系,將視覺技術(shù)的核心算法從底層研究中剝離,達到縮短開發(fā)時間,提高開發(fā)效率的目的。
1.2研究目標
1) 框架系統(tǒng)的扁平化、模塊化;
2) 完成處理過程的任意組合,使圖像處理模塊單一化;
3) 理行為在處理模塊內(nèi)部完成,處理結(jié)果可通過接口方式進行輸出;
4) 處理模塊間的數(shù)據(jù)流動定義在框架之中,框架負責(zé)配置數(shù)據(jù)流;
5) 置好的數(shù)據(jù)流,通過指定圖像處理模塊實現(xiàn)對物體的識別、行為的識別。
1.3.5框架的效果演示
從右側(cè)功能區(qū)中選取兩個輸入模塊:MediaOpen00和MediaOpen01,分別打開視頻文件“.\公司監(jiān)控視頻.avi”和圖片“.\Lena.jpg”,任意添加一些圖像處理模塊或者圖像識別模塊,這里我們選取了行人檢測算法、基本全局閾值二值算法、人臉檢測算法、輪廓檢測算法,加入輸出展示模塊用于顯示處理結(jié)果。最后我們用曲線將模塊間的輸入輸出點連起來,完成數(shù)據(jù)流向的配置過程。其中一個輸出點可以連接多個輸入點,但一個輸入點只能接入一個輸出點。
2 結(jié)論
隨著計算機視覺技術(shù)發(fā)展的日新月異,算法的更新和積累將會越來越多。計算機視覺快速開發(fā)框架從實際應(yīng)用工程的角度出發(fā),在不同項目計算機視覺軟件的開發(fā)過程中,將視覺技術(shù)的核心算法從底層研究中剝離,使視覺分析應(yīng)用項目中的框架開發(fā)人員專注于框架接口定義的開發(fā),而項目中的算法、上層應(yīng)用等開發(fā)人員各司其職,分工明確,不但提高了開發(fā)結(jié)果的復(fù)用性,同時,也降低了項目開發(fā)中各條件間的相互依賴關(guān)系,縮短了開發(fā)時間,提高了開發(fā)效率。
參考文獻:
[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.
[2] 張廣軍.機器視覺[M].北京:科學(xué)出版社,2005.
[3] 張少輝,沈曉蓉,范耀祖.一種基于圖像特征點提取及匹配的方法[J].北京航空航天大學(xué)學(xué)報,2008,34(5).
[4] 劉立,彭復(fù)員,趙坤,萬亞平.采用簡化SIFT算法實現(xiàn)快速圖像匹配[J].紅外與激光工程,2008,37(1).
[5] 戴斌,方宇強,孫振平,王亮.基于光流技術(shù)的運動目標檢測和跟蹤方法研究[D].國防科學(xué)技術(shù)大學(xué)機電工程與自動化學(xué)院.
[6] 陳勝勇,劉盛.基于OpenCV的計算機視覺技術(shù)實現(xiàn)[M].科學(xué)出版社.
關(guān)鍵詞:計算機視覺;案例推理;圖像處理;圖像描述
中圖分類號:TP391.41 文獻標識碼:A文章編號:1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項重要推理技術(shù)?;诎咐评砼c類比推理方法相似,案例推理將舊經(jīng)驗或教訓(xùn)轉(zhuǎn)換為知識,出現(xiàn)新問題時,首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經(jīng)過推理后解決新問題的方法,又會成為新的案例或新經(jīng)驗,下一次再遇到相同問題時,就可以復(fù)用這些案例或經(jīng)驗。
這與人遇到問題時,首先會用經(jīng)驗思考解決問題的方式相似,這也是解決問題較好的方法?;诎咐评響?yīng)用于工業(yè)產(chǎn)品檢測或故障診斷時具有以下特點:
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識,以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識獲取”的瓶頸。CBR知識表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡化知識獲取的過。
CBR求解效率較高。是對過去的求解結(jié)果進行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對新問題的求解效率。
CBR求解的質(zhì)量較高。CBR以過去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時該怎樣走向成功或避開失敗。
CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來問題的解決。
所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測和設(shè)備故障診斷方面,并取得較好的經(jīng)濟效益。為了產(chǎn)品檢測和設(shè)備故障診斷中,更為智能化,更容易實現(xiàn)現(xiàn)場檢測和診斷,計算機視覺技術(shù)起到很大的作用。
計算機視覺是研究用計算機來模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計算機具有感知周圍視覺世界的能力。通過計算機視覺,進行圖像的獲取預(yù)處理、圖像分割與特征抽取、識別與分類、三維信息理解、景物描述、圖像解釋,讓計算機具有對周圍世界的空間物體進行傳感、抽象、判斷的能力,從而達到識別、理解的目的。
計算機視覺隨著科學(xué)技術(shù)發(fā)展,特別計算機技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計算機視覺理論的不斷發(fā)展和日趨成熟,使計算機視覺從上世紀60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運動,由二維轉(zhuǎn)向三維,并主要著眼于對圖像的識別和理解上,也使計算機視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運用計算機視覺打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計算機中組織存儲。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲器中,這關(guān)系到基于案例推理方法的效率,而且對于案例數(shù)量越來越多,結(jié)構(gòu)十分復(fù)雜的案例庫,尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復(fù)用和調(diào)整
案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應(yīng)用于新問題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。
(4)案例的學(xué)習(xí)
案例的學(xué)習(xí)即是將新解添加到案例庫中,擴充案例庫的案例種類與數(shù)量,這過程也是知識獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機集成到案例庫中,包括如何存儲,如何建立索引等等。
針對案例推理的關(guān)鍵技術(shù),根據(jù)檢測和故障診斷系統(tǒng)的特點,計算機視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進行案例建模,確立案例的表示形成和案例相似度的計算。本文主要從計算機視覺如何運用在案例推理系統(tǒng)進行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進行圖像采集,是否繼續(xù)下一個產(chǎn)品圖像的采集。這簡單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過時,產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個0值,而沒有產(chǎn)品經(jīng)過時,光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡單地說是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測件上,CCD相機拍攝,拍攝圖像經(jīng)過圖像采集卡數(shù)字化后輸入存儲設(shè)備。存儲設(shè)備即為計算機硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對案例的組織和案例建模,案例的組織即案例的表示,相對計算機而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時,又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點,確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對產(chǎn)品輸入的原始圖像進行處理。
在計算機視覺技術(shù)中,對原始圖像主要進行圖像增強、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。具體工作流程如圖2所示:
圖2 計算機視覺的任務(wù)與工作流程
圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計算機后,首先要進行圖像的預(yù)處理,主要完成對圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來分割目標和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號表達形式,使計算機能夠理解對象的具體含義,檢測出邊緣的圖像就可以進行特征提取和形狀分析了。可采用多種算法,如采用Sobel算子提取邊緣。
圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測診斷的效率。
特征提取是對圖像進行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進行描述,形成計算機中屬性值,并從數(shù)據(jù)庫查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對話系統(tǒng):完成人機交互、問題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫系統(tǒng):由案例庫及案例庫管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對各種已有的源數(shù)據(jù)庫的數(shù)據(jù)通過轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫協(xié)同器:根據(jù)問題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問題求解過程中對模型庫系統(tǒng)、方法庫系統(tǒng)、知識庫系統(tǒng)和數(shù)據(jù)庫系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識庫系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識包括專家經(jīng)驗和以規(guī)則形式表示的有關(guān)知識,也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫系統(tǒng):由模型庫、算法庫、模型庫管理系統(tǒng)組成。完成模型識別和調(diào)用,并把結(jié)果綜合,送入對話系統(tǒng)顯示,作為補充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫系統(tǒng):存放待決策支持的所有問題,并完成其維護與查詢等功能。
由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場實時檢測監(jiān)控或故障診斷,所以系統(tǒng)的檢索時,也必須輸入檢索值,即輸入現(xiàn)場產(chǎn)品的圖像,在通過產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進行圖像特征描述,根據(jù)圖像描述進行分類識別。根據(jù)案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進行決策。如產(chǎn)品質(zhì)量檢測,確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計算機視覺技術(shù)中圖像檢索問題。對提高圖像檢索的效率和準確度提供了平臺。
計算機視覺技術(shù)也為案例推理系統(tǒng)實現(xiàn)產(chǎn)品現(xiàn)場實時檢測、監(jiān)控、診斷提供技術(shù)支持。計算機視覺技術(shù)現(xiàn)場的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設(shè)計的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進行質(zhì)量檢測、監(jiān)控,或設(shè)備需要進行故障診斷和維護,都可以適用。
系統(tǒng)提供的實時檢測、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
參考文獻:
[1](美)??希⊿onka,M).圖像處理分析與機器視覺[M].人民郵電出版社.
[2]王宏等譯.計算機視覺[M].電子工業(yè)出版社.
[3]蔡建榮.自然場景下成熟水果的計算機視覺識別[J].農(nóng)業(yè)機械,36(2):61-64.
[4]王宇輝.基于計算機視覺的錐體零件尺寸在線檢測算法[J].重型機械,2005,2:4-6
[5]駱志堅.基于計算機視覺檢測技術(shù)自動計數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫推理中的應(yīng)用[J],南大學(xué)學(xué)報(自然科學(xué)版),1997,18(1):21-26.
[7]姜麗紅.案例推理在智能化預(yù)測支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.
近日,國內(nèi)創(chuàng)業(yè)公司商湯科技宣布獲得4.1億美元B輪融資,這是截至目前為止全球范圍內(nèi)人工智能領(lǐng)域單輪最高融資。至此,這家成立僅三年的公司累計融資額達4.5億美元,估值超過15億美元,成為全球融資額最高的人工智能獨角獸企業(yè)。當(dāng)前,人工智能發(fā)展勢頭良好,技術(shù)和產(chǎn)品研發(fā)能力大幅提升,市場空間逐步拓展,社會關(guān)注與投資力度持續(xù)加大,技術(shù)創(chuàng)新驅(qū)動的人工智能企業(yè)正成為資本青睞的熱點。
一、商湯融資背景分析
人工智能迎來估值猛漲期。自2014年起,人工智能領(lǐng)域一直都是全球投資熱點。近年來,技術(shù)與產(chǎn)品的迅速成長帶動國內(nèi)創(chuàng)業(yè)熱情高q,也引發(fā)了資本的高度關(guān)注。據(jù)統(tǒng)計,截至2017年5月31日,我國人工智能類創(chuàng)業(yè)公司已超過650家,產(chǎn)業(yè)規(guī)模較2016年同期增長達到51.2%,投融資事件超過430起,融資總額達340億元??萍季揞^加大在人工智能領(lǐng)域的布局,投資案例不斷涌現(xiàn)。同時,社會資本競相追逐人工智能領(lǐng)域的優(yōu)質(zhì)項目,整體行業(yè)獲投率偏高,超過一半的人工智能公司成立時間在兩年之內(nèi),可見資本市場對人工智能產(chǎn)業(yè)發(fā)展的信心。
計算機視覺領(lǐng)域成為熱點聚焦。在大數(shù)據(jù)、深度學(xué)習(xí)等新技術(shù)推動下,以計算機視覺和語音識別為代表的感知智能正呈現(xiàn)出高速演進態(tài)勢。目前我國計算機視覺技術(shù)水平已達到全球領(lǐng)先水平,并在安防、汽車、金融等領(lǐng)域取得了顯著的應(yīng)用成效。在安防領(lǐng)域,智能技術(shù)如人臉識別、圖形識別應(yīng)用場景眾多,如車牌識別、車輛視覺特征識別、被動人像卡口、身份證比對等應(yīng)用。在汽車領(lǐng)域,圍繞智能駕駛汽車人工智能在環(huán)境感知、路徑規(guī)劃與決策等關(guān)鍵環(huán)節(jié)均有所應(yīng)用和體現(xiàn),在該領(lǐng)域百度、樂視等企業(yè)已開展卓有成效的實踐。廣泛的商業(yè)化渠道和技術(shù)基礎(chǔ)推動計算機視覺成為創(chuàng)投熱門領(lǐng)域,據(jù)數(shù)據(jù)顯示,中國人工智能創(chuàng)業(yè)公司所屬領(lǐng)域分布中,計算機視覺領(lǐng)域擁有最多創(chuàng)業(yè)公司。2016年,人臉識別服務(wù)開發(fā)商曠視科技完成至少1億美元融資,估值超過20億美元,專注圖像識別的圖普科技獲得千萬美元A輪融資。
商湯科技技術(shù)實力領(lǐng)先,發(fā)展?jié)摿薮?。商湯科技主攻人臉識別、視頻監(jiān)控識別算法、增強現(xiàn)實、文字識別、自動駕駛識別算法和醫(yī)療影像識別算法等技術(shù),基礎(chǔ)研究實力強大,高質(zhì)量專利數(shù)量、專業(yè)學(xué)術(shù)數(shù)量均保持全國領(lǐng)先水平。在2015年ImageNet大規(guī)模視覺識別競賽中,商湯科技獲得視頻識別冠軍,次年在該競賽中,商湯科技憑借原創(chuàng)深度神經(jīng)網(wǎng)絡(luò)平臺,獲得3個項目的冠軍。商湯科技主要業(yè)務(wù)范圍是將計算機視覺技術(shù)賦能給安防、金融、機器人、政府大數(shù)據(jù)分析以及虛擬增強現(xiàn)實等行業(yè)。
二、由商湯融資帶來的兩點思考
【關(guān)鍵詞】平面測量技術(shù);鉛球項目;成績測量
0 引言
隨著計算機處理能力的提高和傳感器技術(shù)的發(fā)展,近年來基于視頻圖像處理的計算機視覺技術(shù)已成為圖像處理領(lǐng)域的研究熱點,該技術(shù)在眾多的領(lǐng)域中都有十分廣泛的應(yīng)用[1]。
視覺是人類認識世界、觀察世界的重要手段。人類從外界獲取的信息量約有 75%來自視覺系統(tǒng),這表明視覺信息量十分巨大以及人類對視覺信息有較高的利用率。人類利用視覺的過程可看作是一個從感覺到知覺的復(fù)雜過程,即從感受到的對三維世界的投影圖像到依據(jù)投影圖像去認知三維世界的內(nèi)容和含義[2]。
計算機視覺技術(shù)是指利用計算機實現(xiàn)人的視覺功能,既對客觀世界的三維場景的識別、感知和理解。該技術(shù)包括是仿生學(xué)方法及工程方法,仿生學(xué)方法是模仿人類視覺功能的結(jié)構(gòu)及原理,建立相應(yīng)的處理系統(tǒng),完成類似的工作和功能;工程方法是從分析人類視覺系統(tǒng)著手,并采用任何現(xiàn)有的可行手段實現(xiàn)人類視覺系統(tǒng)的功能[3],該方法的特點是只關(guān)心系統(tǒng)的輸入和輸出。計算機視覺的主要研究目標是建成計算機視覺系統(tǒng),完成各種視覺功能。也就是說,即要能借助各種視覺傳感器(如 CMOS 攝像器件、CCD等)獲取現(xiàn)實世界的圖像,而感知和恢復(fù) 3D 環(huán)境中物體的幾何性質(zhì)、運動情況、姿態(tài)結(jié)構(gòu)、相互位置等,并且要對客觀場景進行識別、解釋、描述、進而做出決斷。目前,計算機視覺技術(shù)在體育運動中也得到了廣泛的應(yīng)用,利用該技術(shù)不僅可以從不同的視角觀察運動員的動作,而且能將運動員速度、加速度、所在位置等數(shù)據(jù)進行量化處理,使體育訓(xùn)練及比賽擺脫依靠傳統(tǒng)經(jīng)驗分析及判別的狀態(tài),從而進入科學(xué)化、數(shù)字化的狀態(tài),而且還可以完成競技體育項目的成績測試[4-5]。
在測試項目中鉛球成績的測量仍采用皮尺丈量法。這種方法存在著三個方面的缺陷,一是皮尺本身具有彈性以及易折疊特性,二是受場地的凹凸不平,三是人為因素影響較大。由于這三方面的作用, 故在鉛球成績的測量精確度受到極大的限制。針對這一問題本課題提出了一種基于同視場(鉛球場地)測量地平面坐標的單攝像機模型[6-7]。該模型利用透視投影幾何關(guān)系,對攝像機內(nèi)部參數(shù)進行標定,然后,建立相應(yīng)的網(wǎng)格匹配數(shù)學(xué)模型,通過單目CCD攝像機像面坐標,測量鉛球落點的地平面坐標[8]。成功的解決了鉛球著點測量在雙目視覺交匯組合測量存在的死角影響系統(tǒng)的測量范圍的問題,另外,單目視覺測量系統(tǒng)也避免了雙目視覺系統(tǒng)存在對應(yīng)特征點匹配問題。
1 平面測量原理
圖1 鉛球的2D場景坐標系
鉛球場地是一個扇形區(qū)域(如圖1)。假設(shè)建立一個如圖1的2D場景坐標系,首先要做的事是要確定場地上指定點的真實坐標與采集到的圖片的指定點象素坐標之間的對應(yīng)關(guān)系,即要找到這兩種坐標系之間的轉(zhuǎn)換關(guān)系。而這種轉(zhuǎn)換關(guān)系可以用平面測量的相關(guān)技術(shù)獲得。在計算機視覺中,所謂的平面測量,就是從圖像中獲得2D場景信息。在實際的測量中,我們可以通過在圖像上標定一定數(shù)量的坐標點來確定圖像中場地指定點的象素坐標和真實世界中的指定點的現(xiàn)實坐標之間的單應(yīng)矩陣。
我們獲取一幅2D場景S的圖像I,通過S與I之間的N(N>=4)對對應(yīng)點,就可以確定它們之間的單應(yīng)矩陣H。
令:
H=h■,h■,h■=h■,h■,h■h■,h■,h■h■,h■,h■(1)
在H的九個元素中,有八個獨立比率,即一個單應(yīng)有八個自由度變量,一個常數(shù)1。因此,在H中,往往設(shè)置h■=1。
令(x■,y■)∈I,x■■,y■■∈S為一對對應(yīng)點,i=1,2,…N。由每一對對應(yīng)點,根據(jù)圖像與場景之間的單應(yīng)關(guān)系,我們可以得到兩個線性方程:
其中,h是矩陣H的向量形式,
于是我們可以得到2N個方程,寫成矩陣形式為:
AH=0(3)
其中
因此,要求得8個參數(shù)的單應(yīng)矩陣,至少需要4個對應(yīng)點。在實際的測量中,為了提高精度,每個模板平面上提供的對應(yīng)點數(shù)目都會超過4個。
當(dāng)N>4時,我們可以用奇異值分解法(SVD)[14]求最小二乘解h。
求得單應(yīng)矩陣后,利用公式(2),就可以計算出圖像上指定點對應(yīng)的真實坐標值,從而計算出鉛球投擲的距離。
2 實驗結(jié)果與分析
表1
2.1 實驗結(jié)論(下轉(zhuǎn)第38頁)
(上接第21頁)經(jīng)實際測量的6個標定點(如圖1)的坐標分別為A(700,0)、B(900,0)、C(1100,0)、D(570,407)、E(733,523)、F(895,639) 。為了測試本文提出的測量模型,在反復(fù)測量鉛球投擲實驗中選取了典型的10個測試樣本,其中鉛球落點10個。
2.2 誤差分析
從表1中我們可以看到人工測量值和系統(tǒng)測量值有一定的誤差,分析誤差產(chǎn)生的原因有如下幾種:
1)數(shù)字 CCD 鏡頭的光學(xué)性能引起的誤差,如焦距、畸變和光學(xué)中心誤差等通過攝像機內(nèi)部參數(shù)校正來解決。
2)攝像機的支架及底座一定要有足夠的穩(wěn)定性和剛度,在視頻圖像獲取過程中應(yīng)保證攝像機的相對位置穩(wěn)定不動,由意外情況所造成的誤差在計算中應(yīng)予以剔除。
3)環(huán)境的變化將對測量結(jié)果產(chǎn)生影響,因此測量中要及時修正背景圖像。
4)人工測量本身就會與真實值產(chǎn)生一定的誤差。
3 總結(jié)
本論文首先介紹了課題背景,對單目視覺測量的研究現(xiàn)狀和測量建模在國內(nèi)外的研究現(xiàn)狀進行了分析和歸納,同時分析了視頻圖像處理技術(shù)在體育項目應(yīng)用現(xiàn)狀,將基于單目視頻圖像處理技術(shù)的鉛球成績測量作為切入點,對數(shù)字圖像處理技術(shù)在田徑運動中應(yīng)用的關(guān)鍵技術(shù)進行了研究。結(jié)合鉛球場地的特點,提出一種基于視頻圖像的鉛球測量方法,并通過實際應(yīng)用證明了該方法的可行性。
【參考文獻】
[1]Criminisi A,Reid I,Zisserman A. A plane measuring device[J].Image and VisionComputing,1999,17(8), 625-634.
[2]Lorenzo Bruzzone, Diego Fernàndez Prieto. Automatic Analysis of the Difference Image for Unsupervised Change Detection[J]. IEEE Transactions on Geoscience and Remote Sensing,2000,5,38(3).
[3]L Sajó, Z Ruttkay, A Fazekas. Turk-2, a multi-modal chess player[J]. International Journal of Human-Computer Studies,2011,7,69(7-8):483-495.
[4]Lichtenberg, D.B., Wills, J.G., Maximizing the range of the shot-put[J]. American Journal of Physics,1978,46:546-549.
[5]Maheras, A.V.. The relationship between the angle of release and the velocity of release in the shot-put, and the application of a theoretical model to estimate the optimum angle of release (throwing)[D].University of Kansas., 1995.
[6]Antonio Plaza, Jon Atli Benediktsson, Joseph W. Boardman. Recent advances in techniques for hyperspectral image processing[J]. Remote Sensing of Environment,2009,9,113(1):S110-S112.
多采用是人工測量的方式,在誤差的控制上選擇的是多次測量,反復(fù)操作,再將多次測量的結(jié)果進行加權(quán),最終得到相對準確的測量數(shù)值。這種方法在一定程度上是操作十分復(fù)雜,精度還很難達到設(shè)計要求,所以我們在礦區(qū)土地信息測量工程中引進了GIS技術(shù)這樣的一個概念,下面我們就如何通過GIS技術(shù)進行有效的觀測測量來進行討論。
[關(guān)鍵詞] GIS技術(shù); 精密測量; 構(gòu)造幾何模型; 信號源的接收
地理信息系統(tǒng)(Geographic information system,GIS)是利用計算機及其外部設(shè)備采集、存儲、分析、描述與空間和地理分布有關(guān)的數(shù)據(jù)的空間信息系統(tǒng)。GIS融合計算機圖形和數(shù)據(jù)庫于一體,在一定的地域內(nèi),將地理空間信息和一些與該地域地理信息相關(guān)的屬性信息結(jié)合起來,達到對地理和屬性信息的綜合管理。從外部來看,GSI表現(xiàn)為計算機軟硬件系統(tǒng),而其內(nèi)涵是由計算機程序和地理數(shù)據(jù)組織而成的地理空間信息模型,是一個高度信息化的地理系統(tǒng)。
1)等高線生成及等高線分析:等高線圖是人們傳統(tǒng)上觀測地形的主要手段??梢栽诘雀呔€圖上精確地獲知地形的起伏程度、區(qū)域內(nèi)各部分的高程等等。等高線圖可以從格網(wǎng)數(shù)字地形模型中獲取相關(guān)的資料信息,也可在不規(guī)則三角形格網(wǎng)T(NI)中生成。
2)立體透視圖分析:當(dāng)用戶需要從直觀上觀察地形的概貌時,用繪制透視圖的方法(還可以用色彩)可以更逼真地顯示地形。
3)坡度分析、地表面積計算及挖、填土方體積計算:建立DTM后就可以用之計算坡度、面積和挖、填土方體積,以其作為土地適宜性評價的因子。
一 GIS技術(shù)在信息管理模式中的具體形式
在以往的測量中,選擇的測量方式還是完全采用機械的形式,但是在使用了計算機GIS技術(shù)精密測量后,完成了許多以往技術(shù)所不能達到的任務(wù)。在我們的研究中,計算機GIS技術(shù)測量的原理是通過攝像機將被處理的對象采集進行影像采集,在多個控制點的數(shù)據(jù)采集完成后,系統(tǒng)會自動將這些圖像進行整合,得出相關(guān)的幾何多變參數(shù),再在計算機上以具體的數(shù)據(jù)顯示出來,以供礦區(qū)技術(shù)人員使用參照。
在上面所說的攝像機并不是我們通常意義上生活中使用的攝像機。它是一種可視化較強,表針比較敏感的測試儀??梢詫⒁曈X中的二維形態(tài)通過顯影,記錄在機械的光譜儀上,再將這種的二維圖像做數(shù)學(xué)處理,有二階矩陣轉(zhuǎn)換為三階矩陣,通過播放儀呈現(xiàn)出三維的影像。這時的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對于原始的圖像進行預(yù)處理,不再經(jīng)過有曝光這個程序,將圖像中關(guān)鍵點的坐標在整個內(nèi)部軸面上體現(xiàn)出來,提取數(shù)據(jù)幀數(shù),再運用機器的智能識別系統(tǒng),對控制點的坐標進行數(shù)據(jù)分析,自動生成圖形,這也可以用于精密測量。它的優(yōu)點就是使用上極其的方面,基本只要架立儀器和打開開關(guān),其他的工作機械系統(tǒng)都會自動的完成。使用的困難就是造價極其的高,不適合一般企業(yè)使用。在基于計算機視覺圖像測量中使用上的原理如下:
(1)計算出觀察控制點到計算機視覺圖像測量儀器的有效距離;
(2)得出觀察點到目標控制點之間的三維的運動幾何參數(shù);
(3)推斷出目標控制點在整個平面上的表面特征(大多時候要求形成立體視覺);
(4)還通過觀察可以判斷出目標物體的幾何坐標方位。
在整個計算機GIS技術(shù)精密測量的在礦區(qū)土地信息管理中最關(guān)鍵的元件就是壓力應(yīng)變電阻儀,這也是傳感器的一部分。
所謂的壓力感應(yīng)就是一種新型的傳感器,通過電阻的變化作為一種感應(yīng)值的判斷標準進行計算和采集數(shù)據(jù)。具體的做法是在受力物體上粘貼高靈敏度的感應(yīng)片,通過力的傳遞將物體上受到即時的力傳遞到感應(yīng)片上,以備技術(shù)人員收集。在物體的中心或者是機械的隔斷處,使用丙酮溶液進行擦拭,以保證物體的表面潔凈和貼合度較高。當(dāng)液體充分風(fēng)干的情況下將感應(yīng)片貼在已涂丙酮的物體上(注意感應(yīng)片的正反),再使用導(dǎo)線和感應(yīng)片相互連接,從而形成了一個完整的閉合電路體系,在通電的情況下,在計算機終端上可以顯示出來。以便技術(shù)人員可以在任何時候掌握每個檢測點的施工使用情況,一旦機械設(shè)備發(fā)生異?,F(xiàn)象,就會在計算機圖形中顯示出來。于此同時,它還可以對施工人員所處的具置做到應(yīng)力感應(yīng),人自身的重量傳遞到地面上,結(jié)構(gòu)會出現(xiàn)結(jié)構(gòu)上的略微變化,這個儀器就能第一時間以信號的方式傳送到計算機終端,讓技術(shù)人員掌握相關(guān)施工的情況,并結(jié)合數(shù)據(jù)報告總結(jié)出相關(guān)的可行性分析付諸實踐。
當(dāng)無法觀察到控制點是,計算機GIS技術(shù)測量可以通過接收信號或是相關(guān)的頻率波段來收集數(shù)據(jù),不會因為以往測量的環(huán)境不好,距離太遠,誤差太大的影響。同時在信息管理中通過了加密通道,系統(tǒng)可以將數(shù)據(jù)自動的保存和轉(zhuǎn)換為視圖模式,對于數(shù)據(jù)的審計和運行可以同時進行,這樣就可以很好的保證大地測量中的圖像數(shù)據(jù)安全,利用防護墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進一步改善計算機GIS技術(shù)。
二 計算機GIS與CAD技術(shù)的結(jié)合
在計算機GIS技術(shù)測量中解決了很多以往很難完成的任務(wù),但是在使用過程中還是發(fā)生了很多的問題。尤其在土地信息的選擇中,無法使用高幀數(shù)的圖片顯示,無法將計算機測量的關(guān)鍵技術(shù)的優(yōu)點發(fā)揮出來。在煤礦生產(chǎn)過程中,對于生產(chǎn)效率的提高就要對開采環(huán)境的要求更高。使用繪圖技術(shù)與GIS技術(shù)相互結(jié)合可以將復(fù)雜的地理環(huán)境的具體形狀在電腦當(dāng)中展現(xiàn)出來,用較為直觀的圖形準確的反應(yīng)出來。而且在使用中,可以在計算機中隨時將圖像進行修改,完全可以適應(yīng)復(fù)雜情況下的設(shè)備調(diào)試。在以往傳統(tǒng)的圖像設(shè)計中,技術(shù)人員在圖紙中很難將地理信息進行再次修改,在設(shè)計后期在計算機圖形繪制處理技術(shù)中,對于圖像的調(diào)試使用的范圍很廣,通過虛擬的模擬和現(xiàn)實的結(jié)合來實現(xiàn)煤礦信息的完整,有效的加強了煤礦的信息化管理。
CAD技術(shù)是基于工程圖上的三維建模方式。三維模型是從二維信息中提取的三維模型信息,通過再次分類以后,得到的一系列的相關(guān)處理信息,之后在三維空間建立相應(yīng)的二維信息的三維形狀模型提,使模型本身恢復(fù)點,線,面和拓撲關(guān)系,從而實現(xiàn)形狀重建工程。計算機圖形繪制處理,也可以應(yīng)用于測繪圖紙和關(guān)于地形的建模。土地信息中包含的地貌和自然資源圖,它是國民經(jīng)濟體系的重要組成部分。我們可以畫一個圖,三維地形圖的存儲信息的產(chǎn)生。為預(yù)測和決策水平的使用有重大的意義,也為綜合治理和煤炭資源的研究開發(fā)利用提供科學(xué)依據(jù),這些依據(jù),在軍事上也起著非常重要的作用。在煤礦機械設(shè)備也使用CAD軟件繪制零件圖,利用繪圖軟件在操作更簡單的菜單式設(shè)計,繪制出圖形更準確。
三 GIS技術(shù)測量的關(guān)鍵技術(shù)遇到的困難和使用前景
計算機GIS技術(shù)測量的關(guān)鍵技術(shù)作為一種新興技術(shù)在使用時間上不過十幾年,其使用的程度已經(jīng)無法估算。正是因為它的簡單、使用、精度高以及自動化能力卓越的特點受到了礦區(qū)土地信息管理部門的廣泛青睞。在測量調(diào)控方面的這些可靠性和穩(wěn)定性也是有目共睹的。這項關(guān)鍵技術(shù)中涵蓋的學(xué)科非常的多,涉及到的知識也很全面,一旦出現(xiàn)了機器的故障,在維修上還是一個很大的問題,如何很好的解決計算機視覺圖像技術(shù)的相關(guān)核心問題就是當(dāng)下亟待解決的。通過在一些相關(guān)的技術(shù)之間的相互結(jié)合才能使GIS技術(shù)發(fā)揮的更加完美。
我們都知道,人的眼睛是可以受到自身的控制,想要完成礦區(qū)土地觀測是十分簡單的,但是在計算機GIS技術(shù)中,畢竟是采取攝像機取景的模式,在取得的點位有的時候不是特別的有代表性,很難將這些問題具體化、形象化。達不到我們設(shè)計時的初衷。所以在這些模型的構(gòu)建中和數(shù)據(jù)的轉(zhuǎn)換上必須有嚴格的規(guī)定和要求,切不可盲目的實施測量,每項技術(shù)操作都要按規(guī)程來實施。
四 結(jié)束語
在煤礦土地工程發(fā)展的今天,很多的測量技術(shù)已經(jīng)離不了計算機GIS技術(shù)的輔助,本文中詳細的談到了GIS技術(shù)方面的研究,對于之中可能出現(xiàn)的一些問題也提出了相應(yīng)的解決方案,對于和CAD繪圖技術(shù)相互結(jié)合的使用方式也做出了詳細的介紹。測量工程中使用計算機GIS技術(shù)可以很好的解決和完善測量中遇到的一些問題,但是也暴露出了很多的問題亟需技術(shù)人員不斷去解決完善。
將GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)中使用,也是加強了礦區(qū)建設(shè)的信息化水平??梢灶A(yù)見的是,在未來使用計算機GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)建立的測量模型會得到更多、更好的應(yīng)用。但作為一個長期復(fù)雜的技術(shù)工程,在這個建設(shè)過程中定會有一些困難的出現(xiàn)。希望通過不斷的發(fā)現(xiàn)問題、總結(jié)經(jīng)驗,讓GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)在煤礦的開挖中的作用發(fā)揮的更好。
[參考文獻]
[1] 湯劍,周芳芹,楊繼隆.計算機視覺圖像系統(tǒng)的技術(shù)改造[J].機電產(chǎn)品開發(fā)與創(chuàng)新周刊,2005,14(18):33-36
[2] 段發(fā)階等. 拔絲??仔斡嬎銠C視覺檢測技術(shù)[J] . 光電工程時報, 2006, 23( 13):189-190
關(guān)鍵詞:增強現(xiàn)實;計算機視覺;三維注冊
中圖分類號:TP242 文獻標識碼:A 文章編號:1007-9599?。?012) 19-0000-02
1 引言
隨著計算機技術(shù)的迅速發(fā)展,計算機視覺、虛擬現(xiàn)實技術(shù)、人工智能、計算機圖形學(xué)等技術(shù)被廣泛地研究和應(yīng)用,這些技術(shù)引導(dǎo)著人們進入了一個信息數(shù)字化的虛擬時代。
增強現(xiàn)實技術(shù)(Augmented Reality,AR)作為虛擬現(xiàn)實技術(shù)和計算機圖形學(xué)相結(jié)合的產(chǎn)物,它是在通過計算機渲染生成虛擬的物體或文字信息模型的同時,對真實的場景進行標定,從而使虛擬的物體能夠被準確地放置到真實的場景中,最終通過顯示設(shè)備顯示出來,使用戶處于虛擬和現(xiàn)實相融合的亦真亦幻的新環(huán)境中,無法清楚地分辨出真實和虛擬。增強現(xiàn)實技術(shù)增強了用戶的觀感及其與真實場景之間的交互。
增強現(xiàn)實技術(shù)作為虛擬現(xiàn)實的一個重要分支,是虛擬現(xiàn)實技術(shù)發(fā)展過程中的產(chǎn)物。如圖1.1所示,該圖為Milgram提出的增強現(xiàn)實和虛擬現(xiàn)實關(guān)系的一種分類學(xué)表示方法。由圖我們可以看出,虛擬現(xiàn)實所創(chuàng)建出來的是一種完全虛擬的三維世界,它與真實的世界相隔離。而增強現(xiàn)實是以現(xiàn)實場景為基礎(chǔ),場景中的虛擬物體隨著真實物體的變化而變化,提供給用戶的是一種復(fù)合的視覺效果,就好像這些虛擬物體真實的存在于場景中。
2 增強現(xiàn)實技術(shù)的應(yīng)用
增強現(xiàn)實技術(shù)在20世紀90年代真正興起,其發(fā)展與20世紀60年代計算機圖形學(xué)的迅速發(fā)展密不可分。增強現(xiàn)實技術(shù)不僅擁有虛擬現(xiàn)實的各種優(yōu)點,同時又有其獨特的視覺增強功能,因此成為了國內(nèi)外研究機構(gòu)和知名大學(xué)的研究熱點,并廣泛的被應(yīng)用于教育、醫(yī)療、工業(yè)、娛樂、軍事等多個領(lǐng)域。
2.1 教育
增強現(xiàn)實豐富了教育學(xué)習(xí)生活。傳統(tǒng)的書籍中只存在文字信息,通過增強現(xiàn)實技術(shù),我們可以透過書籍看見文字相關(guān)的動態(tài)畫面或是影像,圖文并茂,極大的增強了學(xué)生的學(xué)習(xí)興趣。目前的魔法書系統(tǒng)就是這一技術(shù)的很好運用,用戶通過頭盔顯示器可以看到書中描述的場景,使讀者可以完全沉浸在虛實結(jié)合的環(huán)境中,提高學(xué)習(xí)興趣和效率。
2.2 醫(yī)療
增強現(xiàn)實技術(shù)可以幫助醫(yī)生實現(xiàn)可視化手術(shù)或手術(shù)培訓(xùn)。準確地定位真實場景是增強現(xiàn)實技術(shù)的一個重要方面,在醫(yī)療中,運用增強現(xiàn)實技術(shù)可以進行手術(shù)定位,實時地收集病人體內(nèi)的3D影像,并將其與真實的人體相結(jié)合,使得醫(yī)生可以“透視”病人體內(nèi),從而減少手術(shù)的風(fēng)險,該技術(shù)對微創(chuàng)手術(shù)也有著深遠的意義。手術(shù)培訓(xùn)方面,通過加入虛擬的提示注解,可以提醒醫(yī)生手術(shù)中的一些必要步驟,降低手術(shù)風(fēng)險。
2.3 工業(yè)
增強現(xiàn)實的另一個應(yīng)用是工業(yè)組裝和維修。通過增強現(xiàn)實技術(shù)可以顯示出各種設(shè)備零件的內(nèi)部結(jié)構(gòu)圖、使用說明等,方便安裝和維修。顯示的內(nèi)容可以不僅僅是簡單的文字或圖片,更能直接渲染生成3D的圖形,并按步驟一步一步的顯示出來,方便操作。
2.4 娛樂
電影、廣告、游戲、體育比賽轉(zhuǎn)播中,增強現(xiàn)實技術(shù)也得到了廣泛的運用。體育比賽中,能夠在直播現(xiàn)場實時地插入三維的圖形、動畫、視頻等虛擬的比賽相關(guān)信息或廣告。日常生活中,出現(xiàn)一種增強現(xiàn)實瀏覽器,它利用多種傳感器將日常需求通過實景與虛景結(jié)合后呈現(xiàn)在用戶面前,用戶可以通過增強現(xiàn)實瀏覽器看到實景的文字介紹、三維模型等,并可以搜索定位。
3 增強現(xiàn)實相關(guān)技術(shù)
增強現(xiàn)實系統(tǒng)具有虛實結(jié)合、三維注冊、實時交互三個特點。三個特點之間緊密聯(lián)系,要求在合成的場景中虛擬的物體能夠擁有真實的存在感和位置感。因此顯示技術(shù)、定位技術(shù)、虛實融合技術(shù)、用戶交互技術(shù)是實現(xiàn)增強現(xiàn)實系統(tǒng)的基礎(chǔ)支撐技術(shù)。
3.1 顯示技術(shù)
理想的AR系統(tǒng)的顯示器具有體積小、移動方便、圖像繪制清晰、交互自然等特點,但是目前仍不能制造出完成符合這些特點的顯示器。常用的顯示設(shè)備可以分為四類:普通液晶現(xiàn)實器;頭戴式顯示器;手持式顯示器;投影式顯示器。
液晶顯示器是最為常見,也最容易得到的顯示設(shè)備。但是液晶顯示器體積較大,移動不方便,限制了用戶的活動范圍。頭戴式顯示器,佩戴于用戶的頭部,這種顯示器本身提供了一路或兩路攝像機,采用視頻合成技術(shù),為用戶提供場景的顯示。但是頭戴式顯示器在戶外長時間佩戴很不舒服,因此也不能為用戶廣泛接受。手持式顯示器,較頭戴式顯示器稍有改進,但是也限制了用戶手部的活動。投影式顯示器能夠?qū)鼍巴队暗捷^大范圍的環(huán)境中,位置固定,適合于室內(nèi)的AR系統(tǒng)。
3.2 定位技術(shù)
增強現(xiàn)實系統(tǒng)需要將虛擬的物體準確地放置到真實的場景中,因此定位技術(shù)顯得尤為重要。目前的定位技術(shù)主要分為兩種:一種是基于硬件的定位技術(shù);一種是基于計算機視覺技術(shù)的定位技術(shù)。
基于硬件的定位技術(shù)一般使用硬件設(shè)備定位,主要包括:全球衛(wèi)星定位系統(tǒng)、測距儀、導(dǎo)航儀、機械裝置等。
基于計算機視覺的定位技術(shù)一般是從真實場景中獲得一幅或多幅圖像,根據(jù)圖像中的信息,計算出攝像機和圖形中物體的相對信息,最終恢復(fù)出三維場景的結(jié)構(gòu),從而達到定位的目的。
基于計算機視覺的定位技術(shù)主要包括以下幾種:
(1)單視圖法:在一幅圖像中找到六個以上特征點進行跟蹤,通過已知的特征點的三維坐標和其成像坐標進行定位。
(2)多視圖法:從多個角度拍攝場景,根據(jù)常用的角點檢測法,檢測多幅圖像的角點并進行匹配,從而計算出真實場景中物體的景深,最終實現(xiàn)定位。
(3)運動目標的序列圖像:根據(jù)序列圖像估算運動目標的各項參數(shù)。
(4)模板匹配法:從多個視角出發(fā)尋找真實圖像中的物體作為模板數(shù)字化圖像,繼而將虛擬物體疊加到真實場景。
3.3 虛實融合技術(shù)
增強現(xiàn)實技術(shù)中的虛擬融合主要指虛擬物體在真實場景中的配準,以及虛擬物體與真實場景的一致性。
在增強現(xiàn)實系統(tǒng)的實現(xiàn)過程中,一致性是一個關(guān)鍵性問題。虛實融合的一致性包括動態(tài)一致性和靜態(tài)一致性。其中,動態(tài)一致性通常指場景的實時繪制,跟蹤過程中虛擬物體和真實場景的空間位置的一致性等;靜態(tài)一致性通常指虛擬物體與真實場景外觀的一致性變化等。
另一方面,為了實現(xiàn)很好的虛實融合效果,必須對拍攝真實場景的相機進行標定,并與繪制虛擬物體的虛擬相機參數(shù)進行匹配。攝像機標定主要是對攝像機的內(nèi)外參數(shù)的確定。目前,攝像機標定技術(shù)已經(jīng)較為成熟,主要可以分為三類:傳統(tǒng)的標定法,如張正友標定法;自標定法,如基于Kruppa方程的自標定法;基于主動視覺的標定法,如基于射影重建的標定法。三類標定法各有利弊,并沒有一種可以普遍適用,因此攝像機標定技術(shù)仍是一個研究重點。
3.4 用戶交互技術(shù)
人們總是向往能夠使用自然的方式和虛擬的物體交互,但這是十分困難的,增強現(xiàn)實系統(tǒng)根據(jù)跟蹤定位獲得的有關(guān)真實場景的信息對虛擬物體發(fā)出指令。目前,交互技術(shù)主要使用以下三種方式:
(1)在場景中選擇一個或多個特征點作為標記點,這是增強現(xiàn)實系統(tǒng)中最基本的交互方式。
(2)使用計算機識別出人或物體的姿態(tài),進而交互操作。
(3)制作特殊工具,能夠通過按鍵等簡單方式觸發(fā)事件。
4 結(jié)束語
本文總結(jié)了現(xiàn)階段增強現(xiàn)實技術(shù)的應(yīng)用領(lǐng)域,并對其涉及到的關(guān)鍵技術(shù)進行了闡述。增強現(xiàn)實技術(shù)作為一個多學(xué)科交叉的研究領(lǐng)域,必將飛速發(fā)展,更多的融入到我們的生活中。
參考文獻:
[1]紀慶革,潘志庚,李祥晨.虛擬現(xiàn)實在體育體育仿真中的應(yīng)用綜述[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2003,15(11):1333-1338.
[2]陳靖,王涌天,閆達遠.增強現(xiàn)實系統(tǒng)及其應(yīng)用[J].計算機工程與應(yīng)用,2001,15:72-75.
[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.
【關(guān)鍵詞】機器視覺;VisionPro;識別定位;
1.引言
自20世紀80年代以來,機器視覺技術(shù)開始高速發(fā)展,已經(jīng)從實驗室走向了人們生產(chǎn)生活的各個方面。機器視覺系統(tǒng)的特點是提高生產(chǎn)的柔性和自動化程度。在一些不適合于人工作業(yè)的危險工作環(huán)境或人工視覺難以滿足要求的場合,常用機器視覺來替代人工視覺;同時在大批量工業(yè)生產(chǎn)過程中用機器視覺檢測方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。而且機器視覺易于實現(xiàn)信息集成,是實現(xiàn)計算機集成制造的基礎(chǔ)技術(shù)?,F(xiàn)今,在機器視覺領(lǐng)域已經(jīng)有了一些成熟的視覺開發(fā)軟件,其封裝了很多可靠、高效的算法和工具。本文選用美國康耐視公司的VisionPro軟件,這是一套基于PC架構(gòu)的視覺系統(tǒng)軟件開發(fā)包,主要應(yīng)用于各種復(fù)雜的機器視覺領(lǐng)域。它集成了用于定位、檢測、識別和通訊等任務(wù)的工具庫,可用C#、VB和VC等語言進行二次開發(fā)。本文基于VisionPro利用語言進行視覺定位系統(tǒng)的軟件開發(fā)[1]。
2.視覺定位系統(tǒng)
2.1 硬件組成
在圖像處理前首先要得到清晰、有效的圖像,這就需要有一套完整的硬件設(shè)備。一般主要包括照明用的光源、調(diào)節(jié)圖像清晰度的鏡頭、將圖像轉(zhuǎn)換為數(shù)字信號的攝像機和進行圖像處理的計算機。其中攝像機與計算機之間的接口也比很重要的,主要分為IEEE1394和采集卡,USB2.0或Gigabit Ethernet千兆網(wǎng)三種[2]。
本視覺系統(tǒng)采用的是日本FUJINON工業(yè)攝像頭,德國BASLER工業(yè)像機ACA1600-20GM,GigE千兆網(wǎng)接口。
2.2 基于VisionPro的軟件開發(fā)
本視覺定位系統(tǒng)利用編寫適合實驗需要的界面,界面中只包含需要的操作功能和數(shù)據(jù),使整個界面看起來更加清楚簡單,操作起來更方便。
(1)圖像采集
本視覺系統(tǒng)通過GigE千兆網(wǎng)作為接口控制相機進行圖像采集。打開軟件并連接相機,設(shè)置好參數(shù)后,就可以通過可視化工具Image Source直接獲取圖像。
(2)相機的標定
機器視覺的基本任務(wù)之一是從攝像機獲取的圖像信息出發(fā)計算三維空間中物體的幾何信息,并由此重建和識別物體??臻g物體表面某點的三維幾何位置與其在圖像中對應(yīng)點之間的相互關(guān)系是由攝像機成像的幾何模型決定的,這些幾何模型參數(shù)就是攝像機參數(shù)。在大多數(shù)條件下,這些參數(shù)必須通過實驗與計算才能得到,這個過程被稱為攝像機標定[3]。
本文利用VisionPro的CalibChecker-boardTool工具進行攝像機標定。首先需要一個棋盤板,棋盤板必須滿足以下條件:必須由大小相同的黑白格子交替組成;格子最好是正方形,如果達不到的話,格子長寬比也要在0.9和1.0之間。本系統(tǒng)采用康耐視公司提供的標準棋盤板進行標定[4,5]。圖1是標定的結(jié)果。
(3)目標識別與定位
視覺定位的目的就是找出目標物的坐標位置。本文利用VisionPro的PMAlignTool工具對目標物體進行識別定位。PMAlignTool工具是基于PatMax算法,該算法采用模板定位技術(shù)(pattern-location technology),先訓(xùn)練模板,然后根據(jù)模板對采集圖像進行模板匹配,實現(xiàn)定位。在訓(xùn)練模板和定位過程中,PatMax不是基于像素柵格(Pixel grid)分析圖像,而是采用基于幾何外形(Features based)的定位方法,通過圖像的幾何特征信息和特征之間的空間位置關(guān)系進行模板訓(xùn)練和匹配,使其能夠保證很高的精度和抗干擾性,而且可以高速定位發(fā)生旋轉(zhuǎn)、縮放、甚至拉伸形變的物體[1]。PMAlignTool工具定位的流程如圖2。
通過PMAlignTool工具對目標物體識別定位后,利用VB調(diào)用該工具下的Results.Item(i).GetPose().TranslationX和Results.Item(i).GetPose().Transl-ationY。這兩個值就是序號為i的目標物在圖像上的X、Y坐標值,其中i為識別的各個目標物的序號。
3.實驗
3.1 PatMax識別定位
在對攝像機完成標定校正后,運用自己編寫的人機交互界面完成對目標物體進行識別定位,并將所需要的目標位置坐標顯示在界面上。同時又將識別到的所有目標物體的坐標信息保存到了文本文檔中,方便調(diào)用。主要操作如下:
(1)模型訓(xùn)練。實驗以一元硬幣為目標物,圖3為訓(xùn)練完成的模型。
(2)目標識別定位。圖4是利用編寫的界面,在圖像上能夠清楚的顯示出所識別出的目標輪廓和形心位置,界面右方結(jié)果顯示區(qū)內(nèi)可以看到所識別的目標數(shù)量和所需要的目標物的坐標。
3.2 對比實驗
視覺定位可以用的軟件和工具包很多,其中應(yīng)用最廣泛的就是Opencv,它是一個基于(開源)發(fā)行的跨平臺計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統(tǒng)上。它輕量級而且高效——由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,同時提供了Python、Ruby、MATLAB等語言的接口,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法。為了驗證PatMax算法定位的準確性,本文利用Opencv對相同的圖像進行目標識別定位,對得到的效果圖和坐標進行對比[6]。如圖5所示,其中藍色為輪廓曲線,綠色十字為目標形心。
圖6為VisionPro識別硬幣的效果圖,輪廓和形心均用綠色線標識。對比兩圖可以看出VisionPro對輪廓的識別效果要更好一些。由于形心坐標是由輪廓曲線上的點計算得到的,所以VisionPro獲得的形心坐標值也會比Opencv的更加準確,而且精確度更高。下表是兩種方法得到的形心坐標。
4.結(jié)束語
本文基于VisionPro采用對其進行開發(fā),首先利用VisionPro中的工具進行圖像的采集,攝像機的標定,運用PatMax算法進行目標物的識別與定位,然后運用編寫人機交互界面,可以更加方便快捷的得到所需要的目標物坐標值。本文利用Opencv對相同的圖像進行目標的識別定位,與VisionPro得到的結(jié)果進行實驗對比。結(jié)果證明基于VisionPro的視覺定位系統(tǒng)對目標的識別效果更好,定位的數(shù)據(jù)更加準確。基于該軟件使應(yīng)用程序的開發(fā)更加快速方便,得到的數(shù)據(jù)結(jié)果誤差較小,具有應(yīng)用價值。
參考文獻
[1]威洛斯,焦宗夏.基于VisionPro的焊膏印刷機視覺定位系統(tǒng)[C].第十二屆中國體視學(xué)與圖像分析學(xué)術(shù)年會論文集,2008.
[2]Carsten Steger,Markus Ulrich,Christean Wiedemann,著.機器視覺算法與應(yīng)用[M].楊少榮,吳迪靖,段德山,譯.北京:清華大學(xué)出版社,2008.
[3]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標綜述[J].自動化學(xué)報,2000,26(1):47-59.
[4]Cognex,Cognex MVS-8100D and CDC Cameras Hardware Manual,2006.
[5]Cognex,VisionPro,Net Help,2006.
[6]Bradski G.,Kaehler A.著.學(xué)習(xí)OpenCV[M].于仁琪,劉瑞禎,譯.北京:清華大學(xué)出版社,2009.
作者簡介:
韓慶瑤(1953—),男,華北電力大學(xué)教授。
張志遠(1986—),男,華北電力大學(xué)能源動力與機械工程學(xué)院碩士研究生。
關(guān)鍵詞:數(shù)據(jù)融合傳感器無損檢測精確林業(yè)應(yīng)用
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機器人、海洋監(jiān)視和管理、目標跟蹤和慣性導(dǎo)航等領(lǐng)域。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對該技術(shù)在林業(yè)工程中的應(yīng)用及前景進行了綜述。
一、數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。
70年代末,在公開的技術(shù)文獻中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。
1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。
Wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標,這正是很多關(guān)于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等。
1.2基本內(nèi)容
信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當(dāng)運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。
(2)多傳感器ID/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或?qū)φ麄€當(dāng)前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當(dāng)時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。
源數(shù)據(jù)預(yù)處理。進行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔(dān),有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。
態(tài)勢評估。根據(jù)當(dāng)前的環(huán)境推斷出檢測目標與事件之間的關(guān)系,以判斷檢測目標的意圖。威脅評估。結(jié)合當(dāng)前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當(dāng)前的政治環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。
二、多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得GPS接收機輸出的有關(guān)信息通過與RS實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。
2.2森林蓄積特征的估計
HampusHolmstrom等在瑞典南部的試驗區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達數(shù)據(jù)進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。
KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權(quán)來估計目標樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的GIS數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側(cè)面裝上可視的數(shù)字攝像裝置,利用GPS對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應(yīng)的GIS數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正。
試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調(diào)整時間長等問題。
3.1.2單一傳感器在木材檢測中的應(yīng)用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等。
隨著計算機視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實驗室利用計算機視覺技術(shù)對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。
在制材加工過程中,利用計算機視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機視覺技術(shù)對刨花板施膠效果進行了定量分析。
X射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進行檢測,并對木材內(nèi)部的各種缺陷進行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當(dāng)成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準確、可靠地檢測到木材的缺陷。
基于多傳感器(機器視覺及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實驗站與有關(guān)公司合作開展用GPS和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。
目前單項的GPS、RS、GIS正從“自動化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個多組分的復(fù)雜系統(tǒng),是由能量流動、物質(zhì)循環(huán)、信息流動所推動的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計算機集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計數(shù)據(jù)、柵格數(shù)據(jù)、點數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個高效、柔性和開放的體系,從而實現(xiàn)林業(yè)生產(chǎn)的標準化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標,建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻]