前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺與應用主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:計算機;視覺技術;玉米種子;質(zhì)量;檢測
中圖分類號:S513 文獻標識碼:A 文章編號:1003-4374(2015)01-0047-04
引言
計算機視覺是提高人類生產(chǎn)、生活自動化和智能化程度的有效手段。目前,農(nóng)產(chǎn)品分級與品質(zhì)檢測、種子品質(zhì)檢測、果實的采摘、病害檢測等方面,機器視覺都有廣泛研究。作為世界三大糧食作物之一,玉米在糧食貿(mào)易中所占比重不斷升高。隨著計算機技術進步,尤其是圖像技術的發(fā)展,建立在視覺技術的測量方法也高速發(fā)展,要適應測量的現(xiàn)代化步伐,算法快速并且精度要高是圖像實現(xiàn)測量途徑的必然要求。在玉米生產(chǎn)中,種子質(zhì)量是最為關鍵的因素之一,玉米的收獲產(chǎn)量和產(chǎn)品品質(zhì)與種子質(zhì)量的優(yōu)劣息息相關。十多年來,國內(nèi)學者對應用機器視覺技術進行玉米種子檢測方面開展了深入研究。本文主要綜述這類研究,為今后該領域學者提供參考信息,從而加快系列研究的深入開展。
圖像采集與模式識別
目前,CCD相機、掃描儀或數(shù)碼相機是主要的圖像采集設備。CCD相機在生產(chǎn)線的開發(fā)當中是最好的選擇,而對靜態(tài)檢測設備而言面陣相機則是上選,如果應用場合是既有設備,那么數(shù)碼相機等更為適用。由于在封閉的環(huán)境光照足夠穩(wěn)定,此時圖像噪聲干擾較小,免除標定這一環(huán)節(jié),在后續(xù)處理時非常方便,所以圖像采集通常是在封閉環(huán)境中進行。用于移動設備的相關軟件的研究中,則有四個方面的情況需要著重考慮:第一,當前采集玉米圖像時所用背景都是單一顏色,而在生產(chǎn)具體應用中則完全有可能是非單一顏色;第二,在用戶使用過程中,光照條件不確定、特別是顏色特征對圖像質(zhì)量有影響。第三,玉米種子體積不大,當玉米種子的空間位置發(fā)生移動時,圖像中種子的特征會隨著改變。第四,在圖像采集時,如采集的角度存在偏移,圖像中玉米種子的形態(tài)也不會保持不變。
玉米種子純度檢測
種子最主要的質(zhì)量指標之一是純度,目前,形態(tài)學鑒定和蛋白質(zhì)電泳分析法是主要的鑒定籽粒純度方法。
國外學者從圖像當中提取玉米種子形態(tài)方面的參數(shù),并結合判別函數(shù)實現(xiàn)對玉米統(tǒng)計學的種子外形判斷,實現(xiàn)玉米種子從非完整玉米種識別。當然,該方法效率不高,所費時間過多。
朱曉利用高光譜反射圖像技術,提取多個波段種子圖像特征,然后通過遺傳算法選擇最優(yōu)波段圖像,建立分級模型,達到對玉米種子純度檢測的目的。所建立的分類模型測試精度達到97.22%。
另一批學者針對純度考慮圖像識別這一方法實現(xiàn)識別玉米種子,首先是彩色相機獲得圖譜,通過基于閾值的二值化處理圖像灰度變換、圖像均衡化,實現(xiàn)和電泳圖譜進行比對以期判斷純度水平,玉米種子純度在計算機和人眼檢測結果,得到一種高效測玉米種子純度的方法,而這個技術對2個品種玉米的平均識別準確度接近100%。
綜合幾種玉米種子純度檢測方案,形態(tài)鑒定法方法簡單,但效率與精度不高。隨著檢測識別算法的改進和計算機處理能力的提高,計算機視覺技術將比其他方法更高效更準確。
玉米種子品質(zhì)自動檢測
周紅等為實現(xiàn)對種子評級,借助圖像處理技術得到玉米種子輪廓。通過計算機模糊識別代替玉米種子形態(tài)傳統(tǒng)鑒定法,目的是將識別水平大幅度提高;基于模糊數(shù)學以及統(tǒng)計學,得到隸屬函數(shù),從而制定對品種進行判別的規(guī)律,玉米種子得以判別,所構建的系統(tǒng)投資低,而且玉米種子品質(zhì)的識別率為88%。
閆小梅等通過CCD相機,對玉米種子冠部和無胚芽面圖像進行提取,利用圖像預處理將單個籽粒分割出來,通過圖像分割,將冠部核心區(qū)域和側面黃色區(qū)域6個顏色特征提取出來,以Fisher判別理論和K-均值聚類為依據(jù),將特征投影到一維空間,進行純度識別,識別率不低于93.75%。
玉米收獲后加工的重要環(huán)節(jié)之一就是對玉米種子質(zhì)量進行分級,在玉米種子質(zhì)量分級工作中,機器視覺技術優(yōu)勢明顯,例如不會對玉米種子造成損壞、更好實現(xiàn)分級。相關學者提出從特征值按照一定的等級進行分類,采用典型神經(jīng)網(wǎng)絡與隸屬函數(shù)方法對玉米種子實現(xiàn)分級,發(fā)現(xiàn):BP神經(jīng)網(wǎng)絡處理時間更短,具有更好的實時性,為現(xiàn)實應用打下良好的基礎。有學者將形態(tài)學加上種子分級設備,能夠實現(xiàn)準確率高達90%以上的將種子分為4級的方法。吳繼華等開發(fā)了一種種子品種實時檢測系統(tǒng),該系統(tǒng)是基于機器視覺,由CCD攝像機進行圖像采集,每隔2s停止1次,在分析結束時就可以得到特征參數(shù),二十粒種子只需一秒鐘時間。Wan等18-19]將機器視覺應用在谷物類進行動態(tài)識別,并進行分類,得到圖像就進行處理,并將信號傳給對應的PLC,從而閉合電磁閥,以達到吹離目的。宋鵬等就分級系統(tǒng)在動態(tài)玉米品質(zhì)檢測,抓住玉米種子的特征,把種子分類形態(tài)以及顏色分別分為4級和3級,合格率分別為8 1.8%和93.04%,還能夠實現(xiàn)玉米種子品種,應用Bayes分類器以及模式識別法實現(xiàn)識別玉米種子品種達到5種,識別準確率不低于92%;結合玉米顏色等信息,實現(xiàn)單倍體籽粒分類,待識別玉米單倍體后,將用氣吸方式和二自由度并聯(lián)機器人機構相結合進行分揀,精度不低于80%。
目前的玉米種子品質(zhì)自動檢測中,多采用可見光進行圖像采集,然后通過綜合處理分析種子的外部特征來確定品質(zhì)等級。鮮有利用紅外等不可見光生成的圖像來進行品質(zhì)分級,因而無法精確分析種子內(nèi)部的品質(zhì)特征,影響到檢測精度。因此,運用不同波段圖像分析玉米種子品質(zhì),將成為以后種子品質(zhì)檢測的一個重要方向。
玉米種子活力檢測
漫射光法、熱浸法、電導率測定、四唑染色法、冷浸法、發(fā)芽實驗等是種子活力的常規(guī)檢測方法。目前,有效結合圖像識別與處理等技術以及發(fā)芽試驗和四唑染色法等方法的優(yōu)勢,能夠準確測定種子活力。趙新子等對活力識別進行論述,染色種胚后獲取彩色圖像,判斷染色區(qū)域在種胚的面積占比,得到活力水平評判,識別率為94%。
張曉宇等通過處理和分析種苗圖像,根據(jù)玉米種苗特征建立起可以方便、快速地獲取苗高、苗鮮重等信息的相關統(tǒng)計模型,該模型直接用于玉米種子的發(fā)芽試驗,以便獲得準確可靠實驗結果。該技術將作為玉米種子發(fā)芽試驗新的檢測手段,同時應用于其它植物種子發(fā)芽試驗。
Zayas等通過形態(tài)學參數(shù)把玉米種子從被破壞的玉米種識別,結合統(tǒng)計學方面的判別函數(shù),將被破壞的玉米種子剔除。為了檢驗播種材料,需要對種子發(fā)芽的規(guī)律以及所需條件進行研究,研究必須將玉米種子發(fā)芽進行系列實驗,這時候對于發(fā)芽粒數(shù)以及苗高等種子的信息大多由人工獲取。
玉米種子機械和霉菌損害檢測
玉米種子質(zhì)量檢測的重要指標之一是種子是否有裂紋和發(fā)生霉變,采用視覺無損檢測,我們發(fā)現(xiàn)如果光線對應入射孔直徑設定在2.4mm時,所得背景是黑色的,如果入射光是白色光,采集得到的圖像采用高速濾波法識別玉米籽粒裂紋處與其他部位的像素灰度值的不同,檢測精度不低于百分之九十。有學者利用生霉粒對光照變化非常敏感的特點,光照變化對顏色標定是鑒定生霉粒的主要途徑,認為機器視覺算法在精確性以及一致性方面具有非常明顯的優(yōu)勢,這給玉米種子質(zhì)量檢測的提高打下良好的實踐基礎。
有學者基于圖像分析等途徑分析玉米應力裂紋,主要結論是重度裂紋最易于被識別出,達到完全被識別的水平;無裂紋以及中度裂紋則朝著變差方向發(fā)展,不能完全被識別,占比約有30%-12%。
張俊雄等實現(xiàn)表面裂紋檢測:在獲取單粒玉米種子的圖像后采用Sobel算子得到玉米種子邊緣并通過分割閾值、腐蝕以及膨脹等傳統(tǒng)圖像處理,從而可以判斷滿足什么樣的條件可以判定為種子尖端點,并能實現(xiàn)尖端部分拿掉;將R通道膨脹,同時細線化處理B通道圖像結果,并執(zhí)行減運算操作,根據(jù)連通性判別有無裂紋,識別率超過90%。
關鍵詞:高校教師教育技術培訓;決策樹ID3算法;應用
中圖分類號:G451.2 文獻標志碼:A 文章編號:1002-0845(2012)10-0098-02
信息技術的迅猛發(fā)展引起了教育的深刻變革。為此,提高教師的信息素養(yǎng)已成為推動我國高等教育信息化建設的必由之路。高教司于2000年發(fā)出的《關于開展高校教師教育技術培訓工作的通知》(高教司【2000】79號)[1]中指出,“教育技術培訓”是“新世紀教改工程”和“現(xiàn)代遠程教育工程”的重要組成部分,是深化教學改革、提高教學質(zhì)量的重要舉措。
常熟理工學院自2001年6月開始,對教師進行教育技術培訓,2003年1月起申報江蘇省教育技術培訓點,次年申報成功。2007年,學校正式下發(fā)的《常熟理工學院講師等中級職稱資格條件》(常理工[2007]73號)第二章第七條規(guī)定:教師申報教學系列、思政系列的中級職稱應參加學校現(xiàn)代教育技術培訓并取得合格證書。近幾年來,學校先后舉辦了十期教師教育技術中級培訓班,共400多名中青年教師參加了培訓,極大地提高了教師的多媒體教學水平,加快了學校信息化建設的步伐。
一、高校教師教育技術培訓存在的問題
教師教育技術培訓的研究對象是教學過程與教學資源,研究范疇包括對教學過程的設計以及教學資源的開發(fā)、應用、管理與評價。目前,各高校的教師教育技術培訓工作雖已取得了一定的成績,但從培訓的實際效果來看,仍存在著一些問題,主要表現(xiàn)在以下三個方面。
1.培訓時間安排不夠合理
目前,教師教育培訓基本采用集體面授的方式。由于參訓教師自身所承擔的教學工作和科研任務比較繁重,很難抽出一段相對集中的時間來參加教育技術培訓。為解決上述矛盾,高校通常會選擇利用寒暑假時間安排培訓,這需要犧牲培訓教師和參訓教師的許多休息時間,容易引發(fā)不滿情緒,嚴重影響了教師參訓的積極性,極大地降低了培訓效果。
2.培訓內(nèi)容安排不科學
由于培訓內(nèi)容是根據(jù)全校教師需求統(tǒng)一安排的,基本沒有考慮到參訓教師自身所具備的知識層次、學科背景、思想意識等方面的差異,因此很難體現(xiàn)學科差別。各學科教師混合在一起集中學習,導致理論知識講解過多而與教學實際聯(lián)系較少,參訓教師難以從根本上真正掌握教育技術。
3.考核方式單一,培訓評價體系不健全
目前,高校教師培訓采取的考核方式往往比較單一,通常以參加理論考試或者提交相關論文、作業(yè)等作為培訓的最終考核結果。此外,各級培訓機構大多未能及時地對培訓過程做出評價,同時缺少參訓教師的自我評價環(huán)節(jié),因而不利于教育技術培訓工作的后續(xù)支持和進一步開展。如此看來,建立和完善培訓評價體系顯得尤為重要,這也是建立教師培訓長效機制的關鍵所在。
二、分類技術與決策樹ID3 算法的相關理論
針對參訓教師在知識層次、學科背景、思想意識等方面存在的差異,筆者提出了“先分類后培訓”的思路。在培訓正式開始之前,可采用數(shù)據(jù)挖掘領域內(nèi)的分類技術對參訓教師進行分類,這樣有利于激發(fā)參訓教師的積極性,從而增強他們運用現(xiàn)代教育技術輔助教學的主動性和自覺性。
1.分類
作為數(shù)據(jù)挖掘的重要任務之一,分類[4]就是要找出一個類別的概念描述或預測未來的數(shù)據(jù)趨勢,它代表了這類數(shù)據(jù)的整體信息。分類的目的是為了構造一個分類函數(shù)或分類模型(也稱分類器),該模型能夠把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定的類別中。
2.相關概念及定義
根據(jù)信息論中的有關定義,熵一般用于測量一個非葉節(jié)點的信息量的大小。若存在n個相同概率的消息,則每個消息的概率p是1/n,此時一個消息傳遞的信息量應為-log2(p)=log2(n)。若給定的概率分布P=(p1, p2, … , pn),則由該分布傳遞的信息量稱為P的熵I(P)。
若一個記錄的集合T根據(jù)類別屬性的值被分成相互獨立的類C1,C2,…,Ck,則識別T的一個元素所屬哪一類所需要的信息量是INFO(T)=I(P),其中P是(C1, C2, … , Ck)的概率分布。
若先根據(jù)非類別屬性X的值將T分成集合T1,T2,…,Tn,則INFO(X, T)是在已得到X的值后確定T中一個元素的類別屬性時所需要的信息量,可通過確定Ti的加權平均值來得到,增益Gain(X,T)=INFO(T)-INFO(X, T)。
因此,可利用Gain(X, T)將屬性進行排列,并可構造一棵決策樹,其中每一個節(jié)點在屬性中都是具有最大增益的一個,從而不必考慮來自于根的路徑。
3.決策樹ID3算法
決策樹ID3算法[4]是由Quinlan首先提出來的。該算法是以信息論為基礎、以信息熵和信息增益度為衡量標準實現(xiàn)對數(shù)據(jù)的歸納分類的。給定一個非類別屬性C1,C2,…,Cn的集合、類別屬性C及記錄的訓練集T之后,可以用ID3算法構造一棵決策樹,其中R是一個非類別屬性集合,具體算法如下:
若T為空,返回一個值為無效的單個節(jié)點;
若T是由其他均為相同類別屬性值的記錄組成,返回一個帶有該值的單個節(jié)點;
若R為空,則返回一個單節(jié)點,其值為在T的記錄中找出的頻率最高的類別屬性值(這時將出錯,即對記錄進行了誤分類),將R中屬性之間具有最大Gain(D, T)值的屬性賦給D;
關鍵詞 計算機;視覺技術;應用研究
中圖分類號:TP212 文獻標識碼:A 文章編號:1671-7597(2013)16-0114-01
計算機視覺技術自20世紀70年代產(chǎn)生以來就得到了全世界的廣泛關注。作為一種多學科綜合應用下的新技術,隨著專家對其研究會的不斷深入,其應用領域也越來越廣,給人們的生產(chǎn)生活帶來了極大方便。
1 計算機視覺技術
計算機視覺技術是在計算機技術應用下發(fā)展起來的一種新技術,主要用來研究計算機模擬生物的宏觀或外顯功能。該技術在應用過程中會涉及到計算機科學、神經(jīng)生物學、人工智能、模式識別以及圖像處理等多個學科,多學科技術的綜合運用使得計算機具有了“感知”周圍世界的能力,這也正是該技術發(fā)揮作用的核心所在。計算機視覺技術的特點就在于,首先,它能在不接觸被測者的前提下完成對被測者的檢測;其次,該技術應用的領域和檢測的對象非常廣,能在敏感器件的應用下,完成對人類難以觀察到的超聲波、微波和紅外線等的檢測;最后,該技術還突破了人在視覺觀察上長時間工作的限制,能對檢測對象進行長時間觀察。
2 計算機視覺技術在各領域的應用分析
隨著計算機視覺技術研究的不斷加深,該技術的應用領域也越來越廣,下面,本文就選取工業(yè)、農(nóng)業(yè)、林業(yè)、農(nóng)產(chǎn)品檢測、電力系統(tǒng)自動化及圖書館工作這6個方面對計算機視覺技術的應用進行簡要分析。
2.1 在工業(yè)領域中的應用
工業(yè)生產(chǎn)對產(chǎn)品的質(zhì)量要求極高,計算機視覺技術在工業(yè)上的應用主要集中在以下3方面:1)產(chǎn)品形狀和尺寸的檢測上。對制造業(yè)而言,產(chǎn)品的形狀和尺寸是否合格直接影響到產(chǎn)品在實際應用過程中作用的發(fā)揮。計算機視覺技術的應用能對產(chǎn)品進行二維和三維等幾何特征的檢測,如產(chǎn)品的圓度、位置及形狀等。2)產(chǎn)品零部件缺失情況的檢測。在生產(chǎn)線運行過程中,計算機視覺技術能準確檢測出產(chǎn)品在生產(chǎn)過程中是否存在鉚釘、螺絲釘?shù)攘悴考娜笔б约爱a(chǎn)品內(nèi)部是否在生產(chǎn)過程中摻進雜質(zhì)等。3)產(chǎn)品表面質(zhì)量的檢測。為了從各個方面保證產(chǎn)品的合格性,對其進行表面質(zhì)量的檢測也是一個極其重要的環(huán)節(jié)。計算機視覺技術實現(xiàn)了對產(chǎn)品表面的紋理、粗糙度、劃痕、裂紋等各方面的有效檢測。
2.2 在農(nóng)業(yè)生產(chǎn)領域中的應用
該技術在農(nóng)業(yè)領域的應用主要集中在以下兩方面:1)對病蟲害的預測預報。預測預報作用發(fā)揮的關鍵環(huán)節(jié)是建立起計算機視覺技術對所有昆蟲的識別體系。對昆蟲圖像識別系統(tǒng)進行數(shù)字化建模所使用的方法主要以下2種,一種是運用數(shù)學形態(tài)學的方法對害蟲的邊緣進行檢測,進而提取害蟲的特征;第二種是從昆蟲的二值化圖像中提取出昆蟲的周長、面積和復雜度等基本信息,并對這些信息建立害蟲的模板庫以實現(xiàn)對昆蟲的模糊決策分析。2)對農(nóng)作物生長的監(jiān)測。常用的方法就是運用計算機視覺技術下的非接觸式監(jiān)測系統(tǒng)對農(nóng)作物生長環(huán)境下的光照、溫度、濕度、風速、營養(yǎng)液濃度等相關因素進行連續(xù)地監(jiān)測,進而判斷出農(nóng)作物長勢。
2.3 在林業(yè)生產(chǎn)中的應用
該技術在林業(yè)生產(chǎn)中的應用主要集中在農(nóng)藥噴灑和林木球果采集這兩方面。就林業(yè)的農(nóng)藥噴灑而言,常規(guī)的農(nóng)藥噴灑方式易造成農(nóng)藥的大量流失,不僅達不到防止林業(yè)有害生物的目的,還浪費了大量的人力、物力和財力。計算機視覺技術的應用能通過對施藥目標圖像進行實時分析,得出具體的施藥量和準確的施藥位置,該技術指導下的施藥工作極大發(fā)揮了農(nóng)藥的效果。就林木球果采集而言,該采集工作的操作難度一直都很大,我國當前使用的方法主要是人工使用專業(yè)工具下的采集以及機械設備運用下的高空作業(yè)車采集和搖振采種機采集,這兩種方式都存在一定的安全性和效率問題。計算機視覺技術的應用能通過對需要進行采集的林木球果進行圖像采集來得出球果所處的具置,再結合專業(yè)機械手的使用完成球果采集。該技術不僅節(jié)省了大量勞動力,還極大提高了采摘效率。
2.4 在農(nóng)產(chǎn)品檢測中的應用
農(nóng)產(chǎn)品在生產(chǎn)過程中受自然環(huán)境的影響比較大,所以農(nóng)產(chǎn)品不僅會產(chǎn)生質(zhì)量上的差異,還會造成顏色、大小、形狀等外觀上的極大不同。由于農(nóng)產(chǎn)品在出售時大多要進行產(chǎn)品等級的劃分,所以將計算機視覺技術運用到對其顏色和外形尺寸的檢測上,有效達到了對農(nóng)產(chǎn)品進行檢測的目的。通過對外觀大小尺寸的檢測,不僅提高了對農(nóng)產(chǎn)品進行分門別類地等級劃分的效率,還在很大程度上減少了對產(chǎn)品的損壞;通過對西瓜等農(nóng)產(chǎn)品進行顏色上的檢測,能準確判斷其是否成熟,有效避免了人工操作下的失誤。
2.5 在電力系統(tǒng)自動化中的應用
計算機視覺技術在電力系統(tǒng)自動化應用的表現(xiàn)當前主要表現(xiàn)在以下2個方面:1)在人機界面中的應用。人機界面在運行過程中更加強調(diào)人的主體地位,實現(xiàn)了用戶對各種效應通道和感覺通道的運用。具體來講,計算機視覺技術在用戶向計算機的輸入方面,效應通道實現(xiàn)了手動為主向手、足、口、身體等的轉變;在計算機向用戶的輸出方面,感覺通道實現(xiàn)了視覺為主向觸覺、嗅覺、聽覺等的轉變。2)在電廠煤粉鍋爐火焰檢測中的應用。對煤粉鍋爐火焰的檢測既能有效判斷鍋爐的運行狀況,又能在很大程度上實現(xiàn)電廠的安全性運營。由于煤的負荷變化和種類變化會在使著火位置發(fā)生移動,所以為了保證爐膛火焰檢測的準確性,必須彌補之前單純應用火焰檢測器只能判斷有無火焰開關量信號的弊端。計算機視覺技術的應用,就在彌補火焰檢測器應用弊端的基礎上,實現(xiàn)了對火焰形狀的進一步檢測。
2.6 在圖書館工作中的應用
隨著當前數(shù)字圖書館和自動化管理系統(tǒng)的建立,計算機技術在圖書館方面的應用越來越廣泛。當前計算機視覺技術在圖書館方面的應用主要集中在古籍修補和書刊剔舊這兩方面。就古籍修補而言,古籍圖書等在收藏的過程中,受溫度、濕度、光照等的影響,極易導致紙張變黃、變脆以及蟲洞等現(xiàn)象的出現(xiàn)。在進行修補時,依靠計算機視覺技術開展具體的修補工作,能在很大程度上提高修補工作的效率。就書刊剔舊而言,由于圖書館藏書眾多,對那些使用率低且較為陳舊的文獻資料進行及時地剔除,能實現(xiàn)圖書資源的及時更新。計算機視覺技術在該方面的應用,極大地保證了工作的準確性和效率性。
3 結束語
通過以上對計算機視覺技術在工業(yè)、農(nóng)業(yè)、林業(yè)、農(nóng)產(chǎn)品檢測、電力系統(tǒng)自動化及圖書館工作這6個方面的研究可以看出,隨著計算機技術的進一步發(fā)展以及計算機與各專業(yè)學科的不斷滲透,該技術的發(fā)展前景和應用領域都將更加廣闊。
參考文獻
關鍵詞:計算機圖形學;計算機視覺;可視化技術
中圖分類號:TM862 文獻標識碼:A 文章編號:1671-2064(2017)01-0054-02
計算機圖形學、計算機視覺以及可視化技術三者均是計算機領域重要組成部分,要做好計算機知識,就要先學好計算機圖形學,但計算機圖形學學習相對枯燥,尤其是算法教學難以理解,為解決這一問題,計算機視覺與可視化技術被應用到計算機圖形學中。可見,三者之間存在一定的聯(lián)系,因此,有必要對計算機圖形學、計算機視覺以及可視化技術展開研究。
1 計算機圖形學概述
1.1 計算機圖形學目的
所謂的計算機圖形學實際上就是怎樣利用計算機表示圖形,并利用計算機完成圖形計算與處理,而這一過程的實現(xiàn)需要得到相關算法的支持。學習計算機圖形學的目的是利用計算機技術為人們呈現(xiàn)既帶有美感又不缺真實的圖形(如下圖1所示),為實現(xiàn)這一目標,就需要按照圖形的要求創(chuàng)設合適的場景,并在一些光照模型的作用下,做好光照效果設計,在這一過程中需要計算機圖形學能夠與其他計算機技術相配合。經(jīng)過計算機圖形學出來的圖像,多會以數(shù)字圖像的方式展示出來,總的來說,計算機圖形學與圖像處理之間存在著一定的聯(lián)系[1]。計算機圖形學的涉及范圍相對寬泛,不僅有圖形硬件設計,還包括動畫制作,虛擬現(xiàn)實等多個部分。此外,計算機圖形學在動畫制作中的應用頻率也很高,如45分鐘一集的動畫影片中,85%的畫面都需要用算機圖形學來完成,由此可見,計算機圖形學的應用頻率極高,并在動畫制作中發(fā)揮著不可替代的作用。因此,應重視計算機圖形學的應用。
1.2 計算機圖形學應用
隨著計算機圖形學的發(fā)展,它被應用到各個領域中,并發(fā)揮著重要作用。首先,在計算機輔助設計與制造中的應用,這是計算機圖形學應用最多的領域,在計算機圖形學被應用以后,不僅可以設計出更精準的圖形,還能做好人機交互設計,強化修改能力。計算機圖形學還被應用到三維形體重建中,利用該技術可以將原理的二維信息轉化為三維信息,如在某次工程圖紙設計中就應用了計算機圖形學,經(jīng)過一系列的處理以后,三維形體逐漸形成,最終實現(xiàn)了重建。其次,在醫(yī)學領域中的應用。計算機圖形學在醫(yī)學領域中的應用多以計算可視化的形式展示出來,如在腦部手術中,醫(yī)生為看清患處真實情況,經(jīng)常需要利用在可視化技術的作用下將復雜的數(shù)據(jù)轉化為圖像,這時就體現(xiàn)了計算機圖形學在其中的應用[2]。再者,在計算機動畫中的應用,人們看到的動畫影片就是計算機圖形學作用的結果,以動畫人物的行走為例,為保證動畫人物的行走與自然人不存在過大差異,就需要應用大量的計算機技術,并在計算機圖形學的作用下完成設計。最后,在計算機藝術中的應用。計算機圖形學在計算機藝術中也有廣泛應用,它不僅可以用于藝術制作,很多場景都是通過計算機圖形學來完成的,現(xiàn)階段,一些人正在利用計算機圖形學創(chuàng)設人體模擬系統(tǒng),其目的是讓已故人士再次出現(xiàn)在熒屏上,這一目標的實現(xiàn)就需要得到計算機圖形學的支持。
2 計算機視覺技術
2.1 計算機視覺技術含義
所謂的計算機視覺技術,實際上就是用計算機取代人眼做識別、跟蹤以及測量等,同時也兼顧圖形處理,其目的是讓圖像在計算機被處理以后更適于識別。對于計算機視覺技術來說,意在實現(xiàn)人工智能,主要是從圖像與多維數(shù)據(jù)等方面實現(xiàn)人工智能系統(tǒng)設計[3]。計算機視覺是一種在相關理論與模型基礎上發(fā)展起來的視覺系統(tǒng),其主要構成部分有以下幾種:
(1)程序控制,這一點主要體現(xiàn)在機器人設計上;(2)事件檢測,多體現(xiàn)在圖像監(jiān)測上;(3)信息組織,主要體現(xiàn)在圖像數(shù)據(jù)庫等方面。計算機視覺三個階段如圖2所示,通過觀察圖1可以發(fā)現(xiàn),計算機視覺存在于圖像處理始終,從早期處理直到后期結束都存在,最終實現(xiàn)了3D描述,可見,計算機視覺具有十分重要的作用[4]。
2.2 計算機視覺技術的應用
現(xiàn)階段,現(xiàn)代社會已經(jīng)進入信息化時代,計算機技術也被應用到各個領域,并發(fā)揮著重要作用。計算機視覺的應用促使計算機實現(xiàn)了智能化,在該技術的支持下,計算機可以像人一樣透過視覺看待世界萬物,且具有良好的適應能力,但這一目標的實現(xiàn)還需要很長時間,需要一系列的努力才能實現(xiàn)?,F(xiàn)階段,計算機視覺應用最多的就是車輛視覺導航,然而,這種導航還沒有實現(xiàn)完全自主導航,這也是需要進一步研究的地方。計算機視覺技術的適應性較好,特別適合在工業(yè)領域應用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運行,其整體效果也不會受到影響,再者,計算機視覺技術的嵌入性較好,成本相對較低,尤其適合在PC方案中使用,同時,具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來說,計算機視覺技術總體效果較好,適合利用在各種工業(yè)環(huán)境中應用,因此,應重視計算機視覺技術的應用[5]。同時計算機視覺還被應用到移動機器人設計中,主要是利用小波模板展示人體形態(tài),然后做圖像掃描,這樣就可以順利完成小波變換,進而了解到人的存在。同樣,將計算機視覺應用到機器人設計上,可以自動檢測出正在行動的人或車輛,而無法檢測到靜止的人,之所以會出現(xiàn)這樣情況,主要是由于其中采用率步態(tài)分析法。
3 可視化技術
3.1 可視化技術含義
可視化技術是一種綜合了計算機圖形學與圖像處理于一體的技術,它可以將復雜的數(shù)據(jù)轉化為圖像并在屏幕上展示出來。在可視化技術中,融合了以上兩種技術的特點,并在多個領域都有應用,隨著可視化技術的應用,不僅有效實現(xiàn)了數(shù)據(jù)表示,還強化了數(shù)據(jù)處理能力,更對數(shù)據(jù)決策分析有一定作用[6]?,F(xiàn)階段,虛擬現(xiàn)實技術已經(jīng)成為可視化技術主要發(fā)展方向。
3.2 可視化技術的應用
首先,在計算機圖形學教學中的應用,計算機圖形學相對枯燥,相關知識也很抽象,不便于學生理解,在計算機圖形學中最重要的部分是曲線曲面,而這些曲線曲面多是與數(shù)學模型有關,具有一定的抽象性,學生理解難度較大,以往教師只能通過一系列的公式演算幫助學生理解,盡管這樣依然難以讓學生掌握曲線變化情況,學生依舊無法正確理解。為減少這種情況的發(fā)生,可視化技術被應用到計算機圖形學教學中,教師將抽象的知識用動畫的形式展示出來,學生只要觀看動畫,拖動一定的控制點就可以了解到曲線變化情況,這樣一來不僅增加了教學趣味性,學生也可以隨意變動曲線,讓復雜的知識變得簡單,深化學生對計算機圖形學知識的深度理解,同時,利用可視化技術在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強學生的理解能力[7]。
其次,在醫(yī)學領域中的應用。醫(yī)學領域對于可視化技術的應用主要體現(xiàn)在放射治療與矯正手術上。通過可視化技術可以屏幕上看到手術整個過程,并將原來細節(jié)部位放大,手術醫(yī)生觀察的更加細致,手術成功幾率也會大幅度提升,患者生命也能得到保證(如圖3所示)。如在對某名患者進行身體檢查的過程中需要應用到可視化技術,由于通過檢查會獲得大量數(shù)據(jù),而這些數(shù)據(jù)又相對復雜,但在可視化技術下就可以通過圖表、曲線圖或立柱圖的方式展示出來,經(jīng)過可視化技術的作用,了解到患者的血糖為5.6mmol/L,醫(yī)生可以根這一數(shù)據(jù)做出診斷,而不必再分析這些數(shù)據(jù)。據(jù)不完全統(tǒng)計,80%的醫(yī)療檢查工作都是需要利用可視化技術。
地質(zhì)勘探是我國最重要的工作之一,由于多數(shù)礦藏都深埋地下,即便使用探測儀受多種因素影響也無法了解到實際礦藏情況,這就需要應用到可視化技術,在可視化技術的作用下,相關工作人員可以了解到地下有無礦藏,如果存在礦藏,相關工作人員也可以了解到礦藏所在位置與實際儲備量,進而為礦藏開采奠定基礎。如在地質(zhì)勘探中,相關工作人員利用可視化技術做地形圖整理,然后從中提取地形數(shù)據(jù),再用CATIA做導入,這樣就可以完成地形模型創(chuàng)建,這樣就完成了三維地質(zhì)模型創(chuàng)建工作,同時在相關工作臺的影響下,還可以完成地形數(shù)據(jù)導入,進而生成一定的地形云點,如果其中存在錯誤,可視化技術也可以將其中的錯誤內(nèi)容刪除,這些都是可視化技術所帶來的好處[8]。由此可見,可視化技術已經(jīng)成為地質(zhì)勘探中不缺少的技術。
最后,在氣象預報中的應用(如圖4所示)。利用可視化技術能夠將數(shù)據(jù)轉化為圖像,通過觀察圖像就可以了解到云層變化情況,同時也能了解到實際風力大小與風走向等,氣象預報人員就可以根據(jù)圖像做出精準分析,需要了解氣象變化的人也能了解到現(xiàn)實情況,如果氣象條件惡劣,相關工作人員也可以及時做出工作調(diào)整,減少危險事件的發(fā)生。據(jù)不完全統(tǒng)計,可視化技術在氣象預報中的應用頻率高達100%,由此挽回的經(jīng)濟損失高達13.2億元,可見,可視化技術在氣象預報中的應用十分有必要,因此,應重視可視化技術在氣象預報中的應用。
4 結語
通過以上研究得知,計算機圖形學、計算機視覺以及可視化技術三者各具特色,三者間也存在一定的關系,尤其是可視化技術綜合了前兩者的特點,并融合了其他技術,在很多領域中都有應用??梢暬夹g是現(xiàn)階段應用最多的一種技術,在計算機圖形學教學中也有應用,并發(fā)揮著不可替代的作用。本文分析了計算機圖形學、計算機視覺以及可視化技術的含義與應用,希望能為相關人士帶來有效參考,正確利用這些技術。
參考文獻:
[1]陳敏雅,金旭東.淺談計算機圖形學與圖形圖像處理技術[J].長春理工大學學報,2011(01):138-139+146.
[2]柳海蘭.淺談計算機圖形學的發(fā)展及應用[J].電腦知識與技術,2010(33):9551-9552.
[3]滑瑞朋.計算機圖形學的應用及研究[J].山西科技,2012(05):37-38+45.
[4]劉濤,仲曉春,孫成明,郭文善,陳瑛瑛,孫娟.基于計算機視覺的水稻葉部病害識別研究[J].中國農(nóng)業(yè)科學,2014(04):664-674.
[5]關然,徐向民,羅雅愉,苗捷,裘索.基于計算機視覺的手勢檢測識別技術[J].計算機應用與軟件,2013(01):155-159+164.
[6]許志杰,王晶,劉穎,范九倫.計算機視覺核心技術現(xiàn)狀與展望[J].西安郵電學院學報,2012(06):1-8.
關鍵詞:計算機視覺圖像 精密測量 構造幾何模型 信號源的接收
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2013)05-1211-02
新型計算機視覺圖像精密測量是一種基于計算機程序設計以及圖像顯示的高精度的關鍵技術,它廣泛用于測量的領域,對于測量的準確性有很好的保證。這種關鍵技術是幾何了光學的特性,發(fā)揮了圖像學的顯影性,把普通的測量技術瞬間提升到了一個新的高度。在這項關鍵技術中包含了物理學中光的效應,圖像中的傳感器以及計算機中的編程軟件,這還不完全,還有一些其他科學領域知識的輔助,可以說這項關鍵技術是一個非常有技術含量的技術,很值得學者進行研究。
1 計算機視覺圖像精密測量的關鍵技術的具體形式
在以往的測量中,選擇的測量方式還是完全采用機械的形式,但是在使用了計算機視覺圖像精密測量后,完成了許多以往技術所不能達到的任務。在我們的研究中,計算機視覺圖像測量的原理是通過攝像機將被處理的對象采集進行影像采集,在多個控制點的數(shù)據(jù)采集完成后,系統(tǒng)會自動將這些圖像進行整合,得出相關的幾何多變參數(shù),再在計算機上以具體的數(shù)據(jù)顯示出來,以供技術人員使用參照。
在上面所說的攝像機并不是我們通常意義上生活中使用的攝像機。它是一種可視化較強,表針比較敏感的測試儀??梢詫⒁曈X中的二維形態(tài)通過顯影,記錄在機械的光譜儀上,再將這種的二維圖像做數(shù)學處理,有二階矩陣轉換為三階矩陣,通過播放儀呈現(xiàn)出三維的影像。這時的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對于原始的圖像進行預處理,不再經(jīng)過有曝光這個程序,將圖像中關鍵點的坐標在整個內(nèi)部軸面上體現(xiàn)出來,提取數(shù)據(jù)幀數(shù),再運用機器的智能識別系統(tǒng),對控制點的坐標進行數(shù)據(jù)分析,自動生成圖形,這也可以用于精密測量。它的優(yōu)點就是使用上極其的方面,基本只要架立儀器和打開開關,其他的工作機械系統(tǒng)都會自動的完成。使用的困難就是造價極其的高,不適合一般企業(yè)使用。在基于計算機視覺圖像測量中使用上的原理如下:
1) 計算出觀察控制點到計算機視覺圖像測量儀器的有效距離;
2) 得出觀察點到目標控制點之間的三維的運動幾何參數(shù);
3) 推斷出目標控制點在整個平面上的表面特征( 大多時候要求形成立體視覺);
4) 還通過觀察可以判斷出目標物體的幾何坐標方位。
在整個計算機視覺圖像精密測量的關鍵技術中最關鍵的元件就是壓力應變電阻儀,這也是傳感器的一部分。壓力應變電阻儀的使用方式是將應力片粘貼在控制點位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風干后就可以黏貼應力片,通過導線的聯(lián)接,形成了一小段閉合的電路,時刻讓計算機視覺圖像系統(tǒng)可以感應到并作跟蹤觀察。因受到來自不同方面諧波的影響后,應力片會產(chǎn)生一定數(shù)值的電阻,在電路中,這些電阻會轉化為電流,視覺圖像系統(tǒng)接收到了電流后就會顯示在儀表盤上相應的數(shù)據(jù),我們就可以根據(jù)儀表盤中的數(shù)據(jù)記錄測量中的數(shù)據(jù),很好的解決了原始機械在使用過程中大量的做無用功所消耗資源的現(xiàn)象。傳感器對每個應點都進行動態(tài)的測量,將數(shù)據(jù)模轉換成現(xiàn)實中的圖像,精確的成像可以測算出控制點的位置,用計算機視覺圖像精密測量結合數(shù)據(jù)方面的相關的分析,得出施工中的可行性報告分析,減低了施工中的成本,將施工的預算控制在一個合理的范圍之內(nèi)。
當無法觀察到控制點是,計算機視覺圖像精密測量可以通過接收信號或是相關的頻率波段來收集數(shù)據(jù),不會因為以往測量的環(huán)境不好,距離太遠,誤差太大的影響。
2 計算機視覺圖像精密測量的關鍵技術分析
在計算機視覺圖像精密測量的關鍵技術中解決了很多以往很難完成的任務,但是在使用過程中還是發(fā)生了很多的問題。尤其在視覺圖像的選擇中,無法使用高幀數(shù)的圖片顯示,無法將計算機視覺圖像精密測量的關鍵技術的優(yōu)點發(fā)揮出來。我們就計算機視覺圖像精密測量的關鍵技術中常見的問題進行討論。
2.1 降低失誤的概率
在很多的數(shù)據(jù)誤差中,有一部分是出現(xiàn)在人為的因素上面。對于機器的不熟悉和操作中的疏忽都會在一定程度上對圖像的視覺感模擬帶來麻煩。對于網(wǎng)絡設備的配置上,要經(jīng)常性的學習,將配置在可能的情況下設置的更加合理和使用,保證網(wǎng)絡連接系統(tǒng)的安全性。為防止更多因操作帶來的誤差,選用系統(tǒng)登入的制度,用戶在通過識別后進入系統(tǒng),在采集數(shù)據(jù)后,確定最終數(shù)據(jù)上又相關的再次確定的標識,系統(tǒng)對本身有的登錄服務器和路由器有相關的資料解釋,記錄好實用操作的時間,及時備份。
2.2 對于權限的控制
權限控制是針對測量關鍵所提出的一種安全保護措施,它是在使用計算機視覺圖像精密測量的關鍵技術中對用戶和用戶組賦予一定的權限,可以限制用戶和用戶組對目錄、子目錄、文件、打印機和其他共享資源的瀏覽和更改。圖像中的運行服務器在停止的情況下可以做出不應答的操作指令,立刻關閉當前不適用的界面,加快系統(tǒng)的運行速度,對于每天的日志文件實時監(jiān)控,一旦發(fā)現(xiàn)問題及時解決。對于數(shù)據(jù)終端的數(shù)據(jù)可采用可三維加密的方法,定時進行安全檢測等手段來進一步加強系統(tǒng)的安全性。如果通過了加密通道,系統(tǒng)可以將數(shù)據(jù)自動的保存和轉換為視圖模式,對于數(shù)據(jù)的審計和運行可以同時進行,這樣就可以很好的保證大地測量中的圖像數(shù)據(jù)安全,利用防護墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進一步改善計算機視覺圖像精密測量的關鍵技術。
2.3 開啟自動建立備份系統(tǒng)
計算機視覺圖像精密測量的關鍵技術的完善中會常遇到系統(tǒng)突然崩潰或是圖像受到嚴重干擾導致無法轉換的一系列情況,發(fā)生這種情況最大的可能性就是系統(tǒng)在處理多組數(shù)據(jù)后無法重新還原成進入界面。這時為保證圖片轉換成數(shù)字的系統(tǒng)數(shù)據(jù)不丟失,我們對系統(tǒng)進行備份。選定固定的磁盤保存數(shù)據(jù),定期將產(chǎn)生的數(shù)據(jù)(轉換前的圖像和轉換后的數(shù)值)導出,保證程序的正常運行。當系統(tǒng)一旦發(fā)生錯誤,可以盡快的恢復數(shù)據(jù)的初始狀態(tài),為測量任務的完成爭取更多的時間。我們還要減少信號源周圍的干擾,定期的更新系統(tǒng)數(shù)據(jù)庫,保持數(shù)據(jù)采集的穩(wěn)定性,把攝像機記錄出的數(shù)據(jù)節(jié)點保存在相應的技術圖紙上,用這樣的方式來知道測量工作。系統(tǒng)備份的數(shù)據(jù)還可以用于數(shù)據(jù)的對比,重復測量后得出的數(shù)據(jù),系統(tǒng)會自動也備份的數(shù)據(jù)進行比對,發(fā)現(xiàn)誤差值在規(guī)定以外,就會做出相應的預警,這樣也能在工作中降低出現(xiàn)誤差的概率。
3 計算機視覺圖像精密測量的關鍵技術遇到的困難和使用前景
計算機視覺圖像精密測量的關鍵技術作為一種新興技術在使用時間上不過十幾年,其使用的程度已經(jīng)無法估算。正是因為它的簡單、使用、精度高以及自動化能力卓越的特點受到了測量單位的廣泛青睞。在測量方面的這些可靠性和穩(wěn)定性也是有目共睹的。在土木和機械測量的行業(yè)計算機視覺圖像精密測量的關鍵技術都會有廣泛和良好的使用,前景也是十分的廣闊。但是不容忽視該技術也有一些弊端。這項關鍵技術中涵蓋的學科非常的多,涉及到的知識也很全面,一旦出現(xiàn)了機器的故障,在維修上還是一個很大的問題,如何很好的解決計算機視覺圖像技術的相關核心問題就是當下亟待解決的。
我們都知道,人的眼睛是可以受到吱聲的控制,想要完成觀測是十分簡單的,但是在計算機視覺圖像技術中,畢竟是采取攝像機取景的模式,在取得的點位有的時候不是特別的有代表性,很難將這些問題具體化、形象化。達不到我們設計時的初衷。所以在這些模型的構建中和數(shù)據(jù)的轉換上必須有嚴格的規(guī)定和要求,切不可盲目的實施測量,每項技術操作都要按規(guī)程來實施。
上文中也談到了,計算機視覺圖像精密測量的關鍵技術中最主要的構建是傳感器,一個合理的傳感器是體統(tǒng)的“心臟”,我們在儀器的操作中,不能時時刻刻對傳感器進行檢查,甚至這種高精度的元件在檢查上也并不是一件簡單的事情,通過不斷的研究,將傳感器的等級和使用方法上進行一定的創(chuàng)新也是一項科研任務。
4 結束語
在測量工程發(fā)展的今天,很多的測量技術已經(jīng)離不了計算機視覺圖像技術的輔助,該文中詳細的談到了基于計算機視覺圖像精密測量的關鍵技術方面的研究,對于之中可能出現(xiàn)的一些問題也提出了相應的解決方案。測量工程中計算機視覺圖像精密測量的關鍵技術可以很好的解決和完善測量中遇到的一些問題,但是也暴露出了很多的問題。
將基于計算機視覺圖像精密測量的關鍵技術引入到測量工程中來,也是加強了工程建設的信息化水平。可以預見的是,在未來使用計算機視覺圖像技術建立的測量模型會得到更多、更好的應用。但作為一個長期復雜的技術工程,在這個建設過程中定會有一些困難的出現(xiàn)。希望通過不斷的發(fā)現(xiàn)問題、總結經(jīng)驗,讓計算機視覺圖像精密測量的關鍵技術在測量中作用發(fā)揮的更好。
參考文獻:
[1] 湯劍,周芳芹,楊繼隆.計算機視覺圖像系統(tǒng)的技術改造[J].機電產(chǎn)品開發(fā)與創(chuàng)新周刊,2005,14(18):33-36.
[2] 段發(fā)階,等. 拔絲??仔斡嬎銠C視覺檢測技術[J]. 光電工程時報, 1996,23(13):189-190.
1計算機視覺概述
1.1計算機視覺學概述
從某種意義上說,計算機視覺學是一門在20世紀60年代興起的新學科。它是一門邊緣學科,融入了很多學科的特點,具有很強的工程性特征。比如,圖像處理、應用數(shù)學、光電技術。換個角度來說,計算機視覺同屬于工程領域、科學領域。
1.2計算機視覺的應用
計算機視覺的應用能夠使計算機具有和人一樣的視覺功能。在生活和生產(chǎn)過程中,照片資料、視頻資料的處理是計算機視覺應用的主要方面。比如,在航空事業(yè)方面,對衛(wèi)星照片的翻譯;在醫(yī)學領域中,主要用于輔方面的診斷;在工業(yè)生產(chǎn)方面,由于各種復雜因素的影響,計算機視覺在這方面的應用顯得特別簡單,有利于相關系統(tǒng)的實際構成。
2目標圖像檢索存在的問題
從某種角度來說,目標圖像檢索需要分為特征匹配、特征提取兩個方面。它們表達了不同的含義。對于特征提取來說,它是圖像進行檢索的第一步,其提取結果會對進一步的研究造成直接的影響。而對于特征匹配來說,其匹配的準確度會直接影響圖像檢索系統(tǒng)的返回結果。但在目標圖像檢索完善的過程中,遇到一些問題阻礙了這兩個方面的完善。因此,本文作者對其中的一些予以了相關的探討。
2.1環(huán)境因素不斷變化
對于目標圖像來說,環(huán)境因素是影響其準確率的重要因素。同時,在復雜混亂的環(huán)境中,由于受到眾多干擾物的影響,加上部分目標圖像區(qū)域被遮蓋,致使目標圖像信息不夠全面,使目標物體特征的提取難度進一步加大。
2.2圖像噪聲的影響
子為了更好地模仿生活中的圖像檢索,數(shù)據(jù)庫中的圖像也會隨之發(fā)生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會使目標物體的外觀發(fā)生對應的變化。在此基礎上,嚴重降低了目標圖像信息獲取的準確度。
2.3目標圖像檢索訓練數(shù)據(jù)的自動標注
由于處于網(wǎng)絡中的圖像資源信息過于繁多,需要采用手工的方式對它們進行標注。但這種方法非常浪費時間,準確率也比較低。很顯然,這就需要目標檢索圖像能夠具有自動標注的能力。實際上,圖像檢索方法過分依賴人工標注信息。而這些信息很多收到來自各方面因素的影響。比如,認識差異因素、個人經(jīng)驗。以至于對圖像產(chǎn)生誤解。
3基于計算機視覺下的目標圖像檢索技術
3.1以多尺度視覺為紐帶的目標圖像檢索方法
該種目標檢索技術的應用主要是為了提高目標圖像檢索的準確率,能夠實現(xiàn)目標圖像訓練數(shù)據(jù)的自動化標注。該類技術主要是用于那些沒有遮擋,不需要進行監(jiān)督的目標圖像檢索方面。具體來說,它需要經(jīng)過一系列的訓練。在訓練的過程中,以統(tǒng)計學習為紐帶,對相應多尺度的目標檢測模型進行適當?shù)挠柧?。在此基礎上,以該模型為基點,對圖像中那些顯著性的區(qū)域進行合理地提取。比如,該區(qū)域的亮度、顏色。最后,需要對用于該實驗研究中的概率潛在語義分析模型進行合理地利用。總之,利用這種檢索方法可以對圖像中那些顯著目標所處的區(qū)域自動進行檢測。同時,對其中目標圖像的顯著性進行合理地排序,能夠提高檢索引擎所返回圖像結果的準確度。
3.2以彩色LBP局部紋理特點為媒介的目標圖像檢索方法
這種目標圖像檢索方法能夠有效地解決圖像信息采集過程圖像噪聲以及其它相關因素對所提取紋理特征的影響,提高了圖像目標的準確率。對于這種圖像目標檢索方法來說,它把圖像彩色空間特征和簡化的LBP特征有機地相融合。在此基礎上,該類方法增加了光照的不變特性,卻保留了LBP局部的旋轉特點。在提高圖像檢索速度方面,主要是利用原來的LBP特征來丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時,這種目標圖像檢索方法的應用可以使對應計算方法的難度得以降低,還能對角度等變化狀態(tài)下的目標圖像進行準確地識別以及檢索。
3.3以視覺一致性為橋梁的目標圖像檢索方法
從某個角度來說,它的應用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對搜索引擎返回結果的目標顯著圖予以準確的計算。此外,還要對其中的目標顯著系數(shù)進行適當?shù)剡^濾。二是:以所有圖像為基點,以顯著目標為導向,采取視覺一致性的模式。三是:以視覺一致性為基礎,對其中的不同目標圖像信息進行客觀地分類。這種以視覺一致性為核心的方法能夠有效地提高圖像檢索結果的準確率。更重要的是,在提高圖像搜索引擎檢索性能的同時,能夠及時為用戶選出最優(yōu)的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關。
4結語
關鍵詞:計算機視覺系統(tǒng) 工業(yè)機器人 探究
中圖分類號:TP242 文獻標識碼:A 文章編號:1007-9416(2015)05-0000-00
計算機視覺系統(tǒng)主要是為了工業(yè)機器人更好的工作而研發(fā)出來的,是一套裝有攝像機視場的自動跟蹤與定位的計算機視覺系統(tǒng)。近年來,機器人已經(jīng)廣泛使用于工業(yè)生產(chǎn),但是多數(shù)機器人都是通過“示教-再現(xiàn)”的模式工作,在工業(yè)機器人工作是都是由操作員進行操作示范再由機器人跟著示范進行工作。由于機器人缺乏對外界事物的識別能力,工作中經(jīng)常發(fā)生偏差或者位移等情況。由于工作環(huán)境的惡劣以及各種阻礙,為了提高工業(yè)機器人的工作效率、靈活性、適應性等,讓機器人更好的識別外部環(huán)境并及時調(diào)整運作方向,能更好的發(fā)揮其作用,在原有的機器人系統(tǒng)中添加了一套計算機視覺系統(tǒng),利用計算機視覺圖像裝置的信息,通過圖像使機器人進行外部環(huán)境的識別處理,采用三維的重建,通過作業(yè)中利用三維圖像的信息進行計算,采用Motocom32軟件和機器人控制柜通訊等設備,對工業(yè)機器人進行控制,更好的實現(xiàn)機器人對空間特點的跟蹤與定位。
1系統(tǒng)的結構與原理
本文主要針對Motoman UP6工業(yè)機器人系統(tǒng)的二次研究,在原有的工業(yè)機器人的系統(tǒng)中,增加了一套計算機視覺系統(tǒng), 使工業(yè)機器人更好的識別外界環(huán)境的系統(tǒng)。計算機視覺系統(tǒng)主要包括:Panasonic CCD攝像機、Motoman UP6工業(yè)機器人系統(tǒng)、工控機、OK C-50圖像采集卡等外部設備。工業(yè)機器人的整個系統(tǒng)由原有系統(tǒng)與計算機視覺系統(tǒng)組成,在原有的系統(tǒng)中包含了YASNAC-XRC- UP6機器人控制柜、Motoman UP6工業(yè)機器人本體、示教編程器、Motocom32系統(tǒng)以及相關的外部設備等[1]。計算機視覺系統(tǒng)的設備主要有Panasonic CCTV攝像機、AVENIR TV鏡頭、OK系列C-50圖像采集卡、工控機、AVENIR TV鏡頭、Panasonic CCD攝像機、OK系列C-50圖像采集卡形成的視頻采集系統(tǒng)主要是捕獲物體的圖像,該功能主要是分三個層次進行圖像處理、計算、變換以及通信等功能來實施工控機。利用遠程控制來對工業(yè)機器人進行Motocom32系統(tǒng)進行通信。
2計算機視覺系統(tǒng)的構建
2.1硬件的組成
CCD攝像頭:選用的CCD攝像機采用PAP-VIVC810AOZ型彩色攝像頭,如圖1。攝像機的像素為P:500(H)x582(V),N:510(H)x 492(V),攝像機的分辨率為420。攝像機的成像器使用1/33"CCD,信噪>48 dB,同時攝像機具有自動背景光補償、自動增益控制等功能。
圖像采集卡:圖像采集卡主要采用CCD攝像頭配套的MV-200工業(yè)圖像處理。如圖2所示。MV-200圖像采集卡的分辨率、圖像清晰度具有較高的穩(wěn)定性,其真彩色實施工業(yè)圖像采集卡,該圖像采集卡的硬件構造、地層函數(shù)都具有穩(wěn)定性,同時在惡例的環(huán)境中都可以穩(wěn)定運行[2]。圖像采集卡的圖像采集效果非常好,畫面效果非常流暢。
MV-200圖像采集卡性能特點:其分辨率為768 x 576,具有獨特的視頻過濾技術,使圖像質(zhì)量的采集、顯示更加清晰流暢。主要支持的系統(tǒng)為Win98 /2K/XP,主要用于人工智能、事物識別、監(jiān)控等多種領域。
工控機:工控機以奔4系列為主。
2.2軟件組成
圖像匹配軟件。
圖像處理與獲取軟件。
定標和定位算法軟件,功能分布如圖3所示。
3視覺系統(tǒng)的原理及流程圖
工業(yè)機器人的主要系統(tǒng)包括是由工業(yè)機器人本體、相關的外部設備、控制器(供電系統(tǒng)、執(zhí)行器等)計算機視覺系統(tǒng)主要由三部分組成:圖像處理和獲取、圖像匹配、攝像機的定位等組成。通過借助OpenCV的視覺庫進行VC++.NET實行,流程如下圖表4所示。
在本視覺系統(tǒng)運行中,需要對攝像機實行定標,建立實際空間點和攝像機的對應點。在定標的過程中,就需要標記基準點,使攝像機在采集圖像時可以準確的把這些基準點投放到攝像機的坐標上[3]。同時在采集卡的圖像中,對圖像進行處理并計算出該基準點圖像的坐標,通過定標計算法,從而得出攝像機的參數(shù)。
在機器人系統(tǒng)中的反饋,計算機通過C語言的調(diào)節(jié)圖像采集卡進行動態(tài)鏈接來控制函數(shù)[4]。同時,對攝像機中的數(shù)據(jù)、視頻信號進行采集,構成數(shù)字化的圖像資料,采用BMP格式存儲進行計算,在計算機上顯示活動視頻,然后系統(tǒng)對獲取的圖像進行分析處理,以及對噪聲的去除、圖像的平滑等進行處理,利用二值化處理對那些灰度閥值的圖像進行處理,同時檢測計算機獲取圖像的特征量并計算[5]。在完成圖像的處理后,就需要確立圖像的匹配特征,對圖像進行匹配[6]。如果兩個圖像不重疊,就需要建立3D數(shù)據(jù)庫進行模型重新選擇,再把模型進行計算、投影計算、坐標更換等指令,直到找到與圖像相匹配的數(shù)據(jù)模型,才能真正得到真實有效的圖像。重疊時,要獲得有效的圖像,以工業(yè)機器人識別物體為目的,才能建立機器人系統(tǒng)之間的通信。同時,通過三維圖像重建,進行機器人空間定位[7]。如下圖表5所示。
4結語
綜上所述,計算機視覺系統(tǒng)主要是為了工業(yè)機器人更好的工作而研發(fā)出來的,是一套裝有攝像機視場的自動跟蹤與定位的計算機視覺系統(tǒng)。通過3D數(shù)據(jù)模型指定目標,機器人系統(tǒng)利用計算機視覺圖像的采集裝置來識別外界環(huán)境的數(shù)據(jù),經(jīng)過圖像的姿態(tài)預算、影像的投影計算產(chǎn)生圖像,通過圖片的合成比較,以此來實現(xiàn)機器人在工作中對物體的識別。利用計算機系統(tǒng)對機器人進行有效的控制,在工業(yè)機器人工作中對事物目標的搬運、跟蹤、夾持等指令。計算機視覺系統(tǒng)具備清晰的視覺功能,有利于提高工業(yè)機器人的靈活性以及適應性。
參考文獻
[1]夏群峰,彭勇剛.基于視覺的機器人抓取系統(tǒng)應用研究綜述[J].機電工程,2014(06):221-223.
[2]華永明,楊春玉.機器人視覺系統(tǒng)在立體編織自動鋪紗過程中的應用研究[J].玻璃纖維,2011(01):189-191.
[3]王培屹.基于多傳感器多目標實時跟蹤視覺系統(tǒng)在全自主機器人上的應用[J].軟件導刊,2011(01):263-264.
[4]譚民,王碩.機器人技術研究進展[J].自動化學報,2013(07):123-125.
[5]鮑官軍,荀一,戚利勇,楊慶華,高峰.機器視覺在黃瓜采摘機器人中的應用研究[J].浙江工業(yè)大學學報,201(01):93-95.
2013年4月,何搏飛辭去了一家美國上市公司中國區(qū)總經(jīng)理的職務。他用幾個月的時間在中國尋找創(chuàng)業(yè)伙伴,結果卻讓人失望。當時,他已經(jīng)做好打算,和這個團隊隨便聊半個小時,然后就飛去美國硅谷。
何搏飛推開門,看見幾個光著上身的年輕人坐在電腦前,整個屋子被各種大小的顯示屏圍繞。隨后,他和團隊CTO趙勇從下午兩點一直聊到了凌晨兩點,就決定加入擔任CEO。這家公司的名字叫做“格靈深瞳”。
格靈深瞳是一家計算機視覺和人工智能的技術公司,通過深度數(shù)據(jù)和機器學習算法讓計算機主動獲取三維視覺信息,并進行精確的實時智能分析。簡單來說,他們想讓計算機像人一樣,看見并理解這個世界。
“計算機視覺的技術已經(jīng)存在了幾十年,我們想要做第一個將計算機視覺商業(yè)化的公司?!焙尾w說。切入智能安防監(jiān)控領域是格靈深瞳選擇將計算機視覺商業(yè)化的第一步。今年6月,格靈深瞳獲得了紅杉資本數(shù)千萬美元的A輪融資。10月,其智能安防系統(tǒng)開始在國有四大銀行中的三大銀行進行試點。
格靈深瞳CTO趙勇創(chuàng)業(yè)之前在Google工作,是Google Glass的核心研發(fā)團隊成員之一。Google的工作原則是80/20,員工可以利用20%的時間自由創(chuàng)新。趙勇利用空閑的時間,重新開始研究自己在美國博士期間的研究方向―計算機視覺的人工智能。
計算機視覺過去主要建立在光學鏡頭采集的二維圖像上。光學鏡頭在生成圖像時,會丟失掉一個維度“深度”,只保留長度和寬度。當時人們覺得,通過二維圖像加上算法,就能夠讓計算機看懂世界。但趙勇和他布朗大學的博士導師并不同意這個觀點。他們堅持認為,計算機必須要通過三維信號才能夠看懂這個世界。因此,他們主張要增加“深度”這一維度的信息?!拔覀冇袃芍谎劬?,就是為了判斷深度。人腦比計算機聰明多少倍?人腦進行判斷還需要三個維度的信息,計算機只通過兩個維度怎么能夠準確判斷?”何搏飛對《第一財經(jīng)周刊》說。格靈深瞳的這一代智能安防系統(tǒng)上一共裝有3個鏡頭。一個是和普通安防系統(tǒng)一樣的RGB攝像頭,另外兩個用來發(fā)射和接收激光。激光發(fā)射鏡頭能夠在1/30秒的時間里發(fā)送36萬束激光,安防系統(tǒng)借助它們掃描出現(xiàn)實世界的三維立體圖像。
這3個鏡頭就相當于計算機的“眼睛”。格靈深瞳所做的,不僅是給計算機裝上“眼睛”,而且給計算機設置了一套“視網(wǎng)膜神經(jīng)系統(tǒng)”,讓計算機能夠看懂“眼睛”里出現(xiàn)的東西。
借助機器學習算法,格靈深瞳的系統(tǒng)能夠同時分辨多人的運動軌跡和行動速度,并一一精確記錄。比如早上8時的北京地鐵站,人群正處于早高峰極端擁擠的狀態(tài),格靈深瞳可以從中分辨出一個穿紅衣服的女孩,精確跟蹤她在人群中的行走軌跡。同時,格靈深瞳的系統(tǒng)還能夠監(jiān)測人類肢體的運動幅度和速度,從而精確識別人們的姿勢和正在做的事情。
最初,趙勇和團隊已經(jīng)解決了基本的技術問題,但還沒有想好商業(yè)化應該選擇的行業(yè)。辦公區(qū)域前的大黑板上密密麻麻地寫著80多條可能的商業(yè)化方向,包括安防、教育、醫(yī)療等等。這些是格靈深瞳團隊的工程師們一個晚上頭腦風暴之后的成果。
“你們這是科學家在實驗室里想問題的方式?!笔煜ど虡I(yè)的何搏飛對趙勇說?!叭绻耢`深瞳的目標是成為全球最好的計算機視覺和人工智能公司,最需要的是什么?”“海量的數(shù)據(jù)?!壁w勇說。
要獲得海量的數(shù)據(jù),有兩種方法。第一個是像Google街景一樣,自己到各地去拍攝采集。另外一種,是通過現(xiàn)成的行業(yè)和設備實現(xiàn)。有沒有一個行業(yè),已經(jīng)在所有能夠采集數(shù)據(jù)的地方都裝上了攝像頭?趙勇和何搏飛同時想到了安防。安防是一個足夠大的市場。2013年中國安防市場的復合增長率為30%,銷售收入約為4000億元。美國的攝像頭與人口比是1:10,但在中國的北京和上海這個數(shù)字還只是1:50。
更難得的是,格靈深瞳的技術正可以解決安防領域目前面臨的兩個難題―看不見和找不到。一方面,一個安保人員往往要同時負責監(jiān)看100多個攝像頭,隨便里面某個攝像頭拍攝到突發(fā)事件,當時就被監(jiān)控人員發(fā)現(xiàn)的可能性非常小。另一方面,想要查找監(jiān)控錄像中的某一段錄像也非常困難,就算快進,一段6個小時的視頻也得近1個小時才能看完。而格靈深瞳的智能計算機視覺系統(tǒng)可以很好地解決這些問題。
選擇安防領域作為商業(yè)化切入口之后,趙勇和何搏飛開始分析市場和客戶。他們發(fā)現(xiàn)安防系統(tǒng)在機場、火車站、廣場等場景應用最多。但場景一多,很多東西就無法控制。他們希望首先找到一個具有高度可復制性的場景,他們將目光投向了銀行?!爸袊你y行幾乎都長得一模一樣。由于銀監(jiān)會有嚴格的條例規(guī)定,它們的需求也都一樣。而且銀行本身底子厚,它們有很強的應用安防新技術的動力?!焙尾w告訴《第一財經(jīng)周刊》。
一開始跟銀行談合作時,何搏飛和趙勇將重點放在了暴力事件的監(jiān)控和報警上面。但他們發(fā)現(xiàn)實際情況并不如自己所想。暴力事件的概率極小,因此在很長一段時間內(nèi),格靈深瞳無法向銀行展示出產(chǎn)品優(yōu)勢。
銀行的工作人員告訴他們,比起外部風險,銀行更頭疼的是內(nèi)部風險。銀行一直有雙人加鈔的規(guī)定,一個人保管鑰匙,一個人保管密碼。但這條規(guī)定執(zhí)行得并不好,就算排班排了兩人,也常出現(xiàn)一個人出去抽支煙,另一個人自己加鈔的情況。媒體曾經(jīng)報道有顧客在ATM機中取出過假鈔,就是加鈔過程中出了問題。
何搏飛和趙勇將這點作為了產(chǎn)品的突破口。經(jīng)過一段時間的研發(fā),他們的安防監(jiān)控已經(jīng)能夠確保當ATM機的加鈔蓋子被打開的時候,必須有兩個人在場。甚至當一個人輸入密碼時,另一個人沒有轉過身,系統(tǒng)都能夠自動報警。銀行長久以來的難題被格靈深瞳解決了,它們開始接受格靈深瞳成為自己的安防合作伙伴。2013年12月,格靈深瞳進入全國網(wǎng)點最多的銀行中國農(nóng)業(yè)銀行進行無人監(jiān)控安防測試。2014年10月,格靈深瞳在國有四大銀行的三大銀行中進行大規(guī)模推廣試點,測試地區(qū)包括北京、重慶等省市。
分布式計算是一種計算方法,和集中式計算是相對的。隨著計算技術的發(fā)展,有些計算應用需要非常巨大的計算能力才能完成,如果采用集中式計算,需要耗費相當長的時間來完成。簡單來說,分布式計算將該應用分解成許多小的部分,分配給多臺計算機進行處理。這樣可以節(jié)約整體計算時間,大大提高計算效率。本書使用開源工具及相應技術的開發(fā)并實現(xiàn)了大規(guī)模分布式處理系統(tǒng),提出了構建高性能分布式計算系統(tǒng)的先進材料,提供實際的指導、相關練習以及軟件框架的理論描述。
全書分為2部分,共8章。第1部分 高性能分布式計算的編程基礎,包括1-4章:1.引言:包括分布式系統(tǒng)的介紹、分類,分布式計算體系結構與分布式文件系統(tǒng),最后指出分布式系統(tǒng)面對的挑戰(zhàn)與發(fā)展趨勢;2.開始使用Hadoop:包括Hadoop的發(fā)展歷史、生態(tài)系統(tǒng)、HDFS的特性、單個節(jié)點的集群安裝與多個節(jié)點的集群安裝,最后介紹Hadoop編程與流;3.從Spark開始:包括Spark裝置、應用實例、Python編程及應用等內(nèi)容;4.Spark和Scalding的內(nèi)部編程:包括其安裝步驟與編程指南。第2部分 使用Hadoop、Scalding和Spark的實例,包括5-8章:5. 案例研究1:使用Scalding和Spark進行數(shù)據(jù)聚類:包括聚類技術、聚類過程、K均值算法和相應的例子,最后進行實現(xiàn);6.案例研究2:使用Scalding和Spark進行數(shù)據(jù)分類:包括分類及概率論的相關概念,樸素貝葉斯及其分類器的實現(xiàn),最后對Scalding的實現(xiàn)進行實驗并說明結果;7.案例研究3:使用Scalding和Spark進行回歸分析:包括線性回歸的代數(shù)方法和梯度下降法,并分別使用Scalding和Spark進行了實現(xiàn);8.案例研究4:使用Scalding和Spark的推薦系統(tǒng):包括推薦系統(tǒng)的介紹、技術應用、實現(xiàn)規(guī)則并使用Scalding和Spark進行了實現(xiàn)。
作者K.G. Srinivasa是卡內(nèi)基梅隆大學計算機科學學院機器人研究所的副教授;是電腦專業(yè)資格認定協(xié)會(ICCP,International Conformity Certification Programm)、國際計算機視覺期刊(IJCV,International Journal Computer Vision)、國際計算機視覺與模式識別會議(CVPR,Computer Vision and Pattern Recognition)等多個國際會議的委員會委員,發(fā)表超過20篇期刊及會議論文。他的研究領域包括計算機視覺、圖像處理、動態(tài)場景的計算機視覺監(jiān)控、基于人的行為和生物特征的人物識別與身份鑒定以及數(shù)字多媒體數(shù)據(jù)的水印處理等。
本書描述了構建高性能分布式計算大規(guī)模數(shù)據(jù)處理的軟件系統(tǒng)新模式的基本原理;介紹了Hadoop生態(tài)系統(tǒng)并一步步地指導安裝、編程和執(zhí)行;對Spark的基礎知識,包括彈性分布式數(shù)據(jù)集進行了介紹,并對使用Spark和Scalding進行數(shù)據(jù)聚類、分類和回歸進行了分析,提供了詳細的案例研究方法;最后使用Scalding和Spark實現(xiàn)了一個實用推薦系統(tǒng)。本書適合計算機體系結構、計算智能、數(shù)據(jù)挖掘等專業(yè)的科研人員及研究生閱讀參考。