公務員期刊網(wǎng) 精選范文 計算機視覺理論與方法范文

計算機視覺理論與方法精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺理論與方法主題范文,僅供參考,歡迎閱讀并收藏。

計算機視覺理論與方法

第1篇:計算機視覺理論與方法范文

隨著計算機技術(shù)以及圖像處理技術(shù)的快速發(fā)展,計算機視覺技術(shù)作為一種新興的技術(shù),其被廣泛應用在軍事、醫(yī)學、工業(yè)以及農(nóng)業(yè)等領域[1]。一般而言,計算機及視覺技術(shù)應用在農(nóng)業(yè)的生產(chǎn)前、生產(chǎn)中以及生產(chǎn)后等各個環(huán)節(jié),其主要就是鑒別植物種類,分級和檢測農(nóng)產(chǎn)品的品質(zhì)。計算機視覺相較于人類視覺而言,其具有更多的優(yōu)點,能夠有效提高農(nóng)業(yè)的生產(chǎn)率,實現(xiàn)農(nóng)業(yè)生產(chǎn)與管理的智能化和自動化,促進農(nóng)業(yè)的可持續(xù)發(fā)展。

一、計算機視覺技術(shù)概述

計算機視覺主要是指利用計算機來對圖像進行分析,從而控制某種動作或者獲取某描述景物的數(shù)據(jù),是人工智能與模式識別的重要領域。計算機視覺興起于20世紀70年代,其涉及的學科范圍較為廣泛,包括視覺學、CCD技術(shù)、自動化、人工智能、模式識別、數(shù)字圖像處理以及計算機等。就目前而言,計算機視覺技術(shù)主要以圖像處理技術(shù)為核心,是通過計算機視覺模擬人眼,并利用光譜對作物進行近距離拍攝,運用數(shù)字圖像處理以及人工智能等技術(shù),對圖像信息進行分析和研究。計算機視覺技術(shù)主要步驟包括采集圖像、分割圖像、預處理、特征提取、處理和分析提取的特征等[2]。

二、農(nóng)業(yè)機械中計算機視覺技術(shù)的應用分析

一般而言,農(nóng)業(yè)機械中計算機視覺技術(shù)的應用,主要表現(xiàn)在以下三個方面:一是田間作業(yè)機械中的應用;二是農(nóng)產(chǎn)品加工機械中的應用;三是農(nóng)產(chǎn)品分選機械中的應用。

(一)田間作業(yè)機械中的應用

在田間作業(yè)機械中,計算機視覺技術(shù)的應用較晚。近年來,由于環(huán)境保護政策的提出,在農(nóng)田作業(yè)的播種、植保以及施肥機械中的應用越來越廣泛。在田間作業(yè)的過程中應用計算機視覺技術(shù)時,主要應用在苗木嫁接、田間鋤草、農(nóng)藥噴灑、施肥以及播種等方面[3]。為了有效識別雜草,對除草劑進行精確噴灑,相關(guān)研究人員分析了美國中西部地區(qū)常見的大豆、玉米以及雜草二值圖像的形態(tài)學特征,發(fā)現(xiàn)植物長出后14~23天內(nèi)能夠有效區(qū)別雙子葉和單子葉的效果,準確率最高達到90%。在1998年開發(fā)出Detectspary除草劑噴灑器,其能夠有效識別雜草,在休耕季節(jié)時,其相較于播撒而言,能夠減少19%~60%的除草劑用量。在農(nóng)業(yè)生產(chǎn)中,農(nóng)藥的粗放式噴灑是污染嚴重,效率低下的環(huán)節(jié),為了有效改變這種現(xiàn)狀,Giler D.K.等研制出能夠精量噴霧成行作物的裝置。該系統(tǒng)主要是利用機器視覺導向系統(tǒng),使噴頭能夠與每行作物上方進行對準,并結(jié)合作物的寬度,對噴頭進行自動調(diào)節(jié),確保作物的寬度與霧滴分布寬度具有一致性,從而有效節(jié)省農(nóng)藥。一般而言,該系統(tǒng)能夠促使藥量減少66%,提高霧滴沉降效率和施藥效率,減少農(nóng)藥對環(huán)境產(chǎn)生的影響。

(二)農(nóng)產(chǎn)品加工機械中的應用

隨著信息技術(shù)以及計算機技術(shù)的快速發(fā)展,計算機視覺技術(shù)被廣泛應用在農(nóng)產(chǎn)品加工的自動化中。如Jia P等提出了圖像處理算法,該算法主要是以鲇魚水平方向與主軸的形心位置和夾角為依據(jù),檢測鲇魚的方位以及背鰭、腹鰭、頭、尾的位置,從而確定最佳的下刀位置。此外,我國的黃星奕等人在研究胚芽米的生產(chǎn)過程時,在不經(jīng)過染色的情況下,對胚芽米的顏色特性等進行分析,得出胚芽米顏色特征的參數(shù)為飽和度S。同時利用計算機視覺系統(tǒng),自動無損檢測胚芽精米的留胚率,其結(jié)果與人工評定的結(jié)果大體一致。

(三)農(nóng)產(chǎn)品分選機械中的應用

在分級和鑒定農(nóng)產(chǎn)品的品質(zhì)時,可以利用計算機視覺技術(shù)對其進行無損檢測。一般計算機視覺技術(shù)不需對測定對象進行接觸,可以直接利用農(nóng)產(chǎn)品的表面圖像,分級和評估其質(zhì)量,其具有標準統(tǒng)一、識別率高一級效率高等優(yōu)勢。計算機視覺技術(shù)在檢測農(nóng)產(chǎn)品時,主要集中在谷物、蔬菜以及水果等方面。Chtioui Y等人提出了結(jié)合Rough sets理論,利用計算機視覺技術(shù)對蠶豆品質(zhì)的方法進行評價。該理論通過不同的離散方法對石頭、異類蠶豆、過小、破損以及合格等進行有效區(qū)分,并利用影色圖像,對其特征參數(shù)進行分類,最終分類的結(jié)果相比于統(tǒng)計分類結(jié)果,兩者具有較好的一致性。

第2篇:計算機視覺理論與方法范文

1.1自動化程度高

計算機視覺可以實現(xiàn)對農(nóng)產(chǎn)品的多個外形和內(nèi)在品質(zhì)指標進行同時檢測分析,可以進行整體識別、增強對目標識別的準確性。

1.2實現(xiàn)無損檢測

由于計算機視覺技術(shù)對農(nóng)產(chǎn)品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。

1.3穩(wěn)定的檢測精度

設計的運行程序確定后,計算機視覺技術(shù)的識別功能就會具有統(tǒng)一的識別標準,具有穩(wěn)定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。

2計算機視覺技術(shù)在食品檢測中的應用

20世紀70年代初,學者開始研究計算機視覺技術(shù)在食品工業(yè)中的應用,近幾十年電子技術(shù)得到快速發(fā)展,計算機視覺技術(shù)也越來越成熟。國內(nèi)外學者在研究計算機視覺技術(shù)在食品工業(yè)中的應用方面主要集中在該技術(shù)對果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識別、內(nèi)部無損檢測等方面。國內(nèi)有關(guān)計算機視覺技術(shù)在食品業(yè)中的應用研究起始于90年代,比國外發(fā)達國家晚20多年,但是發(fā)展很快。

2.1計算機視覺技術(shù)在果蔬分級中的應用研究

計算機視覺技術(shù)在食品檢測中的應用研究相當廣泛,從外部直徑、成熟度的檢測到內(nèi)部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的最大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標準所規(guī)定的5mm分類標準差,可在工業(yè)生產(chǎn)中很好應用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術(shù)在蘋果檢測與分級中的應用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎,結(jié)合模糊聚類知識利用計算機視覺技術(shù)來檢測蘋果缺陷域,檢測不僅快速而且結(jié)果精確。劉禾等[7]通過研究認為蘋果的表面缺陷可以利用計算機視覺技術(shù)進行檢測,計算機視覺技術(shù)還可以將蘋果按照檢測結(jié)果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應義斌等[8]通過計算機視覺技術(shù)、圖象處理技術(shù)、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡系統(tǒng),實現(xiàn)了具有精確度高、靈活性強和速度快等優(yōu)點的蘋果成熟度自動判別。陳育彥等[10]采用半導體激光技術(shù)、計算機視覺技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測蘋果表面的機械損傷和果實內(nèi)部的腐爛情況,初步驗證了計算機視覺技術(shù)檢測蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過計算機視覺技術(shù)對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統(tǒng)的檢測方法速度快、準確率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結(jié)果顯示準確率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數(shù)據(jù),對蘋果的外徑、體積、以及圓形度等參數(shù)進行處理,與人工檢測相比,計算機視覺技術(shù)具有檢測效率高,檢測標準統(tǒng)一性好等優(yōu)點。Blasco.J[15]通過計算機視覺技術(shù)分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實時監(jiān)測、品質(zhì)動態(tài)的智能分級系統(tǒng),能夠很好地實現(xiàn)蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應用計算機視覺技術(shù)檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其準確率均為92%,按果面損傷分級的準確率分別為76%和80%。

2.2計算機視覺技術(shù)在禽蛋檢測中的應用研究

禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級、品質(zhì)檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術(shù)來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗結(jié)果表明,計算機視覺技術(shù)對雞蛋蛋殼裂紋的檢測準確率高達98%。汪俊德等[19]以計算機視覺技術(shù)為基礎,設計出一套雙黃雞蛋檢測系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設計的數(shù)學模型對比來實現(xiàn)雙黃雞蛋的檢測和識別,檢測準確率高達95%。鄭麗敏等[20]人通過高分辨率的數(shù)字攝像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學模型來預測雞蛋的新鮮度和貯藏期,結(jié)果表明,計算機視覺技術(shù)對雞蛋的新鮮度、貯藏期進行預測的結(jié)果準確率為94%。潘磊慶等[21]通過計算機視覺技術(shù)和聲學響應信息技術(shù)相結(jié)合的方法檢測裂紋雞蛋,其檢測準確率達到98%。MertensK等[22]人基于計算機視覺技術(shù)研發(fā)了雞蛋的分級檢測系統(tǒng),該系統(tǒng)識別帶污漬雞蛋的正確率高達99%。

2.3計算機視覺技術(shù)在檢測食品中微生物含量的應用研究

計算機技術(shù)和圖像處理技術(shù)在綜合學科中的應用得到快速發(fā)展,在微生物快速檢測中的應用也越來越多,主要是針對微生物微菌落的處理。食品工業(yè)中計算機視覺技術(shù)在微生物檢測方面的研究和應用以研究單個細胞為主,并在個體細胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎,設計了一套應用計算機視覺技術(shù)快速定量檢測食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測結(jié)果與傳統(tǒng)方法的檢測結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時間,檢測時間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時間段測定培養(yǎng)基上的細胞密度,然后通過計算機技術(shù)建立時間和細胞密度之間的動態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計算機可以顯示被檢測菌落的具置,并且根據(jù)動態(tài)關(guān)聯(lián)計算機視覺系統(tǒng)可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術(shù)用于豬肉的分級進行了研究,結(jié)果顯示計算機視覺技術(shù)在識別豬肉表面微生物數(shù)量上與國標方法檢測的結(jié)果顯著相關(guān),該技術(shù)可以有效地計算微生物的數(shù)量。Bayraktar.B等[26]人采用計算機視覺技術(shù)、光散射技術(shù)(BARDOT)和模式識別技術(shù)相結(jié)合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態(tài)特征有,對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經(jīng)網(wǎng)絡、圖像處理等技術(shù),用分辨率為520萬像素的數(shù)字攝像機拍攝細菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對細菌形態(tài)學的8個特征參數(shù)進行檢測,檢測結(jié)果與傳統(tǒng)檢測結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測方法相比該方法具有操作簡單、快速、結(jié)果準確、適合現(xiàn)場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數(shù)量進行識別,并以此作為衡量乳制品質(zhì)量是否達標的依據(jù),并對產(chǎn)品進行分級。

2.4計算機視覺技術(shù)在其他食品產(chǎn)業(yè)中的應用研究

里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對照數(shù)學模型,采用數(shù)字圖像處理技術(shù)、計算機識別技術(shù)實現(xiàn)了對貝類和蝦類等海產(chǎn)品的無損檢測和自動化分類、分級和質(zhì)量評估,并通過實例詳細闡述了該技術(shù)的實現(xiàn)方法,證實了此項技術(shù)的有效性。計算機視覺技術(shù)還可以檢驗玉米粒形和玉米種子質(zhì)量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術(shù)對圖像進行分析評估,毛葉棗可食率的評估結(jié)果與運用物理方法測得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計算機視覺技術(shù)可以應用于毛葉棗的自動分級。GokmenV等[33-34]通過對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率的關(guān)系,結(jié)果顯示兩項參數(shù)相關(guān)性為0.989,從而可以應用計算機視覺技術(shù)來預測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術(shù)對花生內(nèi)部和外部采集圖像,并通過圖像對其外在品質(zhì)和內(nèi)在品質(zhì)進行分析,并建立相應的數(shù)學模型,該技術(shù)在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等[36]人以國家標準為依據(jù),通過數(shù)字攝像技術(shù)獲取豬肉的細菌菌斑面積、脂肪細胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標來實現(xiàn)豬肉新鮮程度的分級辨認。

3展望

新技術(shù)的研究與應用必然伴隨著坎坷,從70年代初計算機視覺技術(shù)在食品工業(yè)中進行應用開始,就遇到了很多問題。計算機視覺技術(shù)在食品工業(yè)中的研究及應用主要存在以下幾方面的問題。

3.1檢測指標有限

計算機視覺技術(shù)在檢測食品單一指標或者以一個指標作為分級標準進行分級時具有理想效果,但以同一食品的多個指標共同作為分級標準進行檢測分級,則分級結(jié)果誤差較大[37]。例如,Davenel等[38]通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結(jié)果顯示,系統(tǒng)會把花萼和果梗標記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復雜,造成分級誤差很大,分級正確率只有69%。Nozer[39-40]等以計算機視覺為主要技術(shù)手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。

3.2兼容性差

計算機視覺技術(shù)針對單一種類的果蔬分級檢測效果顯著,但是,同一套系統(tǒng)和設備很難用于其它種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計算機視覺設備。Reyerzwiggelaar等[41]利用計算機視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測桃子的準確率顯著高于杏的。Majumdar.S等[42]利用計算機視覺技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。

3.3檢測性能受環(huán)境制約

第3篇:計算機視覺理論與方法范文

【關(guān)鍵詞】攝影測量;計算機視覺;數(shù)字化

科技迅速發(fā)展,攝影測量技術(shù)經(jīng)過多次改革,到目前已經(jīng)進入數(shù)字化的攝影測量技術(shù)階段,這個新技術(shù)對整個攝影測量專業(yè)理論知識教學、科學研究和企業(yè)生產(chǎn)都有重要的影響,這些影響不僅僅是表現(xiàn)在表面,它已經(jīng)使攝影測量的概念和涉及到的專業(yè)的知識都有影響。從測繪學科的角度來說,數(shù)字測量技術(shù)已經(jīng)從傳統(tǒng)的攝影測量技術(shù)發(fā)展到現(xiàn)在新型數(shù)字化測量技術(shù),簡便快捷;從攝影測量學科來說,數(shù)字攝影測量技術(shù)已經(jīng)從經(jīng)典的攝影測量轉(zhuǎn)化到現(xiàn)在與計算機相結(jié)合的高科技技術(shù)。數(shù)字測量技術(shù)既給人們帶來機遇,又給技術(shù)人員帶來挑戰(zhàn),但是其在發(fā)展中還存在很多問題。作為新時代的我們,應努力抓住機遇,勇敢的面對挑戰(zhàn),提高自身的知識儲備量和技術(shù),使自己能在快速發(fā)展的經(jīng)濟市場中站住腳步。

一、攝影測量發(fā)展現(xiàn)狀

由于攝影測量生產(chǎn)的轉(zhuǎn)型,影像掃描儀已被大量地應用,全國掃描儀數(shù)量已超過100臺。同時航空攝影機(如RC30)也在加速引進。應用于航空攝影過程中的GPS/IMU系統(tǒng)也已引進,Z/I公司的數(shù)字航空攝影機DMC已開始在中國應用。與此同時,高分辨率的遙感影像以及其定位參數(shù)(RPC)文件的應用,只要極少量的外業(yè)控制點,就能迅速生成正射影像圖,它已在城市、土地的變遷、規(guī)劃中得到愈來愈廣泛的應用。航空激光掃描Lidar也愈來愈成熟。

由于新一代傳感器、定位系統(tǒng)的迅速發(fā)展與應用,以及數(shù)字攝影測量工作站的發(fā)展及其大規(guī)模的推廣,這樣對攝影測量自身發(fā)展提出一個非常嚴峻而又現(xiàn)實的問題:攝影測量向何處去,除了攝影測量與新一代遙感傳感器、GIS、GPS 更進一步地結(jié)合外, 攝影測量自身從理論到實際將如何發(fā)展,還有沒有發(fā)展前景,在國際上同樣對攝影測量發(fā)展提出了疑慮,美國Ohio大學Schenk教授在其著作“數(shù)字攝影測量學”的序言中指出:攝影測量與貓一樣,他們有一個共同的特點,他們都有幾次生命,攝影測量的終結(jié)已經(jīng)被多次預測。但是他對此問題作了明確的回答:數(shù)字攝影測量是一門相對年輕的、并且迅速發(fā)展的學科。它的許多基本概念與方法來自影像處理與計算機視覺。但是不管它們對它的影響有多強烈, 數(shù)字攝影測量還是一門有自己特色的學科。

二、數(shù)字攝影測量給學科帶來的機遇與挑戰(zhàn)

攝影測量與遙感是一門“從影像重建被攝物體表面”的學科,攝影測量側(cè)重于重建物體的幾何表面,并進行“量測”;而遙感則側(cè)重于重建物體的物理表面,恢復問題表面的物理屬性。因此,從本質(zhì)而言, 攝影測量與遙感是研究影像的獲取、理解、加工、處理的科學與技術(shù),使人們更容易直觀地理解與應用有關(guān)信息。從測繪學科的角度來理解,攝影測量是一門“量測的學科”,著名的攝影測量學者HeIva (1995)就認為“攝影測量的范疇是量測”;而從信息科學和計算機視覺科學來看,它是從影像來重建三維表面模型的科學與技術(shù)―計算機立體視覺。但是,人們一般并沒有將攝影測量與計算機立體視覺聯(lián)系在一起。這是由于攝影測量在上世紀攝影技術(shù)出現(xiàn)不久就被學者發(fā)現(xiàn)其測量功能,并被使用,而計算機立體視覺實在新世紀環(huán)境下創(chuàng)造并被使用的,因此攝影測量的歷史要比計算機立體視覺的歷史長得多,并早已成為測繪產(chǎn)業(yè)的重要組成部分;而且,長期以來,攝影測量是依賴于精密的光學機械儀器,特別是在模擬攝影測量時代, 攝影測量以模擬攝影測量儀器為代表, 與計算機沒有任何聯(lián)系。我們必須清楚地認識到,攝影測量發(fā)展到今天,已經(jīng)超越了傳統(tǒng)攝影測量的范疇,它已經(jīng)不屬于攝影測量工作者“獨家所有”。這是攝影測量工作者面臨的最嚴峻的挑戰(zhàn)。

同時,數(shù)字攝影測量也為我們帶來了發(fā)展機遇。在模擬攝影測量時代, 攝影測量的教學、科研以及生產(chǎn)的組織與流程,一切均以模擬攝影測量儀器的制造者為中心。攝影測量儀器的理論、結(jié)構(gòu),各種控制器、儀器的定向理論與操作方法,變換光束測圖的理論等,均以相應的儀器為中心。進人了解析攝影測量時代,由于計算機引人了攝影測量,大大地拓寬了攝影測量教學、科研的領域,這也提供給學者們更多的研究方向。

三、數(shù)字近景攝影測量――攝影測量發(fā)展的嶄新領域

到目前為止數(shù)字攝影測量的發(fā)展,無論在理論上還是在實際上,,主要還是圍繞著利用航空(航天)攝影測量測繪地形圖展開的,而對于數(shù)字近景(地面)攝影測量的研究甚少。同時隨著數(shù)碼相機的廣泛應用,價格愈來愈低廉。數(shù)碼相機在測量中的應用將是攝影測量發(fā)展的必然趨勢。

在此領域數(shù)字近景攝影測量與計算機視覺有著天然的密切聯(lián)系,因為計算機視覺的研究目標是使計算機具有通過2維圖像認知3維環(huán)境信息的能力,這種能力將不僅使機器感知3維環(huán)境中物體的幾何信息,包括它的形狀、位置、姿態(tài)、運動等,而且能對它們進行描述、存儲, 識別與理解,兩者之間有很多相似之處,但兩者間又有明顯的差異。不論差異大小,不可否認的是,數(shù)字近景攝影測量已成為數(shù)字攝影測量發(fā)展的必然趨勢。

四、結(jié)束語

數(shù)字攝影測量在目前還是一個較為年輕的學科,主要采用計算機技術(shù),將獲取到到信息數(shù)字化,通過計算機進行測繪和分析,提取出對人們有用的信息,這一改變,使數(shù)字攝影測量很快被企業(yè)所接受并得到快速發(fā)展??偠灾瑪?shù)字攝影測量技術(shù)的出現(xiàn)不能僅視為簡單的科學進步而已,應該透過現(xiàn)象看本質(zhì),深刻認識到他已經(jīng)從概念開始改變,并影響到科學研究領域,正在逐漸改變企業(yè)的生產(chǎn)產(chǎn)品水平。面對這些情況,我們應該努力提高自己的理論知識儲備量,提升專業(yè)素養(yǎng),及時抓住一閃而過的機會,迎接各種挑戰(zhàn),在激烈的競爭不斷進步。

參考文獻

[1] 李利,馬頌德. 從2維輪廓線重構(gòu)3維二次曲面形狀[J].計算機學報,1996,19(6):401.

[2] 馬頌德,張正友.計算機視覺-計算理論與算法基礎[J].北京:科學出版社1998.

第4篇:計算機視覺理論與方法范文

關(guān)鍵詞:計算機視覺分析;微小尺寸;精密校正;閾值;圖像分割

中圖分類號:TP274.4

計算機視覺分析理論是基于精密模式識別和人工智能程序化校驗技能進行綜合整編的方法,利用光學信息對真實物理結(jié)構(gòu)的實時反映,配合人機協(xié)調(diào)手段進行二維圖像的呈現(xiàn)。在工件表面進行質(zhì)量檢測和圖片制備要素分析的系統(tǒng)環(huán)節(jié)中,闡述物體在空間環(huán)境之間的關(guān)系樣式,爭取三維場景的科學搭建。集合要素內(nèi)容包括邊緣、線條和曲面的配備,建立以工業(yè)部件為中心的坐標體系,并適當運用不同符號表現(xiàn)模式實現(xiàn)必要三維結(jié)構(gòu)和空間關(guān)系的調(diào)整,促進精密儀器細節(jié)檢驗工作質(zhì)量的不斷提高。

1 計算機視覺檢測技術(shù)的相關(guān)理論研究

1.1 技術(shù)原理分析

滲透性計算機輔助支持結(jié)構(gòu)的視覺鑒定技術(shù)在被測實體中的圖像顯示支持功能基礎形勢上進行質(zhì)量狀況的把控,這其實就是根據(jù)既定的偏差標準實現(xiàn)規(guī)模物件的逐個排查。細致的檢測工作在深度零件的誘導性特征和完整性配件的支持下,對整體完好效果的幾何制備模型進行測量[1]。近階段的視覺規(guī)范系統(tǒng)利用電耦合器件和攝像機進行主題元素的捕捉,并利用計算機內(nèi)部程序的數(shù)字信號轉(zhuǎn)化工具實現(xiàn)圖像的并行處理。采用目標圖像的特殊坐標記錄,利用灰度分布圖內(nèi)的多種綜合功能處理系統(tǒng)改善的要務。常規(guī)視覺下的檢測過程相對比較繁瑣,主要是將被檢測物體放置于照明效果相對均勻的可控制背景環(huán)境中,聯(lián)結(jié)CCD技術(shù)和圖像卡實現(xiàn)被測部件和數(shù)字圖像的共性要素融合,保證計算機自動化處理程序的錄入。當然,這類研究系統(tǒng)是需要利用相關(guān)軟體進行放大的,其主要必備功能就是進行圖像的預處理、識別和有效分析,將整個過程內(nèi)部的實際結(jié)果數(shù)值,包括被測部件的自身缺陷、尺寸等進行整理。

1.2 計算機視覺微小尺寸精密檢測工業(yè)應用技術(shù)的現(xiàn)狀

在科學設計信息內(nèi)容和工業(yè)加工制備要領集成化對待的環(huán)節(jié)中,通常不會直接進行部件表面的接觸,一般運用計算機程序下的掃描認知和圖像即時呈現(xiàn)功能進行快速的比對檢測,整體信號抗干擾能力較強,因此在現(xiàn)代工業(yè)生產(chǎn)技術(shù)領域內(nèi)部廣受好評。電子工業(yè)是在建立計算機視覺分析工藝之后表現(xiàn)最為活躍的行業(yè)類型,在此基礎上衍生的印刷電板路和集成電路芯片就是利用標準模型的整改,實現(xiàn)規(guī)模工序的緊密排列。目前,時下流行的汽車生產(chǎn)、紡織、商品包裝等也逐漸向這類手段靠攏,全面改善了現(xiàn)代化工業(yè)制備的應用效果。

2 應用視覺微小尺寸分析技術(shù)內(nèi)部拓展機能的補充

灰度圖像的主要分割方法包括灰度閾值校正、邊緣檢測制備等手段。

2.1 灰度閾值校正

這是區(qū)域分割方法中一種常見的手段,主要配合多個或單個閾值將圖像自身的灰度級別劃分為幾個項目組,對相同像素的單位數(shù)據(jù)進行整編。根據(jù)實效范圍進行分類,包括局部和全局閾值探究兩種手段,全局規(guī)模下的閾值分析方法就是利用整幅圖的灰度直方分布圖進行內(nèi)部最優(yōu)閾值分割,包括單閾值和多閾值兩種形式;同時還可以將初始分析的圖像進行子元素的拆解,之后利用單個子圖像的既定閾值范圍進行最優(yōu)化分割[2]。分割的基本原理公式為:

其中,合理閾值的選取是非常重要的,目前閾值確定的手段主要包括直方圖雙峰對照法和最大類間方差累積法等。這種利用灰度閾值實現(xiàn)精準質(zhì)量的劃分手段,計算執(zhí)行工作相對比較簡單,并且實際工作效率水平較高,即便是實際需要分割的物體與圖像背景對比深度較強也可以收放自如,但唯一的缺點就是缺少對空間信息的掌控,涉及亮度不足的圖像問題,這種閾值分割技術(shù)的施工質(zhì)量往往不會太高。

2.2 邊緣檢測制備工序

圖像內(nèi)部元素的分割其實就是進行部件邊界效益的提取,而邊緣檢測制備工序則是利用像元及鄰域的整體狀態(tài)進行物體邊界相關(guān)結(jié)構(gòu)的搭建。邊緣檢測分割制備技術(shù)具體包括并行和串行兩種模式,并行手法是運用梯度信息的提取實現(xiàn)不同類別算子的整理;串行邊界分割原理則是根據(jù)適當強度標準和相似走向的兩個邊緣端點位置實現(xiàn)連接,主要代表算法包括啟發(fā)式智能搜索手段等。這種串行算法較并行邊界積累統(tǒng)計原則來說具有更強的抗干擾能力,但實際的邊緣檢測同樣不能完好地維持連續(xù)效果,需要利用其余技術(shù)內(nèi)容進行邊緣制備技巧的修復。

(1)原始圖像 (2)Robert算子邊緣檢測 (3)Sobel算子邊緣檢測

(4)Prewitt算子邊緣檢測 (5)Kirsch算子邊緣檢測 (6)Gauss-Laplace算子檢測

圖1 微小雙聯(lián)齒輪邊緣檢測

3 視覺檢測系統(tǒng)的創(chuàng)新性改進

根據(jù)以上現(xiàn)狀問題,創(chuàng)新式視覺整改校驗系統(tǒng)利用照明光源、攝像機和圖像采集卡等結(jié)構(gòu)實現(xiàn)計算機輸出結(jié)果質(zhì)量的補充。其主要運行過程如下:利用被測部件在均勻照明背景的全面優(yōu)化控制基礎,實現(xiàn)物體結(jié)構(gòu)的全面清晰呈現(xiàn),使用攝像機對相關(guān)圖像信號進行梳理并轉(zhuǎn)化為電荷信號,配合相關(guān)的圖像資源采集卡進行部件數(shù)字化圖像的格式轉(zhuǎn)化;計算機內(nèi)部軟體操作程序?qū)⒌玫降臄?shù)字圖像進行處理和識別,并將最終結(jié)果數(shù)據(jù)輸出,實現(xiàn)現(xiàn)代工業(yè)技術(shù)整體質(zhì)量規(guī)模控制的既定要求。

系統(tǒng)硬件在實現(xiàn)部件轉(zhuǎn)化圖像信息的環(huán)節(jié)中,連接檢測機理下的連續(xù)軟件規(guī)劃和照明光源等相關(guān)設備進行圖像適當分辨率的調(diào)整,維持圖像較為清晰的對比效果。全面控制獲取數(shù)字圖像的時間,抵抗不良因素的干擾影響,維持內(nèi)部成本經(jīng)濟規(guī)模的合理控制,促進科技應用和可持續(xù)發(fā)展經(jīng)濟戰(zhàn)略雙重價值標準的同步進展。其中,光源設備的選擇必須落實到部件既定的幾何形狀條件下,利用相關(guān)性能參數(shù)進行實際工作要求的提供,包括光源位置、亮度、壽命特性等因素的堆積,常用的可見光源包括水銀燈、熒光燈等,但這類光源使用壽命有限,因此現(xiàn)下多配用LED光源進行快捷反應、小功耗標準的補充,并且長期使用后的照明效果比較穩(wěn)定[3]。而攝像機等結(jié)構(gòu)主要還是校正參數(shù)的表達方式,進行圖像合理分辨率的整改,促進圖像采集數(shù)字化協(xié)調(diào)功能的發(fā)展,提高系統(tǒng)工作速度等。

4 結(jié)束語

計算機視覺檢測系統(tǒng)在進行一定部件性能評比的活動中有著很高的貢獻,不僅配合硬件的照明、參數(shù)制備要領制備功能,同時促進數(shù)字化圖像對比的速度,使得工業(yè)生產(chǎn)環(huán)節(jié)中的部件檢查工序得到大范圍整改,滿足可持續(xù)發(fā)展戰(zhàn)略規(guī)模的視覺意義,促進現(xiàn)代智能化分析處理技術(shù)的全面覆蓋。

參考文獻:

[1]陸春梅.基于數(shù)字圖像處理技術(shù)的接桿激光環(huán)焊焊縫視覺檢測系統(tǒng)研究[D].上海交通大學,2008.

[2]羅敏.基于機器視覺的黑片缺陷檢測圖像邊緣提取算法研究[D].沈陽理工大學,2010.

第5篇:計算機視覺理論與方法范文

關(guān)鍵詞:農(nóng)業(yè)機械;新技術(shù);發(fā)展

1.農(nóng)業(yè)機械新技術(shù)的應用和發(fā)展的重要性

我國是一個農(nóng)業(yè)大國,農(nóng)業(yè)是我國國民經(jīng)濟的基礎,農(nóng)業(yè)機械新技術(shù)的應用和發(fā)展具有重要的意義。

第一,提高機械的運作效率。目前在農(nóng)業(yè)機械的使用方面,有的機械在使用過程中不能清晰地識別農(nóng)作物的位置,比如,在收割小麥的過程中,有的小麥受到大風影響產(chǎn)生倒伏,對這些倒伏區(qū)域,機械在收割過程中很容易漏掉。所以在農(nóng)業(yè)機械中使用新技術(shù)有利于彌補農(nóng)業(yè)機械的漏洞,提高機械的運作效率。

第二,解放勞動力,促進經(jīng)濟發(fā)展。農(nóng)業(yè)是一個需要大量年輕勞動力的行業(yè),農(nóng)業(yè)機械新技術(shù)的應用有利于實現(xiàn)農(nóng)業(yè)種植、收割的自動化,解放勞動力。這些年輕的勞動力投入到其他的領域,有利于促進我國經(jīng)濟的發(fā)展。

2.農(nóng)業(yè)機械新技術(shù)的應用

21世紀是個科技迅速翻新的時代,目前農(nóng)業(yè)機械領域的新技術(shù)也層出不窮,下面介紹幾種最新出現(xiàn)的農(nóng)業(yè)機械新技術(shù)。

(1)計算機視覺技術(shù)。計算機視覺技術(shù)出現(xiàn)于20世紀70年代末,主要利用計算機視覺技術(shù)進行農(nóng)產(chǎn)品品質(zhì)和農(nóng)產(chǎn)品等級的檢查。計算機視覺是一種以圖像處理為基礎而興起的學科,主要對視覺信息處理的計算理論、表達與計算方法進行研究。[1]隨著計算機視覺技術(shù)應用領域的不斷擴展,目前在農(nóng)業(yè)機械生產(chǎn)方面,計算機視覺技術(shù)不僅能夠用于檢查農(nóng)產(chǎn)品品質(zhì)和分級,還可以用于播種和收割。但是由于計算機視覺技術(shù)在農(nóng)業(yè)機械方面的使用時間比較短,一些技術(shù)難題還沒有得到解決,所以計算機視覺技術(shù)在農(nóng)業(yè)機械方面的應用還需要繼續(xù)研究。

(2)人工智能技術(shù)。隨著智能化的發(fā)展,智能技術(shù)在農(nóng)業(yè)機械方面的應用也得以實現(xiàn)。美國運用人工智能技術(shù)發(fā)明了激光拖拉機,不僅可以控制拖拉機的行進方向,還能夠?qū)ν侠瓩C進行具體的定位。[2]通過人工智能技術(shù),人們建立了一個龐大的數(shù)據(jù)庫,通過這個數(shù)據(jù)庫可以對土地的具體情況進行掌握,以設計出具體的農(nóng)業(yè)生產(chǎn)所需的化肥、種子、農(nóng)藥、水等原料的用量。

(3)機器人技術(shù)。比智能化更進步的就是機器人技術(shù),機器人技術(shù)在農(nóng)業(yè)機械中的應用,這是計算機信息網(wǎng)絡和計算機視覺技術(shù)以及自動化控制等技術(shù)的結(jié)合的產(chǎn)物。目前研發(fā)出了除草機器人、播種機器人、澆水機器人、施肥機器人等,利用機器人進行農(nóng)業(yè)生產(chǎn)活動,可以節(jié)省人工費用,解放勞動力,避免有些農(nóng)業(yè)生產(chǎn)活動,對人體產(chǎn)生危害。

(4)自動控制技術(shù)。在農(nóng)業(yè)機械中運用自動控制技術(shù),可以幫助操作者降低操作難度,同時可以根據(jù)地勢的高低和秸稈的長短來調(diào)節(jié)高度,保證機械使用過程中的安全性,提高農(nóng)業(yè)機械使用的可靠性,提高農(nóng)業(yè)生產(chǎn)效率。

3.農(nóng)業(yè)機械新技術(shù)的發(fā)展

農(nóng)業(yè)機械新技術(shù)的應用和發(fā)展都是為了提高農(nóng)業(yè)的生產(chǎn)率服務的,所以農(nóng)業(yè)機械新技術(shù)的發(fā)展主要表現(xiàn)為以下幾點:

第一,加速新技術(shù)的使用和推廣??茖W技術(shù)是第一生產(chǎn)力,加速計算機視覺技術(shù)、自動控制技術(shù)、智能化技術(shù)等新技術(shù)在農(nóng)業(yè)機械中的使用,同時引進國外先進的機械新技術(shù),對推動我國農(nóng)業(yè)的發(fā)展,提高農(nóng)業(yè)的生產(chǎn)效率具有重大的意義。

第二,政府補貼。新型機械的購買都是生產(chǎn)個體自行組織的,資金壓力大,使得機械新技術(shù)難以推廣,所以對于農(nóng)業(yè)機械新技術(shù)的推廣使用,政府要在物質(zhì)上予以補貼,拓展新機械的使用范圍。

第三,提高農(nóng)業(yè)資源利用效率。機械使用的目的就是為了提高農(nóng)業(yè)的生產(chǎn)效率,提高農(nóng)業(yè)資源的利用率。例如,在傳統(tǒng)的農(nóng)業(yè)生產(chǎn)過程中,對農(nóng)作物秸稈的處理方式,絕大多數(shù)情況就是焚燒,不僅浪費資源,而且污染空氣。但是農(nóng)業(yè)機械新技術(shù)的使用通過將農(nóng)作物的秸稈進行粉碎處理,將農(nóng)作物秸稈轉(zhuǎn)化為肥料,不僅提高了農(nóng)作物資源的使用效率,也減小了空氣的污染程度。

4.結(jié)語

隨著科技的發(fā)展,計算機視覺技術(shù)、自動控制技術(shù)、智能化技術(shù)等新技術(shù)在農(nóng)業(yè)機械方面的應用越來越廣,農(nóng)業(yè)機械新技術(shù)的應用和推廣將大大提高我國農(nóng)業(yè)的生產(chǎn)效率,提高農(nóng)業(yè)資源的利用率,促進國民經(jīng)濟的發(fā)展。

參考文獻:

[1]田 靜.探討農(nóng)業(yè)機械新技術(shù)的應用與發(fā)展[J].中國農(nóng)資,2013(36): 74.

第6篇:計算機視覺理論與方法范文

【關(guān)鍵詞】 運動目標檢測 視頻圖像 OpenCV

一、緒論

隨著計算機技術(shù)日新月異的發(fā)展,計算機視覺,模式識別,人工智能,多媒體技術(shù),越來越受到人們的重視的快速發(fā)展。廣泛地被定位對象使用運動跟蹤和檢測,監(jiān)測和智能人機交互和分析他們的行為,一旦發(fā)現(xiàn)有異常行為的對象,監(jiān)控系統(tǒng)發(fā)出警報,提醒人們注意和及時的治療,改善人類的人工監(jiān)督注意力浪費資源等問題。計算機視覺是通過計算機代替人的眼睛和大腦感知外部環(huán)境,分析和理解。

1.1 OpenCV技術(shù)介紹

視覺處理算法的OpenCV提供了非常豐富的,它部分是用C寫的,有它的開源特性,妥善處理,無需添加新的外部支持進行編譯和鏈接,生成程序的完整實現(xiàn),所以很多人們用它做算術(shù)移植,OpenCV的可正常運行的系統(tǒng)DSP和MCU系統(tǒng)正常重寫代碼。

二、運動目標檢測

運動目標的檢測在整個視頻監(jiān)控系統(tǒng)的底層,各種高級應用,如目標跟蹤,目標分類,目標行為的隨訪,了解互惠的基礎。運動對象檢測裝置,從在實時目標視頻流中提取,目標通常設置面積和顏色特性。結(jié)果運動目標檢測是描述一些靜態(tài)功能的“靜態(tài)”的目標前景。根據(jù)上下文,其中環(huán)境可分為兩大類靜態(tài)背景下運動目標檢測和動態(tài)背景運動目標檢測,本章與實際紙工作主攝像機靜態(tài)背景運動目標運動結(jié)合,不會發(fā)生前景對象的運動目標檢測檢測算法。

2.1運動目標檢測的基本方法

目標檢測和提取已在目標跟蹤應用程序中的重要地位。目標檢測和提取的精度直接影響結(jié)果和準確性的跟蹤。一個良好的各種環(huán)境動目標檢測算法的應能適用于監(jiān)測,在正常情況下,移動體檢測算法可以根據(jù)場景被監(jiān)視在室內(nèi)或室外監(jiān)測算法被分成室內(nèi)和室外監(jiān)視算法,則可以按照使用特定算法的方法分為連續(xù)幀差分方法,背景減除法和光流法。

2.1.1幀間差分法

對于許多應用,圖像的連續(xù)幀之間的差檢測出圖像的順序是非常重要的一步。場景中的任何可觀察到的運動將反映在場景圖像序列的變化,如果能檢測到這種變化,我們可以分析的運動特性。

2.1.2背景差法

基于該原理的背景差分方法非常簡單,基本操作過程示于(4.2)如下:首先使用式(4.3)來計算背景圖像之間的差fbk當前幀fk,然后根據(jù)下式(4.4)是差分圖像的Dk值化和形態(tài)學濾波處理,并獲得當該區(qū)域的通信區(qū)域比給定的閾值RK進行連通區(qū)域分析的結(jié)果,它成為檢測對象,并且該區(qū)域是區(qū)域目標在區(qū)間的,你能確定的最小邊界矩形的目標。

其中T 是二值化設定閥值。

2.1.3光流法

光流是指在圖像模式(或表觀的)運動的表觀亮度。用“表觀運動”,主要是由于光流的運動圖像不能有部分信息只以確定,例如,區(qū)域性或亮度輪廓點更均勻的亮度不能唯一確定的運動對應的點,但觀察到的運動。這解釋了光流和該流不一定是由物體的運動所產(chǎn)生的光,而運動的主體不一定會產(chǎn)生光流體育場不一定是唯一的。

三、目標跟蹤算法的研究

目標對象的運動信息的條件的先驗知識下跟蹤,通過從信息源的實時數(shù)據(jù)來估計所述目標狀態(tài),以實現(xiàn)所述目標位置和運動趨勢判定。運動目標跟蹤問題是一個復雜的估計。研究精度高,性能穩(wěn)定,目標跟蹤方法的適用性仍面臨巨大挑戰(zhàn),具有重要的理論意義和實用價值。

3.1圖像匹配法

通過圖像匹配方法可以識別要跟蹤的運動對象,并確定它們的相對位置。早期跟蹤涉及的目標位置的變化的兩個圖像之間的測量計算出的相關(guān)函數(shù),跟蹤點是,這兩個圖象相匹配的最佳位置,這是相關(guān)函數(shù)的峰值。

3.2基于團塊的目標跟蹤

基于團塊(BLOB)的基本原理是用于圖像分割候選像素跟蹤算法,它決定像素是否屬于背景或?qū)儆诙ㄎ换驅(qū)儆谄渌麉^(qū)域?;诟櫵惴ǖ馁|(zhì)量也可稱為基于圖像分割的跟蹤,分割結(jié)果剛夠目標和背景之間的區(qū)分,而傳統(tǒng)的圖像分割算法需要目標輪廓的精確顯示。分裂臺球在目標,紋理特征和圖像的深度信息的一般特性。

四、結(jié)語

隨著在軍事領域的計算機視覺,智能交通監(jiān)控,視頻運動目標檢測與跟蹤的發(fā)展必將得到更廣泛的應用和發(fā)展。在本文中,歷時四個月中,主要研究的OpenCV實現(xiàn)運動目標檢測與跟蹤的應用,實驗結(jié)果表明,該系統(tǒng)具有良好的魯棒性和準確性,實現(xiàn)畢業(yè)設計的預期目標,在工作和問題結(jié)合起來實際應用中。

參 考 文 獻

[1]劉瑞禎, 于仕琪. OpenCV教程基礎篇[M]. 北京: 北京航空航天大學出版社,2007.

[2]彭達. Visual C++多媒體編程技術(shù)[M]. 北京: 人民郵電出版社, 1999.

[3]丁金鑄. 基于圖像處理的運動目標檢測跟蹤系統(tǒng)的設計與實現(xiàn)[D]. 華中師范大學, 2007.

[4]王建中, 姜昱明. 基于塊匹配的運動對象檢測算法[J]. 微電子與計算機, 2005, 22(1): 10-12.

[5]林少丹. VC++程序設計基礎[M]. 北京: 人民交通出版社, 2009.

[6]唐雙發(fā). 基于OpenCV的車輛視頻檢測技術(shù)研究[D]. 華中科技大學, 2009.

[7]李慶忠,陳顯華,王立紅. 視頻監(jiān)視中運動目標檢測與識別方法[J]. 計算機工程, 2004, 30(16):30-33.

[8]胡曉峰, 吳玲達, 老松楊, 司光亞. 多媒體技術(shù)教程[M]. 北京: 人民郵電出版社, 2002.

[9]韓鴻哲, 王志良, 劉冀偉, 李郴, 韓忠濤. 陰影消除的自適應背景建模[C]. 第二屆全國智能視覺監(jiān)控學術(shù)會議論文集, 2003, 35-39.[10]張玲, 葉海炳, 何偉. 一種基于邊緣信息的改進車輛檢測方法[J]. 重慶大學學報(自然科學版), 2004, 27(11): 56-58.

[11] J.B.Kim, H.J.Kim. Efficient Region―based Motion Segmentation for Video Monitoring System [J]. Pattern Recognition Letters, 2003, 3(24):113-128.

[12]王春平, 朱元昌,黃允華. 基于圖像信息的跟蹤算法分析[J]. 火力與指揮控制, 2000, 25(1): 64-67.

[13]楊枝靈, 王開. Visual C++數(shù)字圖像獲取處理及實踐應用[M].北京: 人民郵電出版社, 2003.

第7篇:計算機視覺理論與方法范文

關(guān)鍵詞:多源圖像;融合技術(shù);棉花;病蟲害;識別診斷

中圖分類號:TP391.43;S435.6 文獻標識碼:A 文章編號:0439-8114(2013)11-2555-03

隨著城市化進程不斷加快,從事農(nóng)業(yè)勞作的勞動力總數(shù)急劇減少,農(nóng)業(yè)生產(chǎn)與加工的逐步自動化是社會發(fā)展和進步的需求。特別是對于農(nóng)作物病蟲害監(jiān)測從傳統(tǒng)的根據(jù)農(nóng)業(yè)部的病蟲害監(jiān)測調(diào)查規(guī)范進行調(diào)查,通過人工調(diào)查、人工記錄,到微小昆蟲自動計數(shù)技術(shù)、昆蟲誘捕自動記錄裝置來對農(nóng)作物病蟲害進行監(jiān)測,這些信息收集和數(shù)據(jù)管理都存在勞動量大、效率低、數(shù)據(jù)誤差大的問題。隨著計算機技術(shù)和傳感器技術(shù)的快速發(fā)展,圖像融合技術(shù)在軍事、氣象、醫(yī)學、土地資源管理等方面得到了廣泛的應用,而如何將圖像融合技術(shù)應用在農(nóng)作物病蟲害中是極具有研究價值的課題。

1 棉花病蟲害診斷技術(shù)研究意義及發(fā)展趨勢

棉花作為主要的經(jīng)濟作物一直在中國和湖北省農(nóng)業(yè)生產(chǎn)中占有重要地位,但由于品種、栽培制度、生態(tài)環(huán)境等變化及棉花生長環(huán)境日益惡化,病蟲害有不斷加重趨勢。危害棉花的主要病害有炭疽病、黑斑病、枯萎病、黃萎病等,炭疽病在長江流域棉區(qū)的發(fā)生尤為嚴重,一般苗期發(fā)病率為20%~70%,嚴重時可達90%;黑斑病在陰濕多雨年份往往猖獗流行,給棉花生產(chǎn)造成毀滅性災害;而枯萎病在棉區(qū)一直發(fā)生較多,死苗嚴重,造成的危害主要表現(xiàn)在產(chǎn)量降低,品質(zhì)變劣方面;自上世紀80年代末枯萎病得到控制后,黃萎病上升為棉花第一病害。目前黃萎病發(fā)病面積達到全國棉田面積的50%以上,發(fā)病后棉苗減產(chǎn)30%~70%,有的甚至絕產(chǎn),而且嚴重影響棉花品質(zhì)。采用先進技術(shù)提高棉花病蟲害有效防治及控制已迫在眉睫。

1.1 棉花病蟲害診斷技術(shù)的研究意義

在進行植物保護和防治農(nóng)作物病蟲害的各類方法中,化學防治是投入少、見效快、收效大的有效方法,特別是針對在大生態(tài)區(qū)域內(nèi)可能暴發(fā)成災的重要病蟲草害,化學防治迄今仍是最快速而有效的方法,一般可以挽回15%~30%的農(nóng)作物產(chǎn)量損失。使用農(nóng)藥(各種殺菌劑、除草劑等)進行化學防治在世界各國一直占主導地位,它投入較少,防治迅速,特別是當大面積、暴發(fā)性病害發(fā)生時,只有化學防治才能取得較好的防治效果。同樣,在棉花病蟲害綜合防治中,化學防治仍然是及時有效地控制病蟲對棉花危害的最后一道把關(guān)防治措施。但長期大量使用農(nóng)藥不僅污染環(huán)境,而且這些農(nóng)藥會通過空氣、水等途徑進入人體,對人類的身體健康構(gòu)成危害;又由于棉花病蟲害癥狀的復雜性和模糊性,農(nóng)業(yè)生產(chǎn)者受個體素質(zhì)和人為主觀因素的影響,往往不能正確合理地判斷病情,導致濫用農(nóng)藥、化肥等引起更大的危害;此外,由于中國正步入老齡化社會,從事農(nóng)業(yè)勞動的人口在減少,由勞動力不足帶來的農(nóng)業(yè)減產(chǎn)問題已日趨嚴重。所以,精確作物病蟲害管理和機械化變量施藥技術(shù)的研究和應用勢在必行。為實現(xiàn)精確的棉花病蟲害管理和變量施藥,首先要能夠準確地識別棉花病蟲害種類及其危害程度。傳統(tǒng)的方法主要依靠生產(chǎn)者或?qū)<医?jīng)驗來判斷病蟲害原因及其危害程度,由于個體素質(zhì)的差異以及其他因素的影響,往往很難做到對病蟲害做出精確定量分析和判斷,因而容易造成不合理的病蟲害防治,也對生產(chǎn)管理者的農(nóng)技水平要求較高。一些智能決策支持系統(tǒng)雖然能識別診斷棉花病蟲害,但是過程復雜,不能進行實時處理。隨著信息技術(shù)、光譜技術(shù)和計算機視覺技術(shù)的發(fā)展使基于生物信息的作物病蟲害智能識別診斷成為可能。通過多源圖像融合技術(shù)快速準確地獲取棉花病蟲害信息,對已發(fā)生病蟲害的棉花區(qū)域根據(jù)病蟲害程度實行定量噴施農(nóng)藥。這樣既可大量節(jié)省農(nóng)藥,提高效率,降低成本,降低對勞動力的依賴,同時大幅度減輕農(nóng)藥對農(nóng)業(yè)生態(tài)環(huán)境的污染,提高棉花病蟲害防治水平。研究多源圖像融合技術(shù)對農(nóng)作物病蟲害診斷具有重要的學術(shù)意義和經(jīng)濟價值。

1.2 棉花病蟲害診斷技術(shù)發(fā)展趨勢

縱觀近幾年國內(nèi)對作物病蟲害智能識別診斷的研究,目前對棉花作物病蟲害識別診斷主要集中在以專家系統(tǒng)為代表的智能化信息技術(shù)和光譜技術(shù)上,應用計算機視覺技術(shù)對棉花作物病蟲害識別的研究報道較少[1,2],而結(jié)合光譜技術(shù)和計算機視覺技術(shù)進行研究的則未見報道。目標的高分辨率和高識別率是對獲取目標信息的基本要求,僅僅利用可見光范圍或在近紅外范圍的計算機視覺技術(shù)進行作物病蟲害識別診斷,其單一光譜不足以準確、全面反映作物病蟲害的差異,還需利用其他生物信息對其補充和加強,以達到全面地反映作物病蟲害的差異[3]。

為了實現(xiàn)對低探測性目標的探測和識別,必須大力發(fā)展先進的目標探測系統(tǒng),而由多源傳感器組成的光電成像系統(tǒng)是最為常見的目標探測系統(tǒng)。圖像融合就是利用各種成像傳感器得到的同一目標或同一場景的圖像,綜合這些不同圖像的冗余信息和互補信息,以獲得更為全面準確的圖像描述。為此,針對湖北省主要經(jīng)濟作物棉花,綜合利用光譜技術(shù)、計算機視覺技術(shù)及多源信息融合技術(shù),基于多源圖像信息(可見光和近紅外視覺圖像信息)融合棉花病害(炭疽病和黑斑?。┳R別診斷技術(shù)。深入研究作物在不同病蟲害危害下的反射光譜特性及變化規(guī)律,確定光譜敏感波段及其特征表現(xiàn),提取可以有效表征作物不同病蟲害條件、不同危害程度下的計算機視覺圖像的灰度、紋理、形態(tài)特征信息和近地光譜特征信息,探索基于多傳感信息融合的病蟲害識別診斷方法,構(gòu)建病蟲害智能識別系統(tǒng),為精確作物病蟲害管理和機械化變量施藥技術(shù)提供理論基礎。

2 多源圖像融合技術(shù)

圖像融合[4]是對多幅源自同一場景的圖像進行綜合,以獲得更好的視覺效果和易于機器識別為目的,產(chǎn)生比單一信息源更為精確、更完善、更可靠的圖像。多源傳感器圖像是由成像機理不同的多種傳感器獲得的圖像。由于每種成像傳感器都是為了適應某些特定的環(huán)境和使用范圍而設計的,具有不同成像機理的多種傳感器獲得的圖像之間存在信息的冗余性和互補性,通過對其進行融合,能夠提高系統(tǒng)可靠性和圖像信息的利用率。隨著科學發(fā)展和技術(shù)進步,采集圖像數(shù)據(jù)的手段不斷完善,出現(xiàn)了各種新圖像獲取技術(shù)。如今圖像融合技術(shù)廣泛應用于圖像處理、遙感、計算機視覺以及軍事等領域[5]。利用圖像融合技術(shù)可以準確地獲取檢測數(shù)據(jù),如在醫(yī)學圖像分析中的超聲成像、核磁共振、計算機層析、血液細胞自動分類計數(shù)、癌細胞識別等極大地提高了準確率[6,7];圖像融合技術(shù)在遙感雷達衛(wèi)星的發(fā)展后,已成為遙感圖像處理和分析的重要研究熱點,應用于土地資源調(diào)查、環(huán)境監(jiān)測、地形測繪等[8]。圖像融合技術(shù)應用在農(nóng)業(yè)生產(chǎn)中,目前研究方向主要集中在對農(nóng)產(chǎn)品的無損檢測和農(nóng)作物生長態(tài)勢及產(chǎn)量評估方面。如采用互信息最佳閾值迭代優(yōu)化分割法對可見光和近紅外圖像進行融合來對番茄成熟度進行無損檢測研究[9];通過加權(quán)平均融合法對紅外和可見光圖像實現(xiàn)對蘋果進行無損檢測研究[10];采用蟻群算法的模糊C均值聚類圖像分割算法的圖像融合技術(shù)對作物幾何參數(shù)進行測量。

多源傳感器圖像融合系統(tǒng)一般有3種類型:像素級融合、特征級融合和決策級融合。

2.1 像素級圖像融合

像素級圖像融合是通過對源圖像進行預處理和空間配準,對處理后的圖像采取適當?shù)乃惴ㄟM行融合,得到融合圖像后再進行顯示和后續(xù)處理。簡單的像素級融合方法主要有:像素灰度值平均或加權(quán)平均,像素灰度值選大,像素灰度值選小。簡單的像素級融合方法結(jié)構(gòu)簡單、易于實現(xiàn),但應用范圍有限,融合結(jié)果不理想。故現(xiàn)在的融合方法多采用基于對源圖像的多尺度分解。這種分解方法是一種多尺度、多分辨率的圖像融合方法,是在不同尺度、不同空間分辨率、不同分解層上分別進行融合。這種融合方法能明顯改進融合效果[11]。

2.2 特征級圖像融合

特征級圖像融合是從不同的成像傳感器所獲得的同一對象圖像中提取一些特征,產(chǎn)生特征矢量,然后對這些特征矢量進行融合。特征級圖像融合是中間層的圖像融合,精度一般。其融合方法有基于假設前提及統(tǒng)計分析的方法和基于知識的方法。

2.3 決策級圖像融合

決策級圖像融合是最高層次的融合,是首先依據(jù)每一個成像傳感器所獲得的同一對象圖像各自進行預處理、特征提取、識別和判決后,做出獨立的決策,然后將這些獨立的決策綜合起來,給出最終決策。決策級圖像融合適合于多類不同傳感器圖像的融合,但融合結(jié)果精度較差。其融合方法有多重邏輯推理方法、統(tǒng)計方法、信息論方法等都可用于決策層的圖像融合。

特征級圖像融合和決策級圖像融合方法通常應用于某些特殊場合,像素級圖像融合的應用更普及,融合所得圖像更有利于人眼的判讀、欣賞和機器識別。對于已經(jīng)配準好的圖像,像素級圖像融合方法不需要顯式地提取圖像特征,在速度和魯棒性上有明顯優(yōu)勢。為此采取像素級圖像融合方法對農(nóng)作物病蟲害的可見光和近紅外圖像進行融合處理,使其符合人類視覺特征,融合結(jié)果更有利于對圖像作進一步分析、理解和識別。

3 多源圖像融合技術(shù)對棉花病蟲害診斷的方法

1)在特定栽培條件下,培育不同棉花病蟲害的試驗樣本及正常的對比樣本。

2)對棉花病蟲害樣品的葉片和冠層進行光譜分析。利用便捷式光譜儀測量葉片和冠層的光譜,尋找棉花病蟲害種類的敏感光譜波段及其反射率特征,分析不同病蟲害種類和病蟲害程度的敏感光譜波段反射率特征的變化規(guī)律。

3)根據(jù)光譜分析結(jié)果,構(gòu)建多源圖像計算機視覺采集系統(tǒng),采集棉花作物樣本多光譜圖像,用VC或MATLAB編寫計算機圖像處理軟件對圖像進行處理和特征提取。

4)對所獲取的特征應用模糊特征優(yōu)選、主成分分析(PCA)和獨立分量分析(ICA)進行優(yōu)化組合和篩選,通過各種統(tǒng)計方法尋求作物病癥與特征對應關(guān)系。建立圖像特征與病種、病蟲害程度的關(guān)系模型,利用模式識別方法進行棉花病蟲害種類及程度的模式識別檢測試驗[12]。

4 展望

棉花是中國和湖北省主要的經(jīng)濟作物,長期以來棉田病蟲害對棉花生產(chǎn)帶來極大危害,因此,對棉花病蟲害防治方法與技術(shù)的研究至關(guān)重要。對棉花作物病蟲害防治的各種方法中,傳統(tǒng)的方法是依靠人們的經(jīng)驗確認病蟲害的發(fā)生時間、區(qū)域、種類和發(fā)生程度等,且是進行手工或機械噴灑農(nóng)藥,這不僅勞動效率低,勞動成本高,而且常規(guī)施藥技術(shù)會帶來農(nóng)藥利用率低下、水資源浪費、環(huán)境污染、農(nóng)藥在作物及其產(chǎn)品中的殘留導致對人類的危害等。所以,結(jié)合光譜技術(shù)和計算機技術(shù)開展棉花病蟲害的識別診斷研究具有重要的學術(shù)意義和經(jīng)濟價值。

參考文獻:

[1] 周小燕,史 巖,李道亮,等.棉花病蟲害診斷專家系統(tǒng)的研究與設計[J].萊陽農(nóng)學院學報,2005,22(1):9-11.

[2] 嚴智燕,廖桂平,高必達.植物病蟲害防治中農(nóng)業(yè)專家系統(tǒng)的研究進展[J].中國農(nóng)學通報,2005,21(5): 415-417.

[3] YUTAKA S,TSUGUO O.Automatic diagnosis of plant disease recognition between healthy and diseased leaf[J].農(nóng)業(yè)機械學會雜志,1999,61(2):119-126.

[4] 何 友,王國宏,陸大金,等.多傳感器信息融合及應用[M].北京:電子工業(yè)出版社,2000.

[5] 王 宏,敬忠良,李建勛.多分辨率圖像融合的研究與進展[J].控制理論與應用,2004,21(1):145-151.

[6] ZHENG Y F, ESSOCK E A, HANSEN B C.Advanced discrete wavelet transform fusion algorithm and its optimization by using the metric of image quality index[J].Optical Engineering,2005,44(3):1-12.

[7] 李秋華.基于紅外圖像信息融合的目標檢測和識別技術(shù)研究[D].長沙:國防科學技術(shù)大學,2002.

[8] 吉 微.多源氣象衛(wèi)星圖像融合技術(shù)應用研究[D].南京:南京信息工程大學,2009.

[9] 李明喜.基于多源圖像融合的收獲目標準確定位研究[D].江蘇鎮(zhèn)江:江蘇大學,2008.

[10] 楊萬利,沈明霞,嚴 君.紅外圖像處理技術(shù)在蘋果早期淤傷檢測中的應用[J].計算機工程與設計,2010(1):149-152.

第8篇:計算機視覺理論與方法范文

[關(guān)鍵詞]數(shù)字圖像處理 OpenCV 實驗教學 項目教學

[中圖分類號] G642.423 [文獻標識碼] A [文章編號] 2095-3437(2013)09-0042-02

一、引言

目前,大多數(shù)高校的數(shù)字圖像處理課程都是在引入Matlab集成的工具箱及其自帶函數(shù)的基礎上進行實驗教學[1]。由于Matlab程序的移植性較差,學生學習完成后不能直接面對實際的軟件開發(fā)和應用,難以真正提高學生的工程實踐動手能力。

為了讓學生既能掌握基本理論和技術(shù),又能較容易編寫算法的程序,我們在數(shù)字圖像處理的教學中引入了開源的計算機視覺庫OpenCV(Open Source Computer Vision Library)。該軟件是以C 函數(shù)和C++類的形式實現(xiàn)大量圖像處理算法,學生可以方便地利用OpenCV 進行圖像處理算法的編程和驗證,進而在VC中開發(fā)功能更強大的應用程序。相對于Matlab而言,學生不僅可以利用OpenCV 開放的源代碼,以函數(shù)進行圖像處理,而且可以查看算法的代碼實現(xiàn),更好地培養(yǎng)學生的編程能力[2]。

二、OpenCV概述

OpenCV是Intel公司資助的面向廣大研究人員和學生的開源計算機視覺庫,它由一系列C函數(shù)和少量C++類構(gòu)成,實現(xiàn)了圖像處理和計算機視覺方面很多通用算法,同時提供了MatLab等語言的接口,因此極大地方便了圖像處理和視頻技術(shù)的二次開發(fā)[3]。

OpenCV主要包含六大模塊,其具體功能分別是[3]:(1) CV模塊:包含基本的圖形處理函數(shù)和高級的計算機視覺算法;(2) CVAUX模塊:包含輔助的OpenCV函數(shù),一般存放一些被淘汰的算法和函數(shù),同時也包含一些新出現(xiàn)的實驗性的算法和函數(shù);(3) CXCORE模塊:包含OpenCV的基本數(shù)據(jù)結(jié)構(gòu)和線性代數(shù)支持;(4) HIGHGUI模塊包含圖像和視頻的界面函數(shù);(5) ML模塊:包含一些基于統(tǒng)計的分類和聚類工具,模式識別算法和回歸分析等;(6) CVCAM模塊:負責讀取攝像頭數(shù)據(jù)的模塊。

利用OpenCV進行程序開發(fā)具有以下幾個特點[4]:(1) 獨立性。OpenCV中大量的函數(shù)和類庫既可以獨立運行,也可以在加入其它外部庫的情況下運行;(2) 跨平臺性。構(gòu)成OpenCV的API函數(shù)具有跨平臺性,不僅能很好的支持各種不同的操作系統(tǒng),也可以很好地在不同公司的C/C++編譯器下工作;(3) 功能強大。OpenCV包含了線性表、樹、圖等基本數(shù)據(jù)結(jié)構(gòu),也包含圖像濾波、邊緣檢測和數(shù)字形態(tài)學等數(shù)字圖像處理的基本操作以及一些圖像高級處理功能;(4) 高效性。OpenCV的算法都是基于動態(tài)數(shù)據(jù)結(jié)構(gòu),使用Intel處理器指令集開發(fā)的優(yōu)化代碼,運行速度快,處理效率高;(5) 開放性。OpenCV的源代碼是開放的,程序設計者可以直接修改它的源代碼,也可以將新的函數(shù)或類集成到它的庫中。

三、數(shù)字圖像處理的實驗設置

實驗是理論教學的有效輔助,對于數(shù)字圖像處理這類實踐性很強的課程就更加重要。通過閱讀和調(diào)試算法源代碼、體驗算法的處理效果,學生可以加深對基礎理論的理解。根據(jù)理論教學的重點難點內(nèi)容,我們設計了相應的實驗項目,每個項目都要求學生運用OpenCV和Visual C++編程語言框架來編寫數(shù)字圖像處理基本算法。

項目教學法是針對課程體系結(jié)構(gòu)設計出一系列學習單元項目,項目設計圍繞著具有典型性、啟發(fā)性的關(guān)鍵問題,學生通過參與項目完成的全過程實現(xiàn)對課程內(nèi)容系統(tǒng)而深入的掌握[5]。項目教學法真正實現(xiàn)了以學生為中心、以教學目標為中心,實現(xiàn)理論方法學習與實踐動手能力培養(yǎng)的緊密結(jié)合。

本文基于項目教學法的研究,針對“數(shù)字圖像處理”課程教學體系結(jié)構(gòu),并結(jié)合教學大綱與教學目標要求,同時參考國外大學的相關(guān)課程,設置了以下實驗項目:

(1) 圖像變換。

(2) 圖像直方圖均衡化。

(3) 頻域圖像增強。

(4) 圖像邊緣檢測。

(5) 圖像分割。

(6) 人臉檢測。

通常,學生完成一個項目需要4個過程[6]:(1) 項目原理分析;(2) 項目具體流程設計;(3) 基于OpenCV的軟件設計;(4) 結(jié)果展示與分析。以上每個階段都要求學生提交階段報告,根據(jù)學生報告反映出的問題,老師有針對性地進行指導,在解決問題中幫助學生真正掌握所學的知識,并提高動手能力。在項目法教學過程中,我們特別要注意克服項目無法完全覆蓋全部知識點的局限,因此,要在項目選擇與設計中綜合考慮,并結(jié)合項目原理研究建立對教學體系框架和全部知識點的整體把握。

四、OpenCV處理圖像的應用實例

(一)圖像變換

OpenCV提供多個圖像變換函數(shù)。函數(shù)cvWarpAffine利用指定的矩陣對輸入圖像進行仿射變換,這類變換可以用一個3×3的矩陣來表示,其最后一行為(0, 0, 1)。典型的仿射變換包括平移變換、縮放變換、剪切變換、旋轉(zhuǎn)變換等。此外,函數(shù)cvWarpPerspective對圖像進行透視變換,函數(shù)cvLogPolar將圖像從直角坐標映射到極坐標,核心代碼如下:

IplImage* dst = cvCreateImage( cvSize(256,256), 8, 3 );

cvLogPolar( src, dst, cvPoint2D32f(src->width/2,src->height/2), 40 );

圖1給出了圖像映射到極坐標的結(jié)果實例。

(二)圖像邊緣檢測

圖像的邊緣是圖像最基本的特征,是灰度不連續(xù)的結(jié)果,因而邊緣檢測是圖像處理中的重要問題。OpenCV提供了cvSobel函數(shù)、cvLaplace函數(shù)和cvCanny等函數(shù)進行邊緣檢測,下面以cvLaplace函數(shù)進行舉例,其邊緣檢測的代碼為:

IplImage *result_img = cvCreateImage(cvSize(img->width, img->height), IPL_DEPTH_8U, 1);

cvLaplace (img, result_img);

cvNamedWindow(“Result”, 0);

cvShowImage(“Result”, result_img);

第一句是創(chuàng)建一幅與原始圖像img同樣大小的通道數(shù)為1的圖像result_img;第二句是使用Laplace算子對圖像進行邊緣檢測,并將結(jié)果存放在result_img中,后面兩句是在窗口中顯示result_img。程序的處理結(jié)果如圖2 所示。

五、結(jié)束語

OpenCV中的函數(shù)幾乎能夠覆蓋到所有的數(shù)字圖像處理的基本功能,而且其代碼又是免費的和開放的。實踐證明,通過將OpenCV引入數(shù)字圖像處理的實驗教學中,既能簡化圖像處理的編程,又能切實地提高學生的實踐能力,使學生深入理解圖像處理的基礎理論和典型算法,獲得了良好的實驗教學效果。

[ 參 考 文 獻 ]

[1] 趙敏.Matlab用于數(shù)字圖像處理的教學實踐研究[J].電腦知識與技術(shù),2012,8(31):75397540.

[2] 李樹濤,胡秋偉.OpenCV在“數(shù)字圖像處理”課程教學中的應用[J].電氣電子教學學報,2010,32(6):2628.

[3] 劉瑞禎,于仕琪.OpenCV教程[M].北京:北京航空航天大學出版社,2008.

[4] 方玫.OpenCV技術(shù)在數(shù)字圖像處理中的應用[J].北京教育學院學報(自然科學版),2011,6(1):711.

第9篇:計算機視覺理論與方法范文

關(guān)鍵詞:計算機技術(shù);視覺識別技術(shù);交互技術(shù);會議展示;智能辦公環(huán)境

在日常的企業(yè)辦公管理活動中,有很多時候需要可視化地展示企業(yè)市場計劃、新產(chǎn)品設計、數(shù)據(jù)分析報告等。盡管這些活動所需要的材料在事前可以經(jīng)由辦公自動化軟件處理,但處理結(jié)果卻很大程度上只能由靜態(tài)的PPT展示和說明。但很多時候,這些展示和說明往往是多個部門不同專業(yè)背景的人員參與,于是展示材料制作的水平和質(zhì)量就很大程度上影響到了參與者對所展示內(nèi)容的理解和吸收程度。很多復雜的問題或者設計的展示,如果能采用互動交互的方式展示,在很大程度上能夠幫助問題討論的參與者對所討論問題更好的理解。這一點在常規(guī)的教育過程中已經(jīng)獲得了充分的證實,相關(guān)的數(shù)據(jù)和結(jié)果可以從多媒體教學的優(yōu)勢的相關(guān)研究中得到。同樣,企業(yè)中很多方案的討論,數(shù)據(jù)分析報告的說明其實對于企業(yè)而言也是一個方案設計者或數(shù)據(jù)研究分析者對相關(guān)人員類似教學的過程。采用現(xiàn)有企業(yè)常規(guī)會議設備諸如投影儀、普通筆記本電腦、電腦攝像頭配合相應的計算機視覺識別程序,我們可以將交互的投影演示引入到企業(yè)日常的展示討論活動中,增強溝通效果,提高工作效率,并且在技術(shù)上同樣的識別交互的程序配合上相應的員工面部特征的數(shù)據(jù)庫,還能擴展延伸到考勤或門禁系統(tǒng)中提供更加智能化的辦公環(huán)境。對于以展示溝通為主的教育培訓企業(yè),通過配合一般人臉數(shù)據(jù)特征,可以通過攝像頭捕捉現(xiàn)場視頻并識別其中人臉識別,記錄現(xiàn)場關(guān)注展示內(nèi)容的人員的數(shù)量,作為日后教學效果的自然客觀的評估參考。

1目前辦公信息化中存在的問題

1.1會議演示文稿展示時多人交互型差

目前主流的演示文稿制作及展示軟件主要大多都集成在套裝的辦公軟件中,其中主要常見的種類分別是MicrosoftOffice系列中的PowerPoint、MacOS系統(tǒng)下的KeyNote、基于Linux操作系統(tǒng)的Openoffice中的Impress。它們主要的功能都是對輸入的文字、圖片聲音等多媒體進行編輯制作最后生成電腦上播放的多媒體幻燈片,盡管它們都具有強大的多媒體數(shù)據(jù)的處理能力,但最終制作的多媒體幻燈片在演示時都是“單向交互”的,即由播放者播放,而其中的內(nèi)容及動畫按預先設計好的模式顯示。如果使用Adobe公司的Captivate或Authware這樣的多媒體交互制作軟件則會需要有專人進行操作,浪費大量的時間和精力,但如果是配置專門的多點觸摸屏幕,則一來屏幕尺寸有所限制,二來費用相對較高容易造成設備的浪費。

1.2傳統(tǒng)辦公考勤與門禁系統(tǒng)的弱勢

目前企業(yè)常規(guī)的門禁系統(tǒng)與日??记谙到y(tǒng)往往是分離的,兩個系統(tǒng)使用了各自獨立的軟硬件環(huán)境,其中門禁系統(tǒng)使用的是攝像監(jiān)控設備采集信息并通過專人24小時值班,其主要職能僅僅是監(jiān)控辦公環(huán)境的人員進出并記錄下相應的影像資料。而企業(yè)日常的考勤系統(tǒng)則要么采用人工簽到的方式,要么采用人工打卡或者指紋打卡方式。如果采用打卡方式管理則需要添置專門的打卡機,這些打卡機多數(shù)是獨立工作,對于員工的考勤則需要人工根據(jù)卡片記錄情況統(tǒng)計。無論是員工自身打卡或者是統(tǒng)計考勤都是人工完成,有時還會出現(xiàn)錯誤和疏漏,同時主要的問題還在于容易出現(xiàn)代人打卡等作假的情況。所以,在傳統(tǒng)的辦公考勤與門禁系統(tǒng)獨立的情況下,兩個系統(tǒng)各自記錄各自的相關(guān)數(shù)據(jù),同時投入兩套不同的軟硬件環(huán)境,有時這樣的辦公環(huán)境的信息化反而沒有給人員帶來便利,而是增加一項打卡簽到的日常任務。

2對存在的部分問題的分析和討論

2.1傳統(tǒng)演示設備缺乏交互型功能

由于很長一段時間硬件以及軟件的條件約束,電腦的鍵盤、鼠標完成了95%以上的數(shù)據(jù)輸入工作,單一顯示功能的顯示器投影儀也成了最主要的信息輸出設備。所以常規(guī)軟件設計和開發(fā)時都是把鍵盤、鼠標、顯示器/投影儀的輸入輸出組合當做幾乎所有使用情況下的模式。但隨著觸摸屏與多點觸控硬件的出現(xiàn),多點觸控、屏幕的直接交互輸入輸出操作成了未來發(fā)展的一個趨勢,并且相對普通鼠標和單一顯示功能的顯示器用戶交互體驗明顯提升,人機交互界面更友好直觀。但是對于普通辦公中使用的投影儀,由于其投影的目標位置情況多樣,如果一體化的設計制造具有交互功能的互動投影儀其成本要比普通投影儀更高,對于解決互動操作的問題經(jīng)濟上不是最優(yōu)的。而大面積的多點觸控屏幕由于設備體積和重量的因素無法在需要靈活移動的新產(chǎn)品推廣談判等活動中使用,如果只是企業(yè)自身辦公環(huán)境中做普通會議展示的效果改進,其投入產(chǎn)出的效率也不理想。

2.2基于傳統(tǒng)輸入輸出設備的開發(fā)

由于長期以來人機交互都是以鼠標鍵盤為主,所以絕大多數(shù)程序開發(fā)設計都只考慮這種單一的輸入方式。但對于目前多媒體數(shù)據(jù)增多的趨勢,這樣傳統(tǒng)的輸入輸出模式就存在著很多弊端,其中最明顯的是對于多媒體數(shù)據(jù)的采集就需要單獨使用設備,采集后再人工處理。而為了簡化系統(tǒng)設計的復雜度,很多管理信息系統(tǒng)的數(shù)據(jù)采集和錄入主要基于鍵盤鼠標的錄入,如果出現(xiàn)非鍵盤鼠標錄入的數(shù)據(jù)則被要求人工進行數(shù)據(jù)格式的轉(zhuǎn)換,所以從一個側(cè)面也反映出一些企業(yè)排斥信息化,因為原本帶來效率提升與管理便利的信息系統(tǒng),反而由于一些數(shù)據(jù)格式的錄入要求增加了人工勞動。如果直接使用現(xiàn)實當中的多媒體類的數(shù)據(jù)則系統(tǒng)又缺少相應轉(zhuǎn)換的功能。因為系統(tǒng)在考慮使用鍵盤鼠標錄入采集數(shù)據(jù)時已經(jīng)默認了操作者來完成數(shù)據(jù)錄入前的標準化工作。但是實際上隨著現(xiàn)代計算機視覺以及人工智能、模式識別技術(shù)的發(fā)展和完善,過去無法識別的原始多媒體數(shù)據(jù)現(xiàn)在也可以由計算機識別并進行標準化的處理。

3運用計算機視覺技術(shù)改善人機交互

3.1低分辨率識別情況下改善會議演示交互效果

采用現(xiàn)代的計算機影像處理技術(shù)和方法,可以用普通的圖像采集設備配合程序識別影像當中的特定顏色區(qū)域的移動軌跡,并對軌跡做出判斷實現(xiàn)與計算機的交互。由于該識別只是需要識別圖像中的特定顏色的區(qū)域的運動,而非具體的形狀與細節(jié),所以識別的難度相對不大,可以運用在會議的展示環(huán)境下,通過定位確定普通投影區(qū)域與特定顏色區(qū)域的位置關(guān)系,并通過圖形圖像的投影與變形運算,實現(xiàn)人與普通投影的交互。在環(huán)境背景比較清晰,圖像采集設備分辨率與色彩分辨比較靈敏的情況下還能更進一步對人體膚色和手的幾何特征進行識別,實現(xiàn)更加自然良好的人機互動交互,并且還能引入人工智能的模式識別算法,實現(xiàn)多人的互動交互,從而大大改善互動展示效果,實現(xiàn)更加人性化有效的溝通。特別在教育培訓行業(yè),在現(xiàn)有普通硬件條件下能夠?qū)崿F(xiàn)更加生動的教學講解演示,提高學生的課堂體驗激發(fā)更多興趣,改善教學效果。

3.2運用計算機視覺與模式識別技術(shù)整合企業(yè)門禁與考勤系統(tǒng)

應用計算機視覺技術(shù)配合相對高分辨率的識別與人像數(shù)據(jù)庫,企業(yè)可以采用現(xiàn)有的門禁系統(tǒng)的硬件設備配合相應的軟件實現(xiàn)門禁與考勤系統(tǒng)的整合,以此提高企業(yè)辦公環(huán)境的智能化人性化的效果,并對員工進行更加精細化的管理。重要的是,通過人機接口的改進改變以往服務信息系統(tǒng)的面貌,讓人在自然的環(huán)境下工作提高系統(tǒng)的人性化程度。同時整合門禁與考勤系統(tǒng)可以通過識別企業(yè)內(nèi)部員工與外來人員加強辦公環(huán)境的管理,而且在硬件上可以利用現(xiàn)有的設備,軟件方面可以與前面提到的交互演示系統(tǒng)共用相同的圖形圖像處理內(nèi)核,減少代碼的冗余降低系統(tǒng)復雜度提高可靠性。就目前的人像識別技術(shù)而言,已經(jīng)在個人電腦的安全保護上得到了應用,所以在技術(shù)上是可行的,并且也有了實際應用的例子。將該技術(shù)移植到普通的門禁管理系統(tǒng)與考勤系統(tǒng)中,只需要解決接口的數(shù)據(jù)交換就能實現(xiàn),并且隨著現(xiàn)代企業(yè)辦公環(huán)境的要求,應用該技術(shù)能大大提高企業(yè)的辦公環(huán)境的智能化程度,并且通過門禁系統(tǒng)提取的企業(yè)員工考勤信息更加自然和真實,能夠更加準確地掌握和管理企業(yè)員工的日常工作情況提高管理精度。

3.3具體實現(xiàn)方法與原理

為了能充分利用企業(yè)現(xiàn)有的硬件設備,并使得附加的程序簡單化,這里針對類似會議互動展示這樣不需要細節(jié)識別的情況采用的是顏色識別的方法,即統(tǒng)計場景中的圖像直方圖,然后探測直方圖上的變化,由于特定顏色的待識別區(qū)域的引入可以對整體直方圖的特定區(qū)域產(chǎn)生峰值的變化,并且通過反向的直方圖運算又可以確定特定區(qū)域的位置。而直方圖的運算屬于比較簡單的圖像運算處理所以能夠在很多圖像處理的開發(fā)工具中直接找到。并且對于細節(jié)識別要求比較高的人像的模式識別,采用以上的運算也能縮小待檢測區(qū)域的大小,提高識別效率,并且人的面部特征采用色識別也能很快找到特征點(眼睛、鼻孔、嘴唇、頭發(fā)以及頭像邊緣)。在前面通過色彩識別找到的檢測區(qū)域中,識別出特征點,并測量特征點的位置關(guān)系比例,進而在和數(shù)據(jù)庫中數(shù)據(jù)對比模式匹配找到最終結(jié)果。

4結(jié)語

在越南河內(nèi)的機場,為了使乘客能在等待航班時有比較輕松的環(huán)境,在旅客的候機大廳專門安放了一臺具有互動功能的投影儀,并將互動內(nèi)容投影在地面,乘客可以在候機時與地面上的互動投影交互,緩解候機帶來的單調(diào)乏味感。同樣我們可以把它引入到日常企業(yè)辦公會議或者是培訓教育類企業(yè)的日常教學中,運用現(xiàn)有的投影屏幕和現(xiàn)有的設備實現(xiàn)多人的在投影屏幕上的互動交互討論。而人像識別系統(tǒng)在單機上的應用也在很多商用筆記本電腦上得到了應用,在一些科研院所和高科技企業(yè)人像識別的門禁系統(tǒng)也被應用到了辦公環(huán)境當中,提高了辦公環(huán)境的智能化程度;將人像識別技術(shù)結(jié)合考勤系統(tǒng)則在教育行業(yè)能夠?qū)崿F(xiàn)更為方便的考勤管理防止目前比較嚴重的代簽逃課等情況的發(fā)生。隨著現(xiàn)在對數(shù)據(jù)挖掘技術(shù)的研究,從日常情況采集到的數(shù)據(jù)積累到一定程度還能為今后分析員工/學生行為做出數(shù)據(jù)的積累。這里所討論和解決的問題主要只是集中在人機交互界面的一些改進,其實對于IT技術(shù)而言這只是一小部分,對于企業(yè)而言需要使用IT技術(shù)真正提高企業(yè)的工作效率還需要其他很多方面的配合和集成。

作者:趙磊 鄧世翔 劉德飛 單位:云南機電職業(yè)技術(shù)學院

參考文獻:

[1]黎松,平西建,丁益洪.開放源代碼的計算機視覺類庫OpenCv的應用[J].計算機應用與軟件,2005,22(8).

[2]陳雪松.基于圖像勢能理論的特征提取方法研究[D].華中科技大學,2011.

[3]李超,許春耀,潘林,余輪.面向投影環(huán)境的計算機視覺交互信息獲取[J].電視技術(shù),2013,37(11).