前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺運用主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞 計算機;視覺技術(shù);應(yīng)用研究
中圖分類號:TP212 文獻標識碼:A 文章編號:1671-7597(2013)16-0114-01
計算機視覺技術(shù)自20世紀70年代產(chǎn)生以來就得到了全世界的廣泛關(guān)注。作為一種多學科綜合應(yīng)用下的新技術(shù),隨著專家對其研究會的不斷深入,其應(yīng)用領(lǐng)域也越來越廣,給人們的生產(chǎn)生活帶來了極大方便。
1 計算機視覺技術(shù)
計算機視覺技術(shù)是在計算機技術(shù)應(yīng)用下發(fā)展起來的一種新技術(shù),主要用來研究計算機模擬生物的宏觀或外顯功能。該技術(shù)在應(yīng)用過程中會涉及到計算機科學、神經(jīng)生物學、人工智能、模式識別以及圖像處理等多個學科,多學科技術(shù)的綜合運用使得計算機具有了“感知”周圍世界的能力,這也正是該技術(shù)發(fā)揮作用的核心所在。計算機視覺技術(shù)的特點就在于,首先,它能在不接觸被測者的前提下完成對被測者的檢測;其次,該技術(shù)應(yīng)用的領(lǐng)域和檢測的對象非常廣,能在敏感器件的應(yīng)用下,完成對人類難以觀察到的超聲波、微波和紅外線等的檢測;最后,該技術(shù)還突破了人在視覺觀察上長時間工作的限制,能對檢測對象進行長時間觀察。
2 計算機視覺技術(shù)在各領(lǐng)域的應(yīng)用分析
隨著計算機視覺技術(shù)研究的不斷加深,該技術(shù)的應(yīng)用領(lǐng)域也越來越廣,下面,本文就選取工業(yè)、農(nóng)業(yè)、林業(yè)、農(nóng)產(chǎn)品檢測、電力系統(tǒng)自動化及圖書館工作這6個方面對計算機視覺技術(shù)的應(yīng)用進行簡要分析。
2.1 在工業(yè)領(lǐng)域中的應(yīng)用
工業(yè)生產(chǎn)對產(chǎn)品的質(zhì)量要求極高,計算機視覺技術(shù)在工業(yè)上的應(yīng)用主要集中在以下3方面:1)產(chǎn)品形狀和尺寸的檢測上。對制造業(yè)而言,產(chǎn)品的形狀和尺寸是否合格直接影響到產(chǎn)品在實際應(yīng)用過程中作用的發(fā)揮。計算機視覺技術(shù)的應(yīng)用能對產(chǎn)品進行二維和三維等幾何特征的檢測,如產(chǎn)品的圓度、位置及形狀等。2)產(chǎn)品零部件缺失情況的檢測。在生產(chǎn)線運行過程中,計算機視覺技術(shù)能準確檢測出產(chǎn)品在生產(chǎn)過程中是否存在鉚釘、螺絲釘?shù)攘悴考娜笔б约爱a(chǎn)品內(nèi)部是否在生產(chǎn)過程中摻進雜質(zhì)等。3)產(chǎn)品表面質(zhì)量的檢測。為了從各個方面保證產(chǎn)品的合格性,對其進行表面質(zhì)量的檢測也是一個極其重要的環(huán)節(jié)。計算機視覺技術(shù)實現(xiàn)了對產(chǎn)品表面的紋理、粗糙度、劃痕、裂紋等各方面的有效檢測。
2.2 在農(nóng)業(yè)生產(chǎn)領(lǐng)域中的應(yīng)用
該技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用主要集中在以下兩方面:1)對病蟲害的預(yù)測預(yù)報。預(yù)測預(yù)報作用發(fā)揮的關(guān)鍵環(huán)節(jié)是建立起計算機視覺技術(shù)對所有昆蟲的識別體系。對昆蟲圖像識別系統(tǒng)進行數(shù)字化建模所使用的方法主要以下2種,一種是運用數(shù)學形態(tài)學的方法對害蟲的邊緣進行檢測,進而提取害蟲的特征;第二種是從昆蟲的二值化圖像中提取出昆蟲的周長、面積和復(fù)雜度等基本信息,并對這些信息建立害蟲的模板庫以實現(xiàn)對昆蟲的模糊決策分析。2)對農(nóng)作物生長的監(jiān)測。常用的方法就是運用計算機視覺技術(shù)下的非接觸式監(jiān)測系統(tǒng)對農(nóng)作物生長環(huán)境下的光照、溫度、濕度、風速、營養(yǎng)液濃度等相關(guān)因素進行連續(xù)地監(jiān)測,進而判斷出農(nóng)作物長勢。
2.3 在林業(yè)生產(chǎn)中的應(yīng)用
該技術(shù)在林業(yè)生產(chǎn)中的應(yīng)用主要集中在農(nóng)藥噴灑和林木球果采集這兩方面。就林業(yè)的農(nóng)藥噴灑而言,常規(guī)的農(nóng)藥噴灑方式易造成農(nóng)藥的大量流失,不僅達不到防止林業(yè)有害生物的目的,還浪費了大量的人力、物力和財力。計算機視覺技術(shù)的應(yīng)用能通過對施藥目標圖像進行實時分析,得出具體的施藥量和準確的施藥位置,該技術(shù)指導(dǎo)下的施藥工作極大發(fā)揮了農(nóng)藥的效果。就林木球果采集而言,該采集工作的操作難度一直都很大,我國當前使用的方法主要是人工使用專業(yè)工具下的采集以及機械設(shè)備運用下的高空作業(yè)車采集和搖振采種機采集,這兩種方式都存在一定的安全性和效率問題。計算機視覺技術(shù)的應(yīng)用能通過對需要進行采集的林木球果進行圖像采集來得出球果所處的具置,再結(jié)合專業(yè)機械手的使用完成球果采集。該技術(shù)不僅節(jié)省了大量勞動力,還極大提高了采摘效率。
2.4 在農(nóng)產(chǎn)品檢測中的應(yīng)用
農(nóng)產(chǎn)品在生產(chǎn)過程中受自然環(huán)境的影響比較大,所以農(nóng)產(chǎn)品不僅會產(chǎn)生質(zhì)量上的差異,還會造成顏色、大小、形狀等外觀上的極大不同。由于農(nóng)產(chǎn)品在出售時大多要進行產(chǎn)品等級的劃分,所以將計算機視覺技術(shù)運用到對其顏色和外形尺寸的檢測上,有效達到了對農(nóng)產(chǎn)品進行檢測的目的。通過對外觀大小尺寸的檢測,不僅提高了對農(nóng)產(chǎn)品進行分門別類地等級劃分的效率,還在很大程度上減少了對產(chǎn)品的損壞;通過對西瓜等農(nóng)產(chǎn)品進行顏色上的檢測,能準確判斷其是否成熟,有效避免了人工操作下的失誤。
2.5 在電力系統(tǒng)自動化中的應(yīng)用
計算機視覺技術(shù)在電力系統(tǒng)自動化應(yīng)用的表現(xiàn)當前主要表現(xiàn)在以下2個方面:1)在人機界面中的應(yīng)用。人機界面在運行過程中更加強調(diào)人的主體地位,實現(xiàn)了用戶對各種效應(yīng)通道和感覺通道的運用。具體來講,計算機視覺技術(shù)在用戶向計算機的輸入方面,效應(yīng)通道實現(xiàn)了手動為主向手、足、口、身體等的轉(zhuǎn)變;在計算機向用戶的輸出方面,感覺通道實現(xiàn)了視覺為主向觸覺、嗅覺、聽覺等的轉(zhuǎn)變。2)在電廠煤粉鍋爐火焰檢測中的應(yīng)用。對煤粉鍋爐火焰的檢測既能有效判斷鍋爐的運行狀況,又能在很大程度上實現(xiàn)電廠的安全性運營。由于煤的負荷變化和種類變化會在使著火位置發(fā)生移動,所以為了保證爐膛火焰檢測的準確性,必須彌補之前單純應(yīng)用火焰檢測器只能判斷有無火焰開關(guān)量信號的弊端。計算機視覺技術(shù)的應(yīng)用,就在彌補火焰檢測器應(yīng)用弊端的基礎(chǔ)上,實現(xiàn)了對火焰形狀的進一步檢測。
2.6 在圖書館工作中的應(yīng)用
隨著當前數(shù)字圖書館和自動化管理系統(tǒng)的建立,計算機技術(shù)在圖書館方面的應(yīng)用越來越廣泛。當前計算機視覺技術(shù)在圖書館方面的應(yīng)用主要集中在古籍修補和書刊剔舊這兩方面。就古籍修補而言,古籍圖書等在收藏的過程中,受溫度、濕度、光照等的影響,極易導(dǎo)致紙張變黃、變脆以及蟲洞等現(xiàn)象的出現(xiàn)。在進行修補時,依靠計算機視覺技術(shù)開展具體的修補工作,能在很大程度上提高修補工作的效率。就書刊剔舊而言,由于圖書館藏書眾多,對那些使用率低且較為陳舊的文獻資料進行及時地剔除,能實現(xiàn)圖書資源的及時更新。計算機視覺技術(shù)在該方面的應(yīng)用,極大地保證了工作的準確性和效率性。
3 結(jié)束語
通過以上對計算機視覺技術(shù)在工業(yè)、農(nóng)業(yè)、林業(yè)、農(nóng)產(chǎn)品檢測、電力系統(tǒng)自動化及圖書館工作這6個方面的研究可以看出,隨著計算機技術(shù)的進一步發(fā)展以及計算機與各專業(yè)學科的不斷滲透,該技術(shù)的發(fā)展前景和應(yīng)用領(lǐng)域都將更加廣闊。
參考文獻
(1)課程內(nèi)容方面:工程應(yīng)用價值較小的內(nèi)容居多;具備工程應(yīng)用價值的方法,如基于結(jié)構(gòu)光的3D信息獲取,在課程內(nèi)容中卻極少出現(xiàn)。
(2)課程定位方面:現(xiàn)有課程體系中未能體現(xiàn)最新研究成果,而掌握世界最新工程應(yīng)用成果是卓越工程師的基本要求之一。
(3)教學形式方面:傳統(tǒng)計算機視覺課程側(cè)重基本原理,盡管范例教學被引入到課堂教學中,在一定程度上幫助學生理解,但卓越工程師培養(yǎng)目標是培養(yǎng)學生解決實際工程問題的能力。針對卓越工程師培養(yǎng)目標,以及目前計算機視覺課程中存在的問題,本文提出工程應(yīng)用導(dǎo)向型的課程內(nèi)容、面向最新成果的課程定位、理論實例化與工程實踐化的教學形式,以培養(yǎng)具有扎實理論基礎(chǔ)及工程實踐能力的卓越工程師。
1工程應(yīng)用導(dǎo)向型的課程內(nèi)容傳統(tǒng)計算機視覺課程圍繞Marr理論框架展開教學,其中部分原理僅在理想狀態(tài)或若干假設(shè)下成立,不能直接運用到工程實踐中。近年來已具備工程應(yīng)用基礎(chǔ)的原理及方法,在傳統(tǒng)課程內(nèi)容中較少出現(xiàn),如已在工業(yè)測量、視頻監(jiān)控、游戲娛樂等領(lǐng)域中應(yīng)用的主動式三維數(shù)據(jù)獲取方法等。我們對工程應(yīng)用價值高的課程內(nèi)容,增加課時,充分講解其原理及算法,并進行工程實例分析;對工程應(yīng)用價值較低內(nèi)容,壓縮課時,以介紹方法原理為主。例如,在教授3D信息獲取部分時,課時主要投入到工程應(yīng)用價值較大的內(nèi)容,如立體視覺、運動恢復(fù)結(jié)構(gòu)、基于結(jié)構(gòu)光的3D信息獲取等;而對于基于陰影的景物恢復(fù)等缺乏應(yīng)用基礎(chǔ)的內(nèi)容主要介紹其基本原理,并引導(dǎo)學生進行其工程應(yīng)用的可行性分析,培養(yǎng)學生縝密的思維習慣,訓練學生辯證的分析能力。
2面向最新成果的課程定位計算機視覺近十年來發(fā)展迅速,新方法和新理論層出不窮,在現(xiàn)有課程體系中未能得以體現(xiàn)。跟進世界最新成果是卓越工程師的基本要求之一,因此計算機視覺課程定位應(yīng)當面向國際最新成果。為實現(xiàn)這一目標,我們主要從以下兩方面入手。
(1)選用涵蓋最新成果的教材。我們在教學中加入國際最新科研成果及應(yīng)用范例,在教材選取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作為參考教材。該書是RichardSzeliski教授在多年MIT執(zhí)教經(jīng)驗及微軟多年計算機視覺領(lǐng)域工作經(jīng)驗基礎(chǔ)上所著,涵蓋計算機視覺領(lǐng)域的主要科研成果及應(yīng)用范例,參考文獻最新引用至2010年。這是目前最新的計算機視覺著作之一,條理清晰,深入淺出,特點在于對計算機視覺的基本原理介紹非常詳盡,算法應(yīng)用緊跟國際前沿。
(2)強化學生調(diào)研及自學能力。“授之以魚”,不如“授之以漁”。在教授學生的同時,更重要的是培養(yǎng)學生調(diào)研、跟蹤、學習并分析國際最新科研及工程應(yīng)用成果的能力。為強化學生的知識結(jié)構(gòu),培養(yǎng)學生跟蹤國際前沿的能力,我們在教學中加入10%的課外學時,指導(dǎo)每位學生完成最近三年本領(lǐng)域的國際最新文獻調(diào)研及工程應(yīng)用新技術(shù)調(diào)研,并撰寫相關(guān)調(diào)研論文。同時,設(shè)置2學時課內(nèi)學時,讓每位學生介紹調(diào)研成果,并進行課堂討論。在調(diào)研基礎(chǔ)上,選擇相關(guān)算法進行了實驗證明,進一步強化學習成果。實踐證明,由于學生能夠根據(jù)自己的興趣,選擇本領(lǐng)域感興趣的課題進行深入調(diào)研,極大地調(diào)動了學生的積極性,強化了學生調(diào)研、跟蹤、學習并分析國際最新科研及工程應(yīng)用成果的能力。
3工程實踐化的教學形式我們在教學中提出工程實踐化的教學形式,即以人類視覺功能為背景,由相應(yīng)工程實例引出相關(guān)理論,并最終將理論運用到工程實例中的算法和方法傳授給學生。
關(guān)鍵詞:農(nóng)業(yè)機械;新技術(shù);發(fā)展
1.農(nóng)業(yè)機械新技術(shù)的應(yīng)用和發(fā)展的重要性
我國是一個農(nóng)業(yè)大國,農(nóng)業(yè)是我國國民經(jīng)濟的基礎(chǔ),農(nóng)業(yè)機械新技術(shù)的應(yīng)用和發(fā)展具有重要的意義。
第一,提高機械的運作效率。目前在農(nóng)業(yè)機械的使用方面,有的機械在使用過程中不能清晰地識別農(nóng)作物的位置,比如,在收割小麥的過程中,有的小麥受到大風影響產(chǎn)生倒伏,對這些倒伏區(qū)域,機械在收割過程中很容易漏掉。所以在農(nóng)業(yè)機械中使用新技術(shù)有利于彌補農(nóng)業(yè)機械的漏洞,提高機械的運作效率。
第二,解放勞動力,促進經(jīng)濟發(fā)展。農(nóng)業(yè)是一個需要大量年輕勞動力的行業(yè),農(nóng)業(yè)機械新技術(shù)的應(yīng)用有利于實現(xiàn)農(nóng)業(yè)種植、收割的自動化,解放勞動力。這些年輕的勞動力投入到其他的領(lǐng)域,有利于促進我國經(jīng)濟的發(fā)展。
2.農(nóng)業(yè)機械新技術(shù)的應(yīng)用
21世紀是個科技迅速翻新的時代,目前農(nóng)業(yè)機械領(lǐng)域的新技術(shù)也層出不窮,下面介紹幾種最新出現(xiàn)的農(nóng)業(yè)機械新技術(shù)。
(1)計算機視覺技術(shù)。計算機視覺技術(shù)出現(xiàn)于20世紀70年代末,主要利用計算機視覺技術(shù)進行農(nóng)產(chǎn)品品質(zhì)和農(nóng)產(chǎn)品等級的檢查。計算機視覺是一種以圖像處理為基礎(chǔ)而興起的學科,主要對視覺信息處理的計算理論、表達與計算方法進行研究。[1]隨著計算機視覺技術(shù)應(yīng)用領(lǐng)域的不斷擴展,目前在農(nóng)業(yè)機械生產(chǎn)方面,計算機視覺技術(shù)不僅能夠用于檢查農(nóng)產(chǎn)品品質(zhì)和分級,還可以用于播種和收割。但是由于計算機視覺技術(shù)在農(nóng)業(yè)機械方面的使用時間比較短,一些技術(shù)難題還沒有得到解決,所以計算機視覺技術(shù)在農(nóng)業(yè)機械方面的應(yīng)用還需要繼續(xù)研究。
(2)人工智能技術(shù)。隨著智能化的發(fā)展,智能技術(shù)在農(nóng)業(yè)機械方面的應(yīng)用也得以實現(xiàn)。美國運用人工智能技術(shù)發(fā)明了激光拖拉機,不僅可以控制拖拉機的行進方向,還能夠?qū)ν侠瓩C進行具體的定位。[2]通過人工智能技術(shù),人們建立了一個龐大的數(shù)據(jù)庫,通過這個數(shù)據(jù)庫可以對土地的具體情況進行掌握,以設(shè)計出具體的農(nóng)業(yè)生產(chǎn)所需的化肥、種子、農(nóng)藥、水等原料的用量。
(3)機器人技術(shù)。比智能化更進步的就是機器人技術(shù),機器人技術(shù)在農(nóng)業(yè)機械中的應(yīng)用,這是計算機信息網(wǎng)絡(luò)和計算機視覺技術(shù)以及自動化控制等技術(shù)的結(jié)合的產(chǎn)物。目前研發(fā)出了除草機器人、播種機器人、澆水機器人、施肥機器人等,利用機器人進行農(nóng)業(yè)生產(chǎn)活動,可以節(jié)省人工費用,解放勞動力,避免有些農(nóng)業(yè)生產(chǎn)活動,對人體產(chǎn)生危害。
(4)自動控制技術(shù)。在農(nóng)業(yè)機械中運用自動控制技術(shù),可以幫助操作者降低操作難度,同時可以根據(jù)地勢的高低和秸稈的長短來調(diào)節(jié)高度,保證機械使用過程中的安全性,提高農(nóng)業(yè)機械使用的可靠性,提高農(nóng)業(yè)生產(chǎn)效率。
3.農(nóng)業(yè)機械新技術(shù)的發(fā)展
農(nóng)業(yè)機械新技術(shù)的應(yīng)用和發(fā)展都是為了提高農(nóng)業(yè)的生產(chǎn)率服務(wù)的,所以農(nóng)業(yè)機械新技術(shù)的發(fā)展主要表現(xiàn)為以下幾點:
第一,加速新技術(shù)的使用和推廣??茖W技術(shù)是第一生產(chǎn)力,加速計算機視覺技術(shù)、自動控制技術(shù)、智能化技術(shù)等新技術(shù)在農(nóng)業(yè)機械中的使用,同時引進國外先進的機械新技術(shù),對推動我國農(nóng)業(yè)的發(fā)展,提高農(nóng)業(yè)的生產(chǎn)效率具有重大的意義。
第二,政府補貼。新型機械的購買都是生產(chǎn)個體自行組織的,資金壓力大,使得機械新技術(shù)難以推廣,所以對于農(nóng)業(yè)機械新技術(shù)的推廣使用,政府要在物質(zhì)上予以補貼,拓展新機械的使用范圍。
第三,提高農(nóng)業(yè)資源利用效率。機械使用的目的就是為了提高農(nóng)業(yè)的生產(chǎn)效率,提高農(nóng)業(yè)資源的利用率。例如,在傳統(tǒng)的農(nóng)業(yè)生產(chǎn)過程中,對農(nóng)作物秸稈的處理方式,絕大多數(shù)情況就是焚燒,不僅浪費資源,而且污染空氣。但是農(nóng)業(yè)機械新技術(shù)的使用通過將農(nóng)作物的秸稈進行粉碎處理,將農(nóng)作物秸稈轉(zhuǎn)化為肥料,不僅提高了農(nóng)作物資源的使用效率,也減小了空氣的污染程度。
4.結(jié)語
隨著科技的發(fā)展,計算機視覺技術(shù)、自動控制技術(shù)、智能化技術(shù)等新技術(shù)在農(nóng)業(yè)機械方面的應(yīng)用越來越廣,農(nóng)業(yè)機械新技術(shù)的應(yīng)用和推廣將大大提高我國農(nóng)業(yè)的生產(chǎn)效率,提高農(nóng)業(yè)資源的利用率,促進國民經(jīng)濟的發(fā)展。
參考文獻:
[1]田 靜.探討農(nóng)業(yè)機械新技術(shù)的應(yīng)用與發(fā)展[J].中國農(nóng)資,2013(36): 74.
關(guān)鍵詞:OpenCV;人臉檢測;實時
中圖分類號:TP391.41
人臉檢測(Face Detection)是指對于給定的圖像或視頻,采用一定的策略對其進行搜索以確定其中是否含有人臉,如果是則返回一臉的位置、大小和姿態(tài)。人臉檢測是人臉識別的重要環(huán)節(jié),運用攝像機或攝像頭采集含有人臉的視頻流,并進行實時的人臉檢測是目前主流的應(yīng)用。
OpenCV(Open Source Computer Vision Library)是開源的計算機視覺代碼庫,它輕量級而且高效,由一系列C函數(shù)和少量C++類構(gòu)成,實現(xiàn)了圖像處理和計算機視覺的接口,實現(xiàn)了圖像處理和計算機視覺方面的很多通用算法[1]。
1 系統(tǒng)設(shè)計
本系統(tǒng)采用了OpenCV的基于boost篩選式級聯(lián)Haar分類器,該分類器是通過成千上萬的物體各個角度的訓練圖像訓練出來的,它先對圖像進行直方圖均衡化處理,并將圖像歸一化到同樣大小,然后標記是否包含要檢測的物體,在人臉檢測方面比較擅長。系統(tǒng)加載分類器后,利用OpenCV的視頻捕獲函數(shù)實時捕獲連接在電腦上的攝像頭讀入的視頻流,并將抓取的視頻幀轉(zhuǎn)換為圖像,然后對圖像進行人臉檢測和標定,具體流程圖如圖1所示:
圖1 系統(tǒng)流程圖
2 系統(tǒng)實現(xiàn)
本系統(tǒng)在WindowsXP操作系統(tǒng)下使用VC++6.0基于OpenCV1.0進行開發(fā)。系統(tǒng)具體實現(xiàn)如下:
(1)初始化聲明。通過CvMemStorage*captureFaceStorage=cvCreateMemStorage(0);語句創(chuàng)建一個內(nèi)存存儲器,來統(tǒng)一管理各種動態(tài)對象的內(nèi)存,參數(shù)為0時創(chuàng)建的內(nèi)存塊默認大小為64k。然后分別聲明分類器對象、圖像對象級聯(lián)名稱及識別函數(shù)等成員:
Static CvHaar Classifier Cascade* cascade=0;
Ipl Image *frame,*frame_copy=0;
Char* capture Face Cascade_name=haarcascade_frontalface_alt2.xml;
(2)加載分類器。通過cvLoad函數(shù),加載調(diào)用CvHaarClassifierCascade類的分類器文件“haarcascade_frontalface_alt2.xml”:
cascade=(CvHaarClassifierCascade*)cvLoad(captureFaceCascade_name,0,0,0);
(3)捕獲視頻。通過cvCreateCameraCapture函數(shù)捕獲攝像頭,捕獲視頻后循環(huán)執(zhí)行抓取幀操作cvGrabFrame(cap)和獲取圖像操作cvRetrieveFrame(cap)操作,從而將幀轉(zhuǎn)換成圖像,以便于處理。
(4)圖像格式轉(zhuǎn)換。一般從硬盤讀入的圖片或者通過cvCreateImage方法創(chuàng)建的IplImage圖片默認的origin屬性為0,即顯示的時候都是正的。而由攝像頭或者視頻文件獲取的幀圖像origin屬性為1,此時顯示的圖像掃描順序是從下到上,它會將幀圖像的第i行賦值給圖像的第height-i行,因此采集的圖像會出現(xiàn)倒立現(xiàn)象,為此,應(yīng)將復(fù)制的圖像的origin屬性調(diào)整為與幀圖像的origin屬性一致。此時需要使用cvFlip(frame,frame_copy,0)函數(shù),實現(xiàn)對幀圖像沿X軸的翻轉(zhuǎn)。
(5)識別與檢測人臉。本部分主要實現(xiàn)人臉檢測功能,首先將從實時視頻中提取的圖像進行灰度化處理:
然后調(diào)整新圖像gray,使它精確匹配目標small_img的大小,并利用cvEqualizeHist函數(shù)進行灰度圖像直方圖均衡化處理,最終通過cvHaarDetectObjects函數(shù)檢測出人臉:
(6)標定檢出的的人臉。繪制目標圓形區(qū)域,標定出檢測出的人臉:
最后通過cvShowImage("result",img)顯示出檢測后的圖像,如果檢測到人臉,顯示效果圖。
3 結(jié)束語
基于的攝像頭實時人臉檢測系統(tǒng)的實現(xiàn)充分說明了OpenCV技術(shù)在實現(xiàn)人臉檢測方面的效率高、功能強的特點,OpenCV必將在計算機視覺、圖形圖像處理領(lǐng)域有著廣泛地應(yīng)用前景。
參考文獻:
[1]Gray Bradski,Adrian Kaebler.Learning OpenCV:Computer Vision with the OpenCV Library[M].USA:O Reilly media,2008.
[2]梁路宏.人臉檢測研究綜述[J].計算機學報,2002(05):449-458.
作者簡介:徐占鵬(1979.01-),男,山東棲霞人,講師,碩士,研究方向:計算機應(yīng)用、計算機圖形圖像處理和計算機視覺。
關(guān)鍵詞:農(nóng)業(yè)機械;技術(shù)手段;應(yīng)用;發(fā)展前景
我國在國際上的地位正在逐漸提高,這與我國的經(jīng)濟發(fā)展是分不開的,經(jīng)濟的發(fā)展需要基礎(chǔ)的支持,農(nóng)業(yè)就是我國的基礎(chǔ),我國是農(nóng)業(yè)大國,農(nóng)村人口基數(shù)大。隨著近幾年我國農(nóng)業(yè)的發(fā)展,很多高新技術(shù)也被運用到農(nóng)業(yè)的機械設(shè)備中,使農(nóng)機設(shè)備向著智能化的方向發(fā)展,有效地提升了農(nóng)業(yè)生產(chǎn)的整體效率。在農(nóng)業(yè)的生產(chǎn)中使用高新技術(shù)還能夠提高農(nóng)業(yè)的生產(chǎn)效率,保證農(nóng)機相關(guān)機械的正常運作。
1農(nóng)業(yè)機械技術(shù)的應(yīng)用分析
1.1計算機技術(shù)
這里所說的計算機技術(shù)主要指的是計算機視覺技術(shù),這一技術(shù)最早被運用在農(nóng)業(yè)機械上是在20世紀70年代中期,當時主要運用的是計算機技術(shù)中的視覺技術(shù),利用這一技術(shù)的主要目的是可以對農(nóng)產(chǎn)品的品質(zhì)質(zhì)量進行分級別檢查。計算機視覺技術(shù)是以圖像處理為基準,隨著圖像處理以及視覺模擬技術(shù)的發(fā)展,計算機視覺技術(shù)不僅可以用來檢查農(nóng)產(chǎn)品的品質(zhì),而且還可以用來對農(nóng)產(chǎn)品進行播種、收割。雖然計算機視覺技術(shù)在我國農(nóng)業(yè)技術(shù)領(lǐng)域的應(yīng)用時間還不是很長,在實際的使用中還有很多的問題出現(xiàn),但是相信隨著科學技術(shù)的不斷發(fā)展,計算機視覺技術(shù)必將會改變傳統(tǒng)的農(nóng)業(yè)作業(yè)模式,為現(xiàn)代化農(nóng)業(yè)發(fā)展提供技術(shù)上的支持。
1.2網(wǎng)絡(luò)信息技術(shù)
網(wǎng)絡(luò)信息技術(shù)在我國農(nóng)業(yè)機械上的應(yīng)用是非常成功的,信息技術(shù)與地理信息系統(tǒng)的有機結(jié)合不僅可以為農(nóng)業(yè)的生產(chǎn)提供高精度的監(jiān)控,而且還能夠?qū)r(nóng)業(yè)生產(chǎn)中出現(xiàn)病蟲害的情況進行及時的檢測,然后根據(jù)定位系統(tǒng)來進行田間作業(yè)。
1.3液壓技術(shù)
液壓技術(shù)主要依靠的是微電子技術(shù)和工業(yè)傳感技術(shù),在數(shù)據(jù)的采集上,運用液壓技術(shù)主要完成的是能量的轉(zhuǎn)換和匹配,其目的是為了讓農(nóng)業(yè)機械的效率能夠得到進一步的提高,讓機械設(shè)備的相關(guān)系統(tǒng)特征可以得到完善,讓機械設(shè)備的可靠性能夠得到提升,這也很好地符合了環(huán)境保護的相關(guān)標準要求。而大部分的農(nóng)業(yè)機械都是采用內(nèi)燃機作為原動力,所以很多時候都會出現(xiàn)工作負荷,一般情況下,我們都是通過電液控制手段來完成負載與原動力之間的匹配情況,盡可能地減少功率傳輸過程中出現(xiàn)的損失,從而提高農(nóng)業(yè)機械系統(tǒng)的工作效率。
1.4人工智能技術(shù)
隨著信息全球化的不斷深入,高端技術(shù)不僅在大型的企事業(yè)單位中被運用,在農(nóng)業(yè)中也得到了廣泛的應(yīng)用,比較有成果的就是美國利用人工智能技術(shù)研發(fā)出激光拖拉機、機械的內(nèi)部導(dǎo)航裝置,等等,這些裝置可以對拖拉機的運行方向及所處位置進行實時的測定,在了解地區(qū)土地信息之后,再制定合理的土地種植方案、農(nóng)藥及種子的數(shù)量,等等。
2農(nóng)業(yè)機械技術(shù)的發(fā)展趨勢
2.1推廣農(nóng)業(yè)機械產(chǎn)品的技術(shù)發(fā)展
目前在我國的農(nóng)業(yè)機械發(fā)展上,已經(jīng)開始運用機電智能化技術(shù)和計算機技術(shù),這使得農(nóng)業(yè)機械化設(shè)備的科技含量有了極大的提高,不僅有效地提高了農(nóng)業(yè)機械的作業(yè)效率,而且也提升了農(nóng)業(yè)的生產(chǎn)效率。
2.2農(nóng)業(yè)資源的利用率得到了提升
只有提高了農(nóng)業(yè)資源的開發(fā)利用率,才能夠確保農(nóng)業(yè)實現(xiàn)可持續(xù)發(fā)展,同時也為保護生態(tài)環(huán)境奠定基礎(chǔ),如回收農(nóng)業(yè)生產(chǎn)的廢棄物,普及無害化的處理設(shè)備,運用無害化技術(shù)來處理廢水可以有效地達到保護環(huán)境的作用。而在農(nóng)業(yè)種植的過程中,使用有機肥料還可以進一步提高農(nóng)業(yè)資源的利用效率。除此之外,大力發(fā)展節(jié)能型動力機械設(shè)備可以有效地避免出現(xiàn)資源浪費,從而提高農(nóng)業(yè)資源的整體利用效率。
2.3提高農(nóng)業(yè)機械產(chǎn)品的質(zhì)量監(jiān)督水平
要想提升農(nóng)業(yè)的機械化水平,還要從規(guī)范設(shè)計的基本要求出發(fā),全面提高農(nóng)業(yè)產(chǎn)品的質(zhì)量。在質(zhì)量提升的過程中,還要注重農(nóng)業(yè)產(chǎn)品的整體造型和外觀,農(nóng)機設(shè)備的耐久性也要經(jīng)得起考驗。選用與農(nóng)機設(shè)備相配套的發(fā)電機及元件,能夠最大程度上提高農(nóng)業(yè)機械產(chǎn)品的質(zhì)量。在農(nóng)業(yè)機械設(shè)備完成安裝之后,還要對其進行試運行,只有保證了設(shè)備各項指標都正常的基礎(chǔ)上,才能夠真正的投入使用,這也是提高農(nóng)業(yè)機械產(chǎn)品可靠性的前提。
2.4加大政府的補貼力度
各級地方政府要加大農(nóng)業(yè)機械的技術(shù)推廣,做好農(nóng)業(yè)機械的培訓工作。國家還要將拖拉機、插秧機等農(nóng)機具作為農(nóng)具購置補貼的關(guān)鍵,普及農(nóng)業(yè)機械知識。這樣也能夠更好地提高農(nóng)業(yè)機械化的發(fā)展進程。
2.5確保農(nóng)業(yè)機械技術(shù)的安全生產(chǎn)
關(guān)注安全監(jiān)督管理及裝備的創(chuàng)建工作,加大農(nóng)業(yè)機械的安全投入,以便更好地滿足農(nóng)業(yè)機械工作安全監(jiān)督管理的需求。除此之外,最重要的是,要將農(nóng)業(yè)機械的安全檢驗工作納入到各級縣市政府的財政預(yù)算當中。
3結(jié)語
隨著科學技術(shù)的飛速發(fā)展,一些高新技術(shù)正在逐漸地被運用到農(nóng)業(yè)的機械設(shè)備中,這些機械設(shè)備的出現(xiàn)不僅提高了農(nóng)業(yè)的整體生產(chǎn)水平,而且還進一步提升了農(nóng)業(yè)的生產(chǎn)效率,很好地實現(xiàn)了農(nóng)業(yè)的可持續(xù)發(fā)展。在今后的農(nóng)業(yè)發(fā)展過程中,農(nóng)業(yè)機械也必定是智能化的,所以要求操作人員要不斷地提高自己的專業(yè)素養(yǎng),全面推廣農(nóng)業(yè)機械新技術(shù),只有這樣才能夠真正意義上實現(xiàn)我國農(nóng)業(yè)機械的智能化。
作者:徐家亮 劉曉鵬 單位:黑龍江省克東縣農(nóng)機安全監(jiān)理站
參考文獻:
[1]陶樂然.長春星宇小區(qū)新技術(shù)應(yīng)用[C]//增強自主創(chuàng)新能力促進吉林經(jīng)濟發(fā)展———啟明杯•吉林省第四屆科學技術(shù)學術(shù)年會論文集(下冊).2006.
[2]劉蒙之.傳播新技術(shù)與國家發(fā)展———一種政治經(jīng)濟學的觀察[C]//中國傳播學會成立大會暨第九次全國傳播學研討會論文集.2006.
[3]張仁江,田莉.制造業(yè)企業(yè)新技術(shù)采納:動因、路徑及障礙分析———基于T公司的縱向案例研究[C]//第六屆(2011)中國管理學年會———技術(shù)與創(chuàng)新管理分會場論文集.2011.
[4]胡札進,姚尚斌,徐七三“.雙低”儲藏與四項儲糧新技術(shù)的綜合應(yīng)用[C]//全面建設(shè)小康社會:中國科技工作者的歷史責任———中國科協(xié)2003年學術(shù)年會論文集(上).2003.
[5]柳旭.淺析電視空間新技術(shù)對審美體驗的影響[C]//2009中國電影電視技術(shù)學會影視技術(shù)文集.2010.
關(guān)鍵詞:視覺注視;移動端;數(shù)據(jù)集;行為推測
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2017)01-0254-03
Abstract: With the development of computer vision application technology, the behavior prediction of eye gaze has been widely concerned by many scholars at home and abroad, and also has important research significance in the field of biological information recognition. In the era of smart phone tablet popularity to improve human-computer interaction and accurate prediction of the mobile side of the user gaze behavior becomes particularly important. Based on the existing research on visual technology, this paper proposes a scheme to solve the gaze behavior of mobile users by using large data combined with machine learning and convolution neural network knowledge, and analyzes the importance of large-scale data sets in visual application.
Key words: visual gaze; mobile end; data set; behavior conjecture
1 概述
伴S著計算機軟硬件性能和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,大規(guī)模的并行計算技術(shù)突飛猛進,不斷地發(fā)展使各種現(xiàn)有技術(shù)變得越來越成熟,同時機器學習和計算機視覺領(lǐng)域也都得到了飛速發(fā)展。視覺技術(shù)的發(fā)展變得越來越重要,并且可以應(yīng)用到實際生活中的很多方面。人類大量的視覺信息現(xiàn)在可以利用計算機來輔助處理,并完成相關(guān)的一些工作。相對于生物信息識別技術(shù)這一計算機視覺領(lǐng)域的熱點技術(shù)來說,也已廣泛應(yīng)用于日常生活中[1]。比如指紋識別器,人臉考勤器等平時在許多地方可以經(jīng)常見到,還有居民家用的攝像頭智能報警系統(tǒng)以及近期炒得火熱的運用支付寶進行刷臉而完成的支付技術(shù)等,這些都是運用了生物信息識別技術(shù)。現(xiàn)實中的種種跡象已經(jīng)表明運用生物信息識別的計算機技術(shù)已漸漸的滲透到人們的日常生活中并成為不可或缺的組成部分。時下發(fā)展較快也比較常見的生物特征有視網(wǎng)膜、指紋、人臉和人眼等。這些生物信息比如人臉具有個體差異性和自身穩(wěn)定性特點,從用戶的角度來看該特征具有便攜和低侵入等一些優(yōu)點。而人眼作為人臉中最顯著的特征,又是人們獲取外界信息最直接最方便的途徑。都說眼是心靈的窗戶,因為眼睛中蘊含著表情、意圖等多種信息。因此,眼睛注視的行為預(yù)測受到了國內(nèi)外眾多學者的廣泛關(guān)注,同時在生物信息識別領(lǐng)域中也具有重要的研究意義[2]。
2 注視預(yù)測問題
2.1 問題的背景
在心理、認知和用戶交互研究中的注視跟蹤最近已朝向移動解決方案發(fā)展,因為它們使得可以直接評估用戶在自然環(huán)境中的視覺注意。 除了注意,注視還可以提供關(guān)于用戶的動作和意圖的信息:用戶正在做什么以及接下來將做什么。然而,在自然狀態(tài)下非結(jié)構(gòu)化的任務(wù)中注視行為是相當復(fù)雜的,并且不能使用在受控的實驗室環(huán)境中創(chuàng)建的模型來得到令人滿意的解釋。自然條件下和實驗室環(huán)境有著很大的不同。為了演化在自然環(huán)境中對注視行為的推斷,需要一種更加整體的方法,將從認知科學到機器學習的許多學科結(jié)合在一起[3]。
從人機交互技術(shù)到醫(yī)學診斷到心理學研究再到計算機視覺,眼睛注視跟蹤在許多領(lǐng)域都有應(yīng)用。注視是外部可觀察的人類視覺注意的指標,許多人試圖記錄它。對于眼睛視線方面的研究可以追溯到十八世紀后期。而現(xiàn)如今已經(jīng)存在各種解決方案(其中許多是商業(yè)化的),但是所有的解決方案都具有以下一個或多個方面的問題:高成本(例如,Tobii X2-60),定制或侵入性硬件(例如,Eye Tribe,Tobii EyeX)。然而在現(xiàn)實中的自然條件下,這些因素對實際的應(yīng)用會造成一些障礙影響,使得眼睛注視跟蹤不能成為任何具有合理的相機(例如,智能手機或網(wǎng)絡(luò)攝像頭)的人應(yīng)該可以使用的普及技術(shù)。如何才能使得這種技術(shù)普及并且得到應(yīng)用,提出了一種解決方案。
2.2問題的提出
研究中首先要解決的就是用戶的約束問題,也就是自然條件下使用過程中所受到的各種限制問題。到目前為止,基于注視數(shù)據(jù)推斷用戶動作的研究受到許多的限制,特別是在自然環(huán)境中。限制因素可能包括可用的商業(yè)解決方案的昂貴性,其專有性和封閉性以及缺乏實時交互能力等方面。目前的注視跟蹤系統(tǒng),只是盡量在移動設(shè)置中設(shè)置各種條件進行補救。商業(yè)化定制化的解決方案都有其獨自的閉合性質(zhì),因此阻礙了注視跟蹤算法的發(fā)展,并且使得不同方法之間的客觀比較變得不可能[4]。此外,注視是一種復(fù)雜的現(xiàn)象,涉及認知過程的相互作用。這些過程在設(shè)置計算上的建模是非常困難的,尤其是涉及一些未知因素,使得構(gòu)建實驗設(shè)置成為一個很大的挑戰(zhàn)。此外,來自跟蹤實驗的數(shù)據(jù)因為其商業(yè)化的原因很少共享,即使共享數(shù)據(jù)很大部分也是有其獨立的實驗條件。這些方面的問題都阻礙了跨學科方法在分析和利用注視數(shù)據(jù)和實驗的相關(guān)研究與發(fā)展。
2.3 解決問題的研究方向
對基于注視的推斷的個體貢獻通常保持孤立,不能形成更大的整體以促進對注視動作行為的研究。隨著這方面的技術(shù)發(fā)展和應(yīng)用,最近出現(xiàn)了一些開源的解決方案。雖然在不同的應(yīng)用和用戶界面中使用注視已經(jīng)相當有限,但是移動注視跟蹤的新穎應(yīng)用開始出現(xiàn)并得到了很快的發(fā)展。然而使用移動注視跟蹤來推斷用戶動作的問題是高度多學科的,需要深入理解各個研究領(lǐng)域,包括人眼的功能,數(shù)學建模,計算機視覺,機器學習,信息技術(shù),認知過程,用戶交互以及心理學。任何一個研究員或甚至任何研究小組都不可能擁有所有研究領(lǐng)域的專家,因此需要相互的協(xié)作共同推進技術(shù)的發(fā)展[5]。
目前的研究主要是從以下幾個方面進行:
1)研究移動注視跟蹤的認知方面,例如增強對任務(wù)中的注視行為的理解或識別不同任務(wù)的特征和階段;
2)開發(fā)用于從注視數(shù)據(jù)推斷用戶動作的計算方法,諸如應(yīng)用機器學習用于行為推斷,優(yōu)選地實時地;
3)增強用于改善移動注視跟蹤方法和性能的技術(shù)軟件/硬件解決方案,并使得設(shè)備更容易訪問;
4)發(fā)現(xiàn)注視數(shù)據(jù)在自然環(huán)境和虛擬和增強現(xiàn)實應(yīng)用中的潛在用途,以及定義任務(wù),其中注視可以是用戶動作的有用的預(yù)測器。
3 解決方案
首先選擇移動端進行研究,因為目前比較普遍的移動設(shè)備比如智能手機、平板電腦都有自己可靠的工作系統(tǒng),且不需要外部附件。移動設(shè)備相對于其他平臺具有以下優(yōu)勢:
1)使用的廣泛性。據(jù)估計,到2019年,世界上超過三分之一的人口擁有智能手機,遠遠超過臺式機/筆記本電腦用戶;
2)軟硬件技術(shù)升級的采用率較高。大部分的移動設(shè)備具有允許使用擁有計算復(fù)雜數(shù)據(jù)方法的實時的最新軟硬件;
3)移動設(shè)備上相機的大量使用已經(jīng)導(dǎo)致相機技術(shù)的快速開發(fā)和部署;
4)相機相對于屏幕的固定位置減少了未知參數(shù)的數(shù)量,潛在地允許開發(fā)高精度的校準跟蹤應(yīng)用。
3.1 注視類型分析
注視估計方法可以分為基于模型或基于外觀[6]?;谀P偷姆椒ㄊ褂醚劬Φ膸缀文P停⑶铱梢员患毞譃榛诮悄し瓷浜突谛螤畹姆椒?。另一方面,基于形狀的方法從觀察到的眼睛形狀觀察注視方向。這些方法傾向于具有低的圖像質(zhì)量和可變的照明條件?;谕庥^的方法直接使用眼睛作為輸入,并可能在低分辨率圖像上工作。相比基于模型的方法,基于外觀的方法被認為需要更大量的用戶特定的訓練數(shù)據(jù)。通過使用深度學習和大規(guī)模數(shù)據(jù)不必依賴于視覺,以實現(xiàn)準確的無校準注視估計。這種方案提出建立一個基于外觀的數(shù)據(jù)模型,而不使用任何手工設(shè)計的功能,例如頭部姿勢或眼球中心位置。
3.2 技術(shù)方案
深度學習的最近成功在計算機視覺的各種領(lǐng)域中是顯而易見的,但是它對改善眼睛跟蹤性能的影響還是相當有限。因為深度學習是需要大量的數(shù)據(jù)作為支持,而視線追蹤這方面的數(shù)據(jù)集還比較少,普通的研究所得到的稻菁比較有限,最大的數(shù)據(jù)集通常只是具有50個受試者左右,由于缺乏大規(guī)模數(shù)據(jù)的可用性,因此發(fā)展比較緩慢。因而提出了使用深度學習進行研究的一套方案,就是構(gòu)造大規(guī)模的數(shù)據(jù)集。利用網(wǎng)絡(luò)資源構(gòu)造一個大規(guī)模的基于移動的眼動跟蹤數(shù)據(jù)集,它包含來自各種背景的大量的受試者,在可變照明條件和不受限制的頭部運動下記錄[7]。運用現(xiàn)有的智能算法得到一個可以進行卷積神經(jīng)網(wǎng)絡(luò)學習端到端的注視預(yù)測的后臺決策網(wǎng)絡(luò)。不依賴任何預(yù)先存在的系統(tǒng),不需要頭部姿態(tài)估計或其他手動設(shè)計的特征用于預(yù)測。使用只有雙眼和臉部的特征訓練網(wǎng)絡(luò),在這個領(lǐng)域的性能優(yōu)于現(xiàn)有的眼睛跟蹤方法。雖然現(xiàn)在的決策網(wǎng)絡(luò)在精度方面實現(xiàn)了很先進的性能,但是數(shù)據(jù)輸入的大小和參數(shù)的數(shù)量使得難以在移動設(shè)備上實時使用。 為了解決這個問題,需要培養(yǎng)學習得到一個更小更快的網(wǎng)絡(luò),在移動設(shè)備上實現(xiàn)實時性能,使得精度損失進一步降低。
3.3 大規(guī)模數(shù)據(jù)集
為了達到這一方案的預(yù)測效果,首先要進行的是數(shù)據(jù)集的建立。網(wǎng)絡(luò)上相關(guān)的研究中有許多公開的注視數(shù)據(jù)集[8]??偨Y(jié)對比這些相關(guān)的數(shù)據(jù)集,分析出有些早期的數(shù)據(jù)集不包含顯著性的頭部姿勢變化或具有粗略的注視點采樣密度。需要對這些數(shù)據(jù)進行篩選,使得到的數(shù)據(jù)具有隨機分布特點。雖然一些現(xiàn)代數(shù)據(jù)集遵循類似的方法,但它們的規(guī)模(尤其是參與者的數(shù)量)相當有限。大多數(shù)現(xiàn)有的眼動追蹤數(shù)據(jù)集已經(jīng)由邀請實驗室參與者的研究人員收集,這一過程導(dǎo)致數(shù)據(jù)缺乏變化,并且成本高且效率不高。因此需要大量的進行數(shù)據(jù)收集和篩選分析。大規(guī)模數(shù)據(jù)可以通過卷積神經(jīng)網(wǎng)絡(luò)有效地識別人臉(他們的眼睛)上的細粒度差異,從而做出準確的預(yù)測。
收集眼動跟蹤數(shù)據(jù)應(yīng)該注意的方面:
1)可擴展性。數(shù)據(jù)應(yīng)該是自然條件下的使得用戶具有靈活性;
2)可靠性。運用現(xiàn)有的智能移動設(shè)備真實的應(yīng)用圖像而非設(shè)計處理過的圖像;
3)變異性。盡量使數(shù)據(jù)具有較大的變異性,使得模型更加穩(wěn)健,適應(yīng)各種環(huán)境下的操作。
4 結(jié)束語
文章介紹了一種針對移動設(shè)備的用戶注視行為推測解決方案。首先建立一個大規(guī)模眼動跟蹤數(shù)據(jù)集,收集大量的注視數(shù)據(jù)。大型數(shù)據(jù)集的重要性,以及具有大量各種數(shù)據(jù)以能夠訓練用于眼睛跟蹤的魯棒模型。然后,訓練得到一個深層卷積神經(jīng)網(wǎng)絡(luò),用于預(yù)測注視。通過仔細的評估,利用深度學習可以魯棒地預(yù)測注視,達到一個較好的水平。此外,雖然眼睛跟蹤已經(jīng)存在了幾個世紀,相信這種新方案的策略可以作為下一代眼動跟蹤解決方案的關(guān)鍵基準。希望能通過這方面的研究,使人機交互得到更好的發(fā)展。
參考文獻:
[1] 崔耀 視控人機交互系統(tǒng)技術(shù)研究與實現(xiàn)[D].西安,西安電子科技大學,2013.
[2] 遲健男, 王志良, 張闖.視線追蹤[M].北京: 機械工業(yè)出版社, 2011.
[3] Alireza Fathi, Yin Li, and James M Rehg 2012 Learning to recognize daily actions using gaze In Computer VisionCECCV 2012. Springer, 314-327.
[4] Makeroni Labs 2016 Eye of Horus. https://hackaday.io/project/
6638-eye-of-horus-open-source-eye-tracking-assistance (2016) Accessed: 2016-02-26.
[5] Francisco J Parada, Dean Wyatte, Chen Yu, Brandi Emerick, and Thomas Busey,2015.Expert Eyes: Open-source, high-definition eyetracking Behavior research methods ,2015.
[6] 楊彩霞.基于近紅外光源的非接觸式視線跟蹤技術(shù)研究 [D].山東:山東大學,2012.
在用常見的手勢進行交流時,人們很容易就能互相理解,在經(jīng)過學習之后,聾啞人或是正常人都可以運用手語進行交流。不過,想象一下,當你對計算機(或機器)做一個手勢,它就能領(lǐng)會你的意圖會是怎樣的情景呢?如果計算機(或機器)看得懂手語,又意味著什么呢?姑且不管實現(xiàn)這樣的人機交流有何深遠的意義,還是先讓我們來探究一下這樣的可行性吧,想想看得懂手語的計算機(或機器)能有什么用途。
人機交互:從呆板到員活
人類之間的交流往往聲情并茂,既采用自然語言(口語、書面語言),還廣泛采用人體語言(表情、體勢、手勢)。與人類之間的交流相比,人機交互就顯得呆板多了。以計算機的輸入方式為例,人要向計算機下達指令,最常見的方式還是通過鍵盤輸入。當然,手寫輸入也正為許多人所接受和喜愛,語音輸入的研究也進行得熱火朝天,最初單一而呆板的輸入方式已經(jīng)得到了擴展。然而,科學研究是永無止境的,人體語言這種簡單快捷的信息交流方式得到了很多研究者的關(guān)注,他們想,能不能把這種靈活的信息交流方式也引進人機交互中呢?
于是研究人員展開了對人體語言理解的研究。人體語言的感知、人體語言與自然語言的信息融合對提高計算機的人類語言理解水平,加強人機接口的可實用性有著積極的意義。手語(手勢)是人體語言的一個非常重要的組成部分,它是包含信息量最多的一種人體語言,它與語言、書面語等自然語言的表達能力相同。因而完全可以把手語作為人機交互的一種手段,它具有很強的視覺效果,生動、形象、直觀??梢?,將手勢運用于計算機能夠很好地改善人機交互的效率。
計算機怎樣識別手勢?
從不同的角度可以對手勢進行不同的分類。分為交互性手勢和操作性手勢,前者手的運動表示特定的信息(如樂隊指揮),靠視覺來感知,后者不表達任何信息(如彈琴);分為自主性手勢和非自主性手勢,后者需要與語音配合用來加強或補充某些信息(如演講者用手勢描述動作、空間結(jié)構(gòu)等信息),分為離心手勢和向心手勢,前者直接針對說話人,有明確的交流意圖,后者只是反應(yīng)說話人的情緒和內(nèi)心的愿望。
手勢的各種組合、運動相當復(fù)雜,不過簡單來看,手勢主要有如下的特點:手是彈性物體,因此同一手勢之間差別很大,手有大量冗余信息,由于人識別手勢關(guān)鍵是識別手指特征,因此手掌特征是冗余的信息:手的位置是在三維空間,很難定位:手的表面是,非平滑的,容易產(chǎn)生陰影。
了解了手勢的這些特點,就可以在手勢研究中對手勢做適當?shù)姆指?、假設(shè)和約束。例如,可以給出如下約束:如果整個手處于運動狀態(tài),那么手指的運動和狀態(tài)就不重要,如果手勢主要由各手指之間的相對運動構(gòu)成,那么手就應(yīng)該處于靜止狀態(tài)。比如鼠標和筆式交互設(shè)備就是通過識別手的整體運動來完成人與計算機的交互,但它們不能識別手指的動作,其優(yōu)點是僅利用軟件算法就能實現(xiàn),適合于一般桌面系統(tǒng)。只有當用鼠標或筆式交互設(shè)備的運動或方向變化來傳達信息時,才可將鼠標或筆式交互設(shè)備看作手勢表達工具。筆式交互設(shè)備發(fā)展很快,它提供了充分的交互信息,如壓力、方向、旋轉(zhuǎn)和位置信息,但現(xiàn)有交互主要是簡單地替代鼠標。
計算機識別手勢的手段主要有兩種:
1.數(shù)據(jù)手套。數(shù)據(jù)手套是虛擬現(xiàn)實系統(tǒng)中廣泛使用的傳感設(shè)備,用戶通過數(shù)據(jù)手套,能做出各種手勢向系統(tǒng)發(fā)出命令,與虛擬世界進行各種交互操作:比如通過一只與數(shù)據(jù)手套對應(yīng)的在計算機屏幕上顯示的虛擬手,使用戶成為虛擬世界中的一員:抓取物體,如果手套有力反饋,還能讓用戶感覺到物體的重量和材質(zhì)等。美國在“洞穴”虛擬系統(tǒng)中就是利用數(shù)據(jù)手套來研制武器。數(shù)據(jù)手套的主要優(yōu)點是可以測定手指的姿勢和手勢,但是相對而言代價較為昂貴,并且有時會給用戶帶來不便(如出汗)。
2.計算機視覺。即利用攝像機輸人手勢,其優(yōu)點是不干擾用戶,這是一種很有前途的技術(shù),目前有許多研究者致力于此項工作。但在技術(shù)上存在很多困難,目前的計算機視覺技術(shù)還難以勝任手勢識別和理解的任務(wù)。
目前較為實用的手勢識別是基于數(shù)據(jù)手套的,因為數(shù)據(jù)手套不僅可以輸入包括三維空間運動在內(nèi)的較為全面的手勢信息,而且比基于計算機視覺的手勢在技術(shù)上要容易得多。
更好地為人服務(wù)
日本三菱電子研究實驗室的研究人員已經(jīng)使用低成本的視覺系統(tǒng),通過手勢就可以控制一臺電視機。由計算機控制的美國航空航天局虛擬太空站也是采用美國Cybernet公司開發(fā)的手語識別軟件,通過一部架設(shè)在頂部的攝像機來追蹤指揮者的手勢。當系統(tǒng)捕捉到揮手等手勢時,就會做出相應(yīng)的反應(yīng),讓指揮者像航天員一樣在計算機虛擬的阿爾法國際太空站上移動(確切地說是飄動)。
Cybemet公司的軟件還能識別一系列的特定手勢,就像工地上的工人或交通警察經(jīng)常用的那種手語,通過這些手勢你能夠旋轉(zhuǎn)在虛擬旅行中看到的三維圖像,還可以向上或是向下改變你的視角。美國航空航天局正在考慮把這套系統(tǒng)用于真正的太空站,因為笨重的航天服和微重力環(huán)境使得鼠標和鍵盤都變得難以操縱。也許不久之后,航天員就能用簡單的手語來控制機器人在太空中抓取物體。
手語(手勢)識別系統(tǒng)的研究還有助于改善和提高聾啞人的生活學習和工作條件,為他們提供更好的服務(wù)。同時也可以應(yīng)用于計算機輔助啞語教學、電視節(jié)目雙語播放、虛擬人的研究、電影制作中的特技處理、動畫的制作、醫(yī)療研究、游戲娛樂等諸多方面。另外,手語識別系統(tǒng)的研究涉及到教學、計算機圖形學、機器人運動學、醫(yī)學等多學科。因此,手語識別系統(tǒng)的研究非常有意義。
李飛飛在新澤西讀高中期間,家中難以支付她的教育費用,她只能勤工儉學,自己想辦法掙錢讀書。在初到美國的前兩年里,李飛飛利用課余時間,做過街頭清潔工、餐館收銀員,還做過照看寵物狗的服務(wù)員。
不僅生活艱苦,她的英語成績也不好,美國的學生比較勢利,同學不想和她來往。初到美國的幾年里,她基本上沒有朋友。幸運的是,她讀高中時遇到幾位特別善良的老師,在老師們的關(guān)懷和鼓勵下,她逐漸祛除了自卑心理,增添了奮斗的勇氣。
臨近高中畢業(yè)時,李飛飛申請了很多大學,也收到不少錄取通知書。只有普林斯頓大學給予李飛飛近乎全額的獎學金,這也讓李飛飛的生活開始發(fā)生改變。
父母依然在困境中掙扎。李飛飛在進入普林斯頓大學讀書時,就決定在課余時間自己去打工掙錢,為父母在帕西帕尼開設(shè)一個干洗店,讓他們每個月有穩(wěn)定收入,擺脫窘境。開店的錢最終還是不夠,她只得向高中數(shù)學老師借錢。
在老師熱情支持下,干洗店終于開業(yè)。李飛飛從此在學校和店鋪之間奔波,周一到周五在學校攻讀物理學,輔修工程物理專業(yè),周末就回到帕西帕尼,在干洗店里幫忙。盡管干活用去很多時間,不過李飛飛的成績還是相當優(yōu)秀。大學畢業(yè)時,她以最高榮譽取得普林斯頓大學物理學學士學位。
李飛飛大學畢業(yè)時,金融證券市場無比火爆,對來自華爾街的征召,她居然不接受邀請,認為自己應(yīng)該去,研究藏醫(yī)。在父母耐心勸說下,她才改變想法,打算繼續(xù)深造。
隨后,李飛飛進入加州理工大學攻讀電子工程的碩士、博士學位,開始研究人工智能和計算神經(jīng)科學。在李飛飛讀研期間,她的母親患癌癥,還有中風癥狀,家庭生活再次陷入困境。這種境遇會壓垮很多人,李飛飛竟然沒有垂頭喪氣,她積極尋找辦法度過難關(guān)、完成學業(yè),取得了博士學位。
李飛飛博士一畢業(yè),高盛就投來橄欖枝,愿意給予她高薪工作;麥肯錫等公司也希望她前去工作。這是很大的誘惑,能極大改變家庭的生活狀況。可是,她并拒絕了,“我?guī)状尉芙^高薪工作,父親都沒有輕易反對。非常感激他們對我追尋夢想的支持?!?/p>
“我的研究興趣,集中在視覺研究領(lǐng)域,主要是計算機視覺和視覺心理學。我將利用大數(shù)據(jù)訓練計算機學習視覺認知、記憶、推理和與環(huán)境互動。”用兩年時間,李飛飛通過網(wǎng)絡(luò)眾包技術(shù),建立起含有1500萬張照片、涵蓋22000種物品的全球最大圖像識別數(shù)據(jù)庫ImageNet。李飛飛希望研究界能從中受益。
無論數(shù)量還是質(zhì)量,ImageNet都是規(guī)模空前的數(shù)據(jù)庫。所陳列的物品,是根據(jù)日常英語單詞進行分類組織的。光是貓,就有62000多只,長相各異,姿勢多樣,涵蓋了各種家貓和野貓。李飛飛將數(shù)據(jù)庫免費提供給全球的研究團體,很快被研究者廣泛運用。
博士畢業(yè)四年后,李飛飛來到斯坦福大學計算機科學系任教。在上課的時候,她娓娓而談,學生們都全神貫注地聆聽。僅用三年時間,李飛飛就晉升為終身教授,并成為斯坦福大學人工智能實驗室及斯坦福大W視覺實驗室的主任。
從1955年起,美國斯隆基金會每年頒發(fā)斯隆研究獎,專門獎勵科學領(lǐng)域最杰出的年輕教授。獲獎?wù)邅碜悦绹图幽么?4所高等院校,涵蓋七大科學領(lǐng)域。2011年3月1日,斯隆基金會授予李飛飛“計算機科學獎”,表彰她在這一領(lǐng)域的重要貢獻。
2015年9月4日,斯坦福大學宣布,豐田汽車公司投資2500萬美元,在校園內(nèi)設(shè)立人工智能研究中心,利用人工智能教計算機與現(xiàn)實世界互動,發(fā)展出突破性的技術(shù),普遍運用于日常生活之中。首先展開的研究項目,是教機械人安全地自動駕駛無人車。
李飛飛擔任斯坦福大學人工智能研究中心主管,由她領(lǐng)軍研發(fā)無人車技術(shù)。李飛飛覺得無人車自動駕駛,是計算機學習人腦的極佳研究,基本目標是讓計算機學習人腦做決定的方法。研究中心迅速制作出多個計算機系統(tǒng),推進自動駕駛的技術(shù)。
2016年11月,李飛飛加盟谷歌云擔任首席人工智能和機器學習科學家。同時,她仍擔任斯坦福大學副教授,負責斯坦福人工智能實驗室和斯坦福視覺實驗室。
摘要:介紹了數(shù)據(jù)融合技術(shù)的基本概念和內(nèi)容,分析了該技術(shù)在森林防火、森林蓄積特征的估計和更新、森林資源調(diào)查等方面的應(yīng)用,提出該技術(shù)可應(yīng)用于木材無損檢測及精確林業(yè)。融合機器視覺、X射線等單一傳感器技術(shù)檢測木材及木制品,可以更準確地實時檢測出木材的各種缺陷;集成GPS、GIS、RS及各種實時傳感器信息,利用智能決策支持系統(tǒng)以及可變量技術(shù),能夠?qū)崿F(xiàn)基于自然界生物及其賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,建立基于信息流融合的精確林業(yè)系統(tǒng)。
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機器人、海洋監(jiān)視和管理、目標跟蹤和慣性導(dǎo)航等領(lǐng)域。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對該技術(shù)在林業(yè)工程中的應(yīng)用及前景進行了綜述。
一、數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。70年代末,在公開的技術(shù)文獻中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。
1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。
Wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標,這正是很多關(guān)于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等。
1.2基本內(nèi)容
信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。
(2)多傳感器ID/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或?qū)φ麄€當前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。
源數(shù)據(jù)預(yù)處理。進行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。
態(tài)勢評估。根據(jù)當前的環(huán)境推斷出檢測目標與事件之間的關(guān)系,以判斷檢測目標的意圖。威脅評估。結(jié)合當前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當前的政治環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。
二、多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得GPS接收機輸出的有關(guān)信息通過與RS實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。
2.2森林蓄積特征的估計
HampusHolmstrom等在瑞典南部的試驗區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達數(shù)據(jù)進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。
KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權(quán)來估計目標樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學者都在探索航空、航天的遙感調(diào)查與估計方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的GIS數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側(cè)面裝上可視的數(shù)字攝像裝置,利用GPS對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應(yīng)的GIS數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正。
試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調(diào)整時間長等問題。
3.1.2單一傳感器在木材檢測中的應(yīng)用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等。
隨著計算機視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實驗室利用計算機視覺技術(shù)對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學基于視覺傳感器進行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。在制材加工過程中,利用計算機視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機視覺技術(shù)對刨花板施膠效果進行了定量分析。
X射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學結(jié)構(gòu)和性質(zhì)等進行檢測,并對木材內(nèi)部的各種缺陷進行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準確、可靠地檢測到木材的缺陷。
基于多傳感器(機器視覺及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國華盛頓大學研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學的生物系統(tǒng)工程系和USDA南方林業(yè)實驗站與有關(guān)公司合作開展用GPS和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。
目前單項的GPS、RS、GIS正從“自動化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個多組分的復(fù)雜系統(tǒng),是由能量流動、物質(zhì)循環(huán)、信息流動所推動的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計算機集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計數(shù)據(jù)、柵格數(shù)據(jù)、點數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個高效、柔性和開放的體系,從而實現(xiàn)林業(yè)生產(chǎn)的標準化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學提出了“精確林業(yè)工程系統(tǒng)”。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標,建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻]
[1]高翔,王勇.數(shù)據(jù)融合技術(shù)綜述[J].計算機控制與測量,2002,10(11):706-709.
[2]龔元明,蕭德云,王俊杰.多傳感器數(shù)據(jù)融合技術(shù)(上)[J].冶金自動化,2002(4):4-7.
[3]錢永蘭,楊邦杰,雷廷武.數(shù)據(jù)融合及其在農(nóng)情遙感監(jiān)測中的應(yīng)用與展望[J].農(nóng)業(yè)工程學報,2004,20(4):286-290.
[4]高德平,黃雪梅.多傳感器和數(shù)據(jù)融合(一)[J].紅外與激光工程,1999,28(1):1-4.