公務員期刊網 精選范文 計算機視覺常用技術范文

計算機視覺常用技術精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺常用技術主題范文,僅供參考,歡迎閱讀并收藏。

計算機視覺常用技術

第1篇:計算機視覺常用技術范文

[關鍵詞] 物流企業(yè); 自動化; 算法

[中圖分類號] F252; TP39 [文獻標識碼] A [文章編號] 1673 - 0194(2013)06- 0058- 03

0 引 言

隨著物流業(yè)被列入我國十大行業(yè)振興計劃,物流業(yè)已經成為我國經濟發(fā)展的不可缺少的重要組成部分。物流業(yè)是我國經濟運行的基礎,是推動國民經濟發(fā)展的重要支柱性產業(yè)之一。隨著國家持續(xù)加強和改善宏觀調控政策,物流業(yè)發(fā)展環(huán)境和條件不斷改善,物流業(yè)保持了較快的增長速度。但由于中國物流業(yè)起步較晚,存在物流成本較高、管理落后等問題,離一體化、信息化的物流業(yè)還有一定差距。中國物流業(yè)只有應用現(xiàn)代物流的理念,采用先進的信息技術與運作方式,才能應對擁有技術、資金和管理優(yōu)勢的外國企業(yè)的競爭。實現(xiàn)傳統(tǒng)物流業(yè)向現(xiàn)代物流業(yè)的轉變,也是物流業(yè)自身結構調整和產業(yè)升級的需要,是整個國民經濟發(fā)展的必然要求。我國經濟要集約式發(fā)展,必然需要推進現(xiàn)代物流。現(xiàn)代物流的根本宗旨是降低物流成本、提高物流效率、滿足客戶需求,其中信息化是現(xiàn)代物流的核心。隨著信息技術的不斷更新和物流企業(yè)自身的發(fā)展,使得新興的信息業(yè)務與傳統(tǒng)物流業(yè)務之間相互介入,模糊了新興信息技術及業(yè)務與傳統(tǒng)物流業(yè)務的界限,從而模糊了物流業(yè)的產業(yè)屬性和產業(yè)界限, 即發(fā)生了產業(yè)融合現(xiàn)象。產業(yè)融合是由于技術進步和放松管制的原因,發(fā)生在產業(yè)邊界和交叉處的技術融合,在經過不同產業(yè)或行業(yè)之間的業(yè)務、組織、管理和市場的資源整合后,改變了原有產業(yè)產品和市場需求的特征,導致產業(yè)的企業(yè)之間競爭合作關系發(fā)生改變,從而最終造成產業(yè)界限的模糊化甚至重劃產業(yè)界限。

產業(yè)融合促進了傳統(tǒng)產業(yè)創(chuàng)新, 進而推進產業(yè)結構優(yōu)化與產業(yè)發(fā)展,即產生創(chuàng)新性優(yōu)化效應。物流信息化的重要性已經引起國內很多學者的重視,并紛紛提出相應的觀點和建議。馬?。?005)認為物流企業(yè)將在建立呼叫中心、應用系統(tǒng)領域和網絡計算機領域出現(xiàn)信息化融合的趨勢,并提出物流企業(yè)應采取的戰(zhàn)略。鄧小瑜(2011)等從技術融合、產品融合、業(yè)務融合、產業(yè)衍生4個層面闡述了物流業(yè)如何進行信息化建設。物流業(yè)與信息業(yè)的融合包含通過融合信息技術提高來增強企業(yè)競爭力和將信息業(yè)務增加到物流服務中形成新的業(yè)務2個方面。

視頻攝像頭在日常生活中非常普遍,但是利用率較低,大部分監(jiān)控系統(tǒng)都是提供視頻數據的線性存儲,成為事后證據查找的有效手段。近年來,隨著計算機視覺的發(fā)展,很多學者開始研究視頻理解,尤其是針對視頻信息檢測與識別技術,建立有效的算法,實現(xiàn)底層圖像處理技術與高層視頻內容分析之間的關聯(lián),從而推動了計算機視覺在物流領域的應用,提高物流企業(yè)的競爭力。

1 計算機視覺的相關知識

1.1 計算機視覺的概念

20世紀80年代初,Marr從信息處理的角度,提出了第一個比較完善的計算機系統(tǒng)視覺框架。計算機視覺是指利用計算機模擬人眼的視覺功能,對圖片或視頻進行采集、加工、處理和識別,從中提取三維景物的形態(tài)和運動信息,解決物流、工業(yè)、商業(yè)等領域產品圖像自動檢測識別問題,提高檢測識別效率和自動化程度。計算機視覺自動識別技術作為一門交叉學科,近年來受到各相關行業(yè)的高度重視。計算機視覺的處理流程為:攝像機圖像采集圖像處理計算機幀存儲、圖像識別控制邏輯顯示器顯示。

1.2 亮度要求

基于計算機視覺的硬件環(huán)境中,亮度是非常重要的因素。在計算機視覺中亮度的作用是突出物體的重要特征或使物體本身可見,而弱化物體其他不需要的特征或物體所處的背景。如果物體太亮或太暗,都會影響對物體的處理。

彩色物體反射光譜的某些部分,吸收其他部分。因此開發(fā)人員可以利用這個特點來提高某些物體的可視度。開發(fā)人員可以利用顏色之間的對比增強某種顏色或抑制其相反的顏色。例如,如果一個紅色的物體在一個綠色背景中則應該加強紅色,這時可使用紅色照明。這樣紅色的物體會顯得明亮,同時會變暗綠色的對象。

LED是目前用于計算機視覺的主要照明技術,相比白熾燈、日光燈等使用時間短、亮度逐漸減弱的特點,LED燈的壽命超過100萬小時,而且耗電小,產生熱量少。

1.3 計算機和攝像機的接口

常用的計算機和攝像機接口包括IEEE 1394、Ethernet、USB2.0 and Gigabit Ethernet等。

1.4 RGB介紹

RGB 顏色空間是實際應用最多的一個顏色空間,在使用計算機進行圖像處理時,數字圖像一般用RGB 空間存儲和表示,分3個通道:紅(Red)、綠(Green)和藍(Blue),分別反映了顏色在某個通道的亮度值。3種原色光不同比例混合即使得人得到不同顏色的感知,這就是RGB顏色空間的由來。RGB 空間中每種顏色都能用三維空間中的一個點來表示。

2 計算機視覺在物流領域的優(yōu)勢

隨著物流業(yè)的迅速發(fā)展,計算機視覺在條形碼識別、運動物流跟蹤方面逐漸得到應用。與傳統(tǒng)方法相比,計算機視覺應用在物流領域的優(yōu)勢為以下方面。

2.1 靈活、低成本

物流系統(tǒng)中一般采用傳感器來收集相關信息,但是傳感器的位置是固定的,如果需要多方位的信息,必須同時需要多個傳感器才能完成。利用計算機視覺攝像機和計算機來完成,只需要通過程序的設置和一臺攝像機就可實現(xiàn)多方位信息的收集。

2.2 高效、準確

在一些人眼難以滿足要求的場合,或不適于人工工作的環(huán)境下,用計算機視覺來代替人工視覺可以提高生產效率、信息的準確率。

3 計算機視覺在流水線中多方位跟蹤計數的算法

物流企業(yè)在流水線產品的計數方法目前主要采用傳感器,而利用攝像機所提供的視頻信息可以實現(xiàn)多方位的跟蹤。計算機視覺是一個集成系統(tǒng),圖像分析的時間有限,算法必須簡單有效。本文采用的物流流水線視頻圖像如圖1所示。圖中紅色矩形表示流水線中傳輸的物品,綠色區(qū)域為流水線中的物品處理區(qū)域。

系統(tǒng)會在視頻圖像中設計①、②、③、④四個計數區(qū)域,在物品進行相關處理前進行計數。計數方法為將每幀圖像變?yōu)楹诎讏D,圖像中的紅色變?yōu)榘咨?,其余都變?yōu)楹谏?。當每幅圖像中的紅線部分中的白色像素超過一定閾值時,認為物體撞線,如圖2所示,這時確定有需要計數的物品通過,可以開始計數。

3.1 主要算法

3.2 算法的運行結果

OpenCV是Intel公司開發(fā)的開源計算機視覺庫。它提供了幾百個C/C++函數,實現(xiàn)了計算機視覺領域中大部分最常用的算法。利用Intel開發(fā)的開源視覺庫Intel OpenCV和VC6.0將上述算法轉換為對應的源代碼,可實現(xiàn)4個區(qū)域的物品計數。

3.3 算法的評價

該算法利用計算機視覺技術實現(xiàn)了物流流水線上的多方位計數,提高物流企業(yè)的信息化水平,節(jié)約了資金。算法簡單,運行速度快,完全可以滿足物流企業(yè)的實際需求。

4 結論與建議

本文所提出的算法實現(xiàn)了計算機視覺技術在物流企業(yè)的應用,為信息產業(yè)和物流業(yè)的融合提供了新的思路。但信息產業(yè)與物流產業(yè)的融合并不意味著引入信息技術后物流業(yè)的競爭力一定能提高。Berry(1995)指出了企業(yè)可以從6個方面來利用技術手段來提高競爭力,根據Berry的建議和我國物流業(yè)的實際情況,本文認為從以下幾個方面來考慮如何通過與信息技術的融合提高物流企業(yè)的競爭力。

4.1 要有一個戰(zhàn)略性的全局行動綱領

技術只是一種手段,使用技術的目的是為了企業(yè)發(fā)展服務,應符合全局發(fā)展的需要。因此物流企業(yè)高層管理者應該參與技術戰(zhàn)略的制定,保證技術戰(zhàn)略與全局戰(zhàn)略一致,并有CIO(首席信息官)監(jiān)控具體執(zhí)行情況。而不應該盲目使用一些新技術或進行信息改革,造成企業(yè)不必要的損失。

4.2 解決主要問題

物流業(yè)作為服務行業(yè)其最終目的是為客戶服務,使用信息技術的有效性應建立在為客戶解決實際問題的基礎上。因此信息產業(yè)與物流業(yè)的融合應體現(xiàn)在為客戶提供更多的便利,或提供增值服務的基礎上。

4.3 使用物流公共信息平臺和建立物流信息系統(tǒng),保證系統(tǒng)有效運轉

通過現(xiàn)代物流公共信息平臺的建設,企業(yè)可以及時獲得需求信息,政府可獲得物流業(yè)相關的調控和管理的宏觀信息,實現(xiàn)互聯(lián)互通。通過企業(yè)流程再造,利用含有CRM(客戶關系管理)等模塊的ERP系統(tǒng),采用EDI(電子數據交換系統(tǒng))、GPS、條形碼、無線射頻技術等先進技術,建立真正適應企業(yè)發(fā)展的符合現(xiàn)有服務模式的管理信息系統(tǒng)。

4.4 創(chuàng)新型物流人才的引進和培養(yǎng)

物流企業(yè)在自身提高業(yè)務流程和信息化水平的同時,還應注重創(chuàng)新型人才的引進和培養(yǎng),特別是有國際大型物流企業(yè)管理和技術經驗的復合型人才。

主要參考文獻

[1] L Leonard,Berry. On Great Service:A Framework for Action[M]. New York NY:The Free Press,1995.

第2篇:計算機視覺常用技術范文

關鍵詞:計算機視覺;課堂考勤;深度學習;MCV架構

前言

隨著國家標準《智慧校園總體框架》(Smartcampusoverallframework)的,智慧校園的規(guī)劃與設計成為了校園建設的重點項目[1]。而課堂考勤作為學校教學管理、學生評價的重要組成部分,隨著物聯(lián)網技術、人工智能和移動通信技術的水平的提高與發(fā)展,更應該向著智能化、準確化的方向發(fā)展[2]。本文研究了的當前應用的課堂考勤方式,并做了進一步的分析,最終根據社會技術的革新與發(fā)展[3],提出了一種基于計算機視覺的實時課堂考勤系統(tǒng)的設計。我們的主要工作是搭建了整個系統(tǒng)框架,包括數據庫系統(tǒng)、服務器、計算機視覺模型、網絡通信、圖像采集系統(tǒng)、客戶端和網絡通信系統(tǒng)。

1課堂考勤方式現(xiàn)狀

目前校園中主要的課堂考勤方式存在為兩種,分別是傳統(tǒng)的考勤方式和生物識別的考勤方式。如圖1所示,其中傳統(tǒng)的考勤方式包括點名考勤和通過校園卡進行考勤,點名考勤的方式仍然是高校中最常用的考勤手段,因它不受場地的限制,可以根據點名冊直接核對現(xiàn)場的學生信息,但這種方式存在的缺點就是花費時間,影響上課效率,為此有些教師不進行點名,因此影響了考勤的效果。校園卡考勤解決了點名占用課堂時間的問題,但這種方式具有學生代考勤的漏洞,因為學生可以拿著別人的校園卡進行考勤。生物識別的考勤方式包括指紋考勤和人臉識別考勤,這些方式有效解決了傳統(tǒng)考勤方式代考勤的弊端,但這種方式受設備硬件的影響,識別能力太慢,尤其是在下課后學生較多,考勤簽退時容易發(fā)生擁擠等現(xiàn)象,具有安全隱患[4]。因此,為解決當前考勤方式存在的一些弊端,本文設計了一種基于計算機視覺的實時課堂考勤系統(tǒng)。

2系統(tǒng)設計基礎

2.1系統(tǒng)開發(fā)環(huán)境

本文設計的實時課堂考勤系統(tǒng)主要是使用Python開發(fā)語言,Python是目前最流行開發(fā)語言之一,主要應用于Web服務設計、大數據、人工智能等領域,它的主要優(yōu)點是開發(fā)效率高、可擴展性強、跨平臺和具有可移植性等,滿足了本文系統(tǒng)的設計要求。另外,在開發(fā)過程還用到了基于Python的第三方軟件開發(fā)包,包括Flask用于搭建系統(tǒng)的Web服務器;PyQt5用于搭建系統(tǒng)的客戶端;OpenCV用于系統(tǒng)中對圖像視頻的處理;Tensoflow用于開發(fā)計算機視覺模型,搭建深度學習模型,完成人臉檢測和識別任務;Mysqlclient用于管理、訪問、查詢和更新Mysql數據庫。

2.2系統(tǒng)開發(fā)框架

本文設計的實時課堂考勤系統(tǒng)通信基于Web應用,因此選擇一個合適的服務架構有利于提高系統(tǒng)的開發(fā)和部署效率。目前較流行的Web應用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)兩種架構。本文使用了基于Python和Flask搭建的MVC架構[5],該架構如圖2所示,主要包括模型層、視圖層和控制器。使用該框架的優(yōu)點是可將視圖層和業(yè)務邏輯層進行分離開發(fā),提高開發(fā)效率,方便系統(tǒng)的部署、維護和管理。

3系統(tǒng)設計方式

3.1系統(tǒng)總結構設計

本文設計的實時課堂考勤系統(tǒng)的總體結構如圖3所示。根據MVC構架的設計,我們將該系統(tǒng)分為了模型層、控制器層和視圖層,另外還包括網絡通信設備。

3.2模型層設計

模型層主要是關系型數據庫模,MySQL是目前使用最多的關系型數據庫系統(tǒng),也是學校管理系統(tǒng)使用最多的數據系統(tǒng),為了更好地與學校管理系統(tǒng)兼容,我們選擇了MySQL數據庫,數據表之間的關系如圖4所示。

3.3控制器層設計

控制器層主要包括服務器應用軟件和計算機視覺模型,服務器應用軟件的功能包括系統(tǒng)通信配置、數據業(yè)務處理和系統(tǒng)各模塊間的調度。計算機視覺模型是實時課堂考勤系統(tǒng)的核心模塊,基于深度學習卷積神經網絡實現(xiàn)[6],主要作用是進行人臉檢測和識別兩個部分,計算機視覺模型的工作流程如圖5所示。在人臉檢測階段使用VGG16檢測器作為主干網絡,為提高模型的檢測準確率,通過引入注意力模型和多尺度特征融合對網絡進行了優(yōu)化,有效地從輸入圖片中提取人臉位置信息,得到人臉圖像。在人臉識別階段首先使用FaceNe人臉識別網絡提取人臉圖像的特征圖,然后通過決策樹算法與待檢測的人臉特征進行匹配,從而識別圖片中的學生信息。

3.4視圖層設計

本文設計的實時考勤系統(tǒng)的模型層主要包括圖像采集系統(tǒng)和客戶端。目前各學校教室內都安裝有監(jiān)控設備,因此為節(jié)約成本和安裝消耗,圖像采集系統(tǒng)使用教室內的監(jiān)控設備作為圖像采集系統(tǒng),負責采集教室現(xiàn)場圖片??蛻舳嗽O計首先在本系統(tǒng)中采用應用程序接口,然后在教學管理系統(tǒng)中設計圖形化用戶界面,通過應用程序接口調用本系統(tǒng)的功能,從而減少資源浪費,方便維護和管理。

4實時考勤功能的實現(xiàn)

實時考勤功能的實現(xiàn)方式如圖6所示,首先系統(tǒng)啟動后,用戶可以隨時更新考勤信息,比如在數據庫中創(chuàng)建新的考勤表等。接著系統(tǒng)會自動讀取考勤表的信息,比如課程所在教室、上課時間。然后啟動考勤程序,進行簽到、簽退操作,并將考勤數據保存到考勤數據表中。整個系統(tǒng)啟動完成后可以自動運行,直到關閉系統(tǒng),而且可以實時進行課堂考勤。

第3篇:計算機視覺常用技術范文

【關鍵詞】株高 HALCON 雙目視覺 誤差修正

1 引言

計算機視覺技術是近幾年來發(fā)展較快的信息處理技術,隨著圖像處理技術的專業(yè)化、計算機硬件成本的降低和速度的提高,計算機視覺的應用已變得越來越廣泛,其中不乏在農業(yè)中的應用。

株高是植物生長指標的重要參數,是一個物種爭奪陽光的能力的主要決定因素[1]。對于作物來講,株高參數是作物產量預估不可或缺的參數。

然而對于具體的利用機器視覺方法直接測量株高的研究還是比較少的,本文就是利用HALCON軟件,采用雙目計算機視覺方法來實現(xiàn)株高的測量。

2 雙目視覺原理

雙目視覺的基本原理是從兩個視點觀察同一景物,獲取不同視角下的兩幅圖像,然后根據三角測量原理計算不同圖像對應像素間的視差(disparity ),獲取景物的三維信息,從而實現(xiàn)場景三維重構。

根據兩個攝像機位姿的不同,雙目視覺有多種模式,常用的有雙目橫向模式,雙目橫向會聚模式以及雙目縱向模式(也稱雙目軸向模式)。

為了增加測量精度,基線一般不能太小,但基線長度也不可太長,否則,由于物體各部分相互遮擋,兩個攝像機可能不能同時觀察到目標點。

圖1是會聚雙目成像中的視差原理圖。圖中給出兩鏡頭連線所在平面(XZ平面),兩鏡頭中心間的距離(即基線)是B,兩光軸在XZ平面相交于(0,0,Z)點,交角為(未知)?,F(xiàn)在來看如果已知像平面坐標點(x1, y1)和(x2, y2 ),如何求取世界點W的坐標(X,Y,Z)。

根據相似三角形的關系可以很明顯得出: (2.1)

(2.2)

(2.3)

其中r為從(任一)鏡頭中心到兩系統(tǒng)會聚點的距離(未知)。將式(2.2)和(2.3)聯(lián)立, 可得:

(2.4)

上式把物體和像平面的距離Z與視差d直接聯(lián)系起來,若想求解式(2.4),除視差d外,還需要知道x1和x2本身。另外,由圖1可以得到:

(2.5)

代入式(2.2)或(2.3)可得:

代入式(2.2)或(2.3)可得:

(2.6)

現(xiàn)實測量中,兩相機的光軸與世界坐標Z軸的夾角不可能相等,不過即便如此,也只會引入幾個待確定的三角函數,而這些三角函數在相機標定時即可確定。

3 測量過程

實現(xiàn)該測量過程包括如下幾個功能模塊:圖像獲取、攝像機標定、特征提取、立體匹配與三維信息恢復、后處理。本實驗采用是分比率為960×720的雙攝像頭。被測區(qū)域大小約為56cm×42cm,所以采用的標定板應為被測區(qū)域1/3大小的HALCON專用的200mm標定板。標定數為24×2張圖片。利用HALCON自帶的標定助手,可以輕松實現(xiàn)單目標定。

雙目標定時,需要有15張以上左右相機相同時刻拍攝的標定板的圖片。再利用for循環(huán),find_caltab函數,find_marks_and_pose函數以及binocular_calibration函數,可以實現(xiàn)雙目標定。將標定過程中,獲得的攝像機的內參以及兩個攝像機相對位置關系作參數傳遞給函數gen_binocular_rectification_map,可以很好地實現(xiàn)雙目視覺校正的目的,得到兩幅校正后的圖像,還能得到校正后虛擬立體視覺系統(tǒng)中兩個攝像機的內參和外參。

不同種類的植物其株高定義不同,測量方式也不盡相同。本文研究的株高只針對直立型的,是指從植株根部露出土壤部分到植株最高處的株高。

先利用gen_binocular_rectification_map函數為map_image函數提供控制參數,再通過map_image函數對采集到的圖像做校正處理,利用threshold函數,fill_up_shape函數以及select等函數找出校正后圖像中植株的最低和最高點,利用intersect_lines_of_sight函數,可獲得植株最低點和最高點的真實三維坐標,最后通過幾何運算得到雙目測量結果。

我們在圖像采集時就應該考慮到,攝像頭應該稍微帶一點俯拍的角度,保證左右兩幅圖像上最高處均為現(xiàn)實坐標中的最高處。切忌俯拍角度不可太大,否則由于拍攝角度而引起的像差會很大,對結果將會有很大的影響。

經過以上幾步驟得到的三維坐標,常因各種原因而存在一定的誤差,需要進行誤差校正。我們對已知高度的對象進行了測量,得出結果如表1:

通過上述數據得出的修正關系如下:

y=-0.0002x2+1.0699x (3.1)

其相關系數R2=0.9993

4 實驗結果

我們對三種植物進行了測量得出的結果如下:

從測量結果中可以看出,修正后相對誤差控制在2%之內,可以接受。誤差引入的原因可能如下:

1、標定板的選擇決定了標定精度。一定要選用高精度的標定板,且標定板的大小應約為測量范圍1/3大小。

2、相機是圖像獲取的根本,高質量的圖像離不開高分辨率相機,但是高分比率,高解析度的相機又會帶來成本上的提升。本文中,對于390.0mm左右的對象,1個像素的誤差可以帶入約0.4mm的實際誤差。

3、本文所采用的算法只能針對比較理想,比較直的植株,算法的不斷優(yōu)化,才能不斷減少誤差,提高精度。

5 結語

本文介紹了一種基于HALCON的,利用雙目視覺測量株高的方法。對于直立型植物,通過對立體匹配與三維信息恢復結果的誤差修正,其株高測量相對誤差不超過2%,方法具有一定的可借鑒性。

參考文獻

[1]章毓晉.計算機視覺教程 [M].北京: 人民郵電出版社,2011.

作者簡介

郝慧鵬(1988-),男,內蒙古烏蘭察布人,碩士研究生,主要研究方向為計算機視覺技術在農作物檢測上的應用。

指導老師

田躍(1956-),男,北京人,北京科技大學數理學院物理系教授,北京市弱磁檢測及應用工程技術研究中心副主任。

作者單位

第4篇:計算機視覺常用技術范文

關鍵詞:計算機視覺;果蔬分類;應用;挑戰(zhàn);展望

自“農業(yè)4.0”時代的來臨,以“互聯(lián)網+”為驅動的農業(yè)技術已成為發(fā)展農業(yè)強有力的支撐。在果蔬業(yè)中,果蔬分類通常由經過訓練的人員人工評估農產品或農作物的質量。但是,人工分類會帶來許多相關的限制,工作人員需要熟悉果蔬的許多特征,并且高強度的機械性工作帶來的失誤不可避免,因而分類技術的提高是農產品質量提升的關鍵。計算機視覺技術具有效率高、非接觸、抗干擾能力強等優(yōu)點,在多個領域已經廣泛應用,能實現(xiàn)農產品快速無損檢測的要求[1]。果蔬分級效率的提升對我國產品質量提升、農民增產增收具有重要意義。

1圖像處理技術在果蔬分類領域的應用

本文對基于計算機視覺技術的果蔬分類進行了比較調查,發(fā)現(xiàn)研究人員多使用一種或者多種傳感器或者機器學習技術進行農產品的分類與分級,但是由于相同水果品種不同造成形狀、大小與顏色的不同,果蔬的分類依然面臨著許多挑戰(zhàn)[2]。為解決這些問題研究人員已經進行了多種實驗,其中結合機器學習技術對于系統(tǒng)有明顯提升。通過使用傳感器捕獲水果與蔬菜的特征,使用機器學習對任務進行優(yōu)化,以提高系統(tǒng)整體性能[3]。

2果蔬分類的主要挑戰(zhàn)

雖然已經在多個產業(yè)中實現(xiàn)目標分類,但將果蔬作為對象進行分類仍然是一項復雜的問題。在實際過程中,環(huán)境、光及空間等因素制約了系統(tǒng)的優(yōu)化,使系統(tǒng)的時間與準確性方面受到限制。光照方向及亮度、色溫以及背景所造成的鏡面反射與漫反射都會制約系統(tǒng)的進一步優(yōu)化,并且不同種類果蔬的特征并不相同,這也使果蔬分類系統(tǒng)沒有被廣泛地開發(fā)。

2.1缺乏合適的傳感器

分類任務的一個關鍵步驟就是選擇適合場景的傳感器用于數據采集。在果蔬的分類任務中視覺傳感器與非視覺傳感器已經廣泛地應用,但是由于各種傳感器性質不同其所適用的應用場景亦有不同[4-6]。例如超聲波傳感器與觸覺傳感器都不太適合易損的目標物[7]。因為這些傳感器需要物理接觸果蔬以獲取數據。另外,視覺傳感器對許多因素高度敏感,例如照明條件和背景環(huán)境。這些基本因素是許多復雜因素的結合,包括反射、折射、縮放、旋轉和平移,這在系統(tǒng)實際的設計中需要深入考慮。傳感器大致分為視覺傳感器和非視覺傳感器。由于每個傳感器具有一定的局限性,例如視覺傳感器對照明條件和背景顏色高度敏感。高光譜相機可以得出物體反射特性,檢測具有相似顏色或背景的不同對象的固有特性,其對許多顏色等因素不敏感,并且高光譜信息與水果的其他特征相結合,可以提高系統(tǒng)性能。最近,熱紅外分析已用于許多領域,例如植物病害檢測、冷藏對果實的冷害、農作物成熟度估算和農作物產量估算[8]。然而,由于蔬菜和背景的熱物理性質大致相似,并且這種技術對溫度變化敏感,因而熱紅外分析仍不能很好地完成綠顏色水果和多葉蔬菜的分類任務。

2.2難以準確選擇特征

特征是用于與其他物體區(qū)分的物理特征。果蔬具有多種物理特征,例如顏色、質地、形狀和大小,這些都是可以用作分類的特征參數,并且果蔬具有類間和類內的同異性。類別間的變化是主要變化,即顏色、紋理和形狀的變化,而類別內的變化更難以發(fā)現(xiàn),特征更加難以區(qū)分。理想的系統(tǒng)能夠進行類間和類內分類。研究表明,單個特征不能有效地對果蔬或物體進行有效分類。計算機視覺是用于圖像分類和識別的一種技術,可以設計算法通過多種方式對果蔬進行分類,通常分類是基于神經網絡完成。在任何機器學習應用程序中選擇合適的算法至關重要,但是由于果蔬的類間相似性,算法優(yōu)化尤為重要。數字圖像中某些與特性有關信息的識別、分類、檢索、重建稱為特征描述,果蔬具有相關的獨特視覺特征。果蔬的分類和識別最常用的特征是顏色、形狀、大小和質地,可以根據整體或局部圖像特征來選擇特征描述是全局或者局部的特征。特別是對于對象識別,全局圖像特征描述整個對象,具有良好的不變性,而局部圖像特征則易于實現(xiàn)快速匹配。因此,通常將局部和全局圖像特征配合使用以提高整體性能。在圖像經過去噪、平滑等操作之后,圖像的細節(jié)將不可避免地丟失,因而需要更加注意特征的選取。這些因素對特征描述的選取造成了一些限制。

3展望

第5篇:計算機視覺常用技術范文

[關鍵詞]K近鄰法;支持向量機;紋理識別

中圖分類號:TP392.01 文獻標識碼:A 文章編號:1009-914X(2014)20-0286-01

1.引言

計算機視覺是當前計算機學科研究中比較重要的一個分支,其最終目的是讓計算機系統(tǒng)能夠準確理解三維世界中的事物,使之具備人眼視覺的某些功能。因此,計算機視覺的研究對人工智能、工業(yè)智能等領域的發(fā)展有著十分重要的意義。紋理識別是計算機視覺中最具挑戰(zhàn)性的領域之一,它在物體識別、遙感圖像分析、工業(yè)自動化處理、海洋生態(tài)研究等多個方面都有著廣泛的應用。這樣,紋理識別在自動化生產、機器人智能化等方面也具有相當重要的研究意義與應用價值。

本文以Outex、Brodatz以及CUReT三個公共紋理庫中的紋理圖像為研究對象,將K近鄰法和支持向量機這兩種分類算法應用到紋理識別實驗中,對兩種算法的紋理識別效果及優(yōu)缺點做了詳細對比、分析。下面首先介紹一下K近鄰法與支持向量機的基本原理。

2. 原理介紹

2.1 K近鄰法

K近鄰法是一種在概率統(tǒng)計基礎上被提出的算法,主要通過對訓練樣本進行概率密度統(tǒng)計來實現(xiàn)對待測樣本的分類。該算法不需要任何諸如條件性獨立之類的假設做前提條件,而是直接對已有的樣本數據集進行學習、分類。因此,K近鄰法是一種沒有參數的密度估計算法。

K近鄰法的主要思想是首先對類別未知的樣本和訓練樣本集做距離度量;接著,比較這些距離的大小,取其中前K個最短距離即離待測樣本最近的訓練樣本作為它的鄰居;最后,取這K個鄰居的類標進行投票,將票數最多即出現(xiàn)次數最多的類標賦給當前待測樣本,此時即已完成對待測樣本的分類。

2.2 支持向量機

支持向量機主要通過對整個訓練樣本集進行學習來獲得使分類間隔達到最大的支持向量。其中,如圖1所示,直線和之間的距離即為分類間隔,而和分別經過的實心點和空心點表示的訓練樣本即為支持向量。以兩分類問題為例,支持向量機是一種在線性可分的前提下,尋找能將訓練樣本劃分為兩種類別的最優(yōu)分類線的算法。這里所說的“線性可分”是指存在一直線或超平面,能夠直接將訓練樣本集分為兩種類別;“最優(yōu)分類線”即為圖1中將實心點與空心點區(qū)分開來的直線,而圖中所示的和分別代表的是經過與直線距離最短的實心點和空心點的兩條直線,同時這兩條直線還與直線平行。如圖1所示,當直線使“margin”最大,即直線與之間的分類間隔最大時,直線就是最優(yōu)分類線,而支持向量就是分布在和上的訓練樣本。

3. 實驗及結果分析

實驗中我們首先對Outex、Brodatz以及CUReT三個公共紋理庫中的紋理圖像進行特征提取,并對獲得的特征向量使用PCA算法進行降維,最終以10個特征值來表示一幅紋理圖像。接著,將紋理圖像分為訓練樣本與待測樣本兩部分,分別使用K近鄰法、支持向量機對訓練樣本進行學習,對待測樣本進行紋理識別。

此外,我們對K近鄰法不同的K值,支持向量機不同的核函數、核參數均進行了多次選取,得到的識別結果顯示,不同K值的選取對K近鄰法的識別效果影響較大,核函數及核參數的選取同樣影響了支持向量機最終的識別效果。表1為兩種方法對三種紋理庫中紋理圖像的平均識別準確率。從總體上看,支持向量機的紋理識別效果優(yōu)于K近鄰法的識別效果。因此,在紋理識別方面,支持向量機的性能相較于K近鄰法要好一些。

4. 結束語

第6篇:計算機視覺常用技術范文

關鍵詞:智能科學與技術專業(yè);課程體系;教材建設

繼2004年北京大學率先在國內建立“智能科學與技術”本科專業(yè)之后,2005年,北京郵電大學、南開大學和西安電子科技大學;2006年,首都師范大學、北京信息科技大學、武漢工程大學和西安郵電學院;2007年,北京科技大學、廈門大學和湖南大學;2008年,河北工業(yè)大學和桂林電子科技大學;2009年,重慶郵電大學和大連海事大學;2010年,中南大學和上海理工大學先后經教育部批準先后設立了“智能科學與技術”本科專業(yè)[1-2]。在中國人工智能學會教育工作委員會的指導下,自2002年起,各相關專業(yè)教師定期召開智能科學與技術教育學術研討會,并出版教育論文專輯,大力推進了我國智能科學與技術教育的健康、快速發(fā)展,并對我國智能科學技術的人才培養(yǎng)和學科建設起到了極大的帶動作用。

作為一個發(fā)展中的新興專業(yè),目前各高校仍主要結合自身基礎和特點建設該專業(yè)。如南開大學以智能技術與智能工程為核心專業(yè)課程[3];北京科技大學從社會需求角度出發(fā),以提高學生軟件實踐能力為切入點[4];河北工業(yè)大學根據相關專業(yè)的就業(yè)現(xiàn)狀,以提高學生硬件實踐能力為著力點[5]。為了解決南開大學、北京科技大學和河北工業(yè)大學3所高校共同面臨的課程體系和教材建設等問題,三校教師分別于2010年6月16日和8月2日在南開大學、河北工業(yè)大學進行了兩次研討,現(xiàn)將研討成果匯總于此。

1研討背景

“智能科學與技術”專業(yè)自開辦以來,不可避免地要回答如下3個方面的問題:

1) 來自用人單位的問題:“智能科學與技術”專業(yè)是做什么的?與其他專業(yè)相比優(yōu)勢何在?

2) 來自學生及家長的問題:“智能科學與技術”專業(yè)是學什么的?與其他專業(yè)相比優(yōu)勢何在?

3) 來自教師自身的問題:“智能科學與技術”專業(yè)應該教什么?與其他專業(yè)相比優(yōu)勢何在?

無論是做什么、學什么還是教什么,歸根到底是課程體系和教材內容。無論是研究生課程下移(帶來學生接受知識的困難),還是在其他專業(yè)教學體系基礎上做簡單的增、刪、改(帶來學生知識結構的凌亂),都是不行的,長此以往的后果將是沒有優(yōu)勢,只有劣勢。

南開大學、北京科技大學和河北工業(yè)大學3所高校的“智能科學與技術”專業(yè)建設都源于自動化專業(yè)基礎,而且都具有典型的工科特色;同時3所高校分別是教育部直屬“985”高校、教育部直屬國家“優(yōu)勢學科創(chuàng)新平臺”建設項目試點高校和河北省屬“211”高校,3所高校的“智能科學與技術”專業(yè)分別于2006、2007和2008年招生。3所高校在“智能科學與技術”專業(yè)建設上的異同特點以及地域便利的條件,為優(yōu)勢互補、交流融合提供了機遇。

2課程體系

根據研究任務的不同,智能科學技術涵蓋的內容可以劃分為智能科學、智能技術、智能工程三個層次[6]。

1) 智能科學:主要任務是研究人的智慧,建立人機結合系統(tǒng)理論,并用其模擬人的智慧。

2) 智能技術:在智能科學的框架內創(chuàng)建人機結合智能系統(tǒng)所需要的方法、工具和技術。

3) 智能工程:利用智能科學的理念和思想,充分運用智能技術工具創(chuàng)建各種應用系統(tǒng)。它是當前新技術、新產品、新產業(yè)的重要發(fā)展方向、開發(fā)策略和顯著標志。

根據上述智能科學技術的劃分,智能科學與技術專業(yè)的課程體系同樣劃分為理論、技術與工程應用3個層次,具體框架如圖1所示。

需要說明的是,由于課時、學時等因素的限制,有些課程需要包含未列入課程的部分內容。如智能科學與技術概論課程內含系統(tǒng)論的簡要介紹;智能控制系統(tǒng)包含可編程序控制器、智能傳感器、智能執(zhí)行器等內容;智能工程包含若干典型智能系統(tǒng)實例。

3教材建設

經南開大學、北京科技大學和河北工業(yè)大學3所高校的討論,一致認為工科專業(yè)應以技術和工程應用兩個層次為核心,并將人工智能導論和智能信息處理兩門課程的教材合并為智能技術。同時,根據南開大學側重理論、北京科技大學側重軟件、河北工業(yè)大學側重硬件的原則進行分工,編寫對應課程的教學大綱和教材內容。

3.1智能技術

本課程包括智能計算和計算機視覺兩部分,分別介紹以對人腦的物理結構進行模擬為主要特征的聯(lián)接主義智能技術和以模擬人類視覺處理為主要特征的計算機視覺兩部分。它是智能技術的主干內容;也是實現(xiàn)智能技術、組成智能系統(tǒng)的重要工具,屬于本專業(yè)本科生的專業(yè)基礎課。通過智能技術的學習,學生應能夠掌握智能技術的基本原理和方法。通過課堂講解、,并配合一定的作業(yè)練習、上機實驗等環(huán)節(jié),學生應初步具備運用智能技術和方法分析和解決問題的能力。本課程擬定90學時,其中授課54學時,實驗36學時。

教材內容包括智能計算和計算機視覺兩部分,智能計算部分包括神經網絡、模糊理論和遺傳算法/蟻群算法,計算機視覺包括計算機視覺導論、計算機視覺理論基礎、圖像預處理、圖像分割、物體識別、圖像理解、雙目立體視覺、三維視覺技術、主動視覺。

神經網絡講授單個神經元(感知器)的動作原理,與實際生物神經元的對應關系;講授BP神經網絡的組成,網絡的特性和對非線性函數的模擬功能;介紹BP算法的優(yōu)、缺點;講授H網絡的組成結構,H網絡在解決優(yōu)化問題的優(yōu)越性。模糊理論講授模糊集合的概念,建立隸屬度函數的概念;介紹模糊規(guī)則的建立原則,模糊規(guī)則與模糊系統(tǒng)收入輸出量之間的關系;介紹模糊化以及模糊量精確化的幾種常用方法。遺傳算法和蟻群算法只作簡要介紹,重點介紹這兩種算法的特點和成功的應用實例,使學習者有一個感性認識,明確這種類型算法的“迭代”特點以及總體最優(yōu)目標與個體行為之間的聯(lián)系。

計算機視覺理論基礎主要介紹Marr的視覺計算理論、圖像的相關知識、傅立葉變換基礎;圖像預處理主要介紹像素亮度變換、幾何變換、直方圖修正、局部預處理、圖像復原;圖像分割主要介紹閾值處理方法、基于邊界的分割方法、基于區(qū)域的分割方法;形狀表示與描述主要介紹鏈碼、使用片斷序列描述邊界、尺度空間方法、基于區(qū)域的形狀表示與描述;物體識別主要介紹知識的表示、統(tǒng)計模式識別、神經元網絡、遺傳算法、模擬退火、模糊系統(tǒng);圖像理解主要介紹并行和串行處理控制、分層控制、非分層控制;雙目立體視覺主要介紹雙目立體視覺原理、精度分析、系統(tǒng)結構、立體成像、立體匹配、系統(tǒng)標定;三維視覺技術主要介紹結構光三維視覺原理、光模式投射系統(tǒng)、標定方法、光度立體視覺、由紋理恢復形狀、激光測距法;主動視覺主要介紹從陰影恢復形狀、從運動恢復結構、主動跟蹤。

3.2智能控制理論與技術

本課程是“智能科學與技術”專業(yè)的一門重要專業(yè)課程,目的是使學生了解智能科學與控制理論結合所產生之智能控制理論的基本概念和應用價值;使學生熟知當前主流智能控制技術的種類,并掌握模糊控制、神經網絡控制以及進化計算、群體智能的基礎知識,了解智能技術與傳統(tǒng)控制方法的結合點;加強MATLAB仿真實驗的訓練,以使學生更好地理解基礎知識,培養(yǎng)學生使用高級智能控制方法解決實際控制問題的能力。本課程的學習將使學生加深對控制理論的理解,明晰智能技術在控制中的應用技巧,也為本科生繼續(xù)深造打下基礎。本課程擬定64學時,其中授課54學時,實驗10學時。

教材內容包括智能控制概論,介紹智能控制的發(fā)展歷程和應用領域,簡介幾種重要的智能控制方法;專家控制,簡介專家系統(tǒng)的基本結構,講授專家PID控制器的原理與設計方法;模糊控制,講授模糊數學基礎知識、傳統(tǒng)的模糊控制原理和控制器設計與實現(xiàn)方法、模糊PID控制的兩種形式,特別是PID控制參數的模糊整定技術;神經網絡控制,講授前饋神經網絡和遞歸神經網絡中幾種典型的網絡模型以及學習算法、基于神經網絡的線性系統(tǒng)辨識技術、神經網絡逆??刂频?進化計算與控制,講授進化計算的概念、遺傳算法的原理及其與其他智能方法的結合,介紹遺傳機器人學;群體智能與控制,講授蟻群算法的基本原理及其在控制問題中的應用,介紹群體機器人學。

3.3單片機原理與應用

本課程是“智能科學與技術”專業(yè)的一門專業(yè)課程,目的是使學生了解單片機的組成原理及常用控制算法的實現(xiàn);掌握51系列單片機指令系統(tǒng)和一般匯編程序設計編寫方法;熟悉常用的單片機硬件擴展技術;在此基礎上,熟練掌握控制算法的單片機程序編寫與調試。本課程擬定54學時,其中授課38學時,實驗16學時。

教材內容包括單片機系統(tǒng)概述,介紹單片機定義、單片機發(fā)展過程及單片機硬件結構;單片機指令系統(tǒng)及程序設計,介紹指令系統(tǒng)和匯編語言程序設計;硬件資源及接口技術,介紹硬件資源和接口技術;單片機使用技術,介紹抗干擾技術、C語言應用程序設計;依次介紹PID控制器、狀態(tài)反饋控制器、模糊控制器、系統(tǒng)辨識、卡爾曼濾波、滑??刂破?、最優(yōu)控制器、魯棒控制器、自適應控制器、神經網絡控制器的歷史沿革、基本原理、常用形式和單片機具體實現(xiàn)方法。

3.4嵌入式系統(tǒng)

本課程以當前主流的嵌入式系統(tǒng)技術為背景,以嵌入式系統(tǒng)原理為基礎,以嵌入式系統(tǒng)開發(fā)體系為骨架,以嵌入式控制系統(tǒng)開發(fā)為目標,較為全面地介紹嵌入式系統(tǒng)的基本概念、軟硬件的基本體系結構、軟硬件開發(fā)方法、相關開發(fā)工具、應用領域、熱門領域的開發(fā)實例以及當前的一些前沿動態(tài),為學生展示較為完整的嵌入式控制系統(tǒng)領域概況。本課程擬定64學時,其中授課48學時,實驗16學時。

教材依據嵌入式控制系統(tǒng)的特征,將控制算法、嵌入式系統(tǒng)硬件、操作系統(tǒng)、應用程序設計及組態(tài)軟件作為統(tǒng)一的技術平臺介紹,突出嵌入式技術在控制系統(tǒng)中應用的特點,重點介紹嵌入式控制系統(tǒng)軟硬件、電路、操作系統(tǒng)、實時性、可靠性等特性,從軟件體系結構及開發(fā)的角度出發(fā),強調實時調度、Bootloader、BSP、嵌入式實時多任務系統(tǒng)設計、交叉開發(fā)與仿真開發(fā)等關鍵技術,并特別引入了工業(yè)控制中需要的電磁兼容性設計和大量的典型嵌入式控制系統(tǒng)實例設計。通過本課程的學習,學生不但可以學會使用工具開發(fā)嵌入式軟硬件,而且可以從總體角度選擇適當的技術和方法,全面規(guī)劃和設計嵌入式系統(tǒng)。

3.5智能工程

本課程是“智能科學與技術”專業(yè)的一門核心專業(yè)課程。面向智能技術的實際應用,著眼于解決工程應用中的技術問題,從典型系統(tǒng)設計案例分析出發(fā),通過大量實驗提高學生的工程實踐能力。本課程擬定36學時,全部為授課學時。

教材內容包括智能工程概論,介紹智能工程現(xiàn)狀、工程設計原則和工程實際流程;常用傳感器原理,介紹傳感器一般特性、光電式傳感器和視覺傳感器;典型智能系統(tǒng)設計案例,包括智能移動機器人、智能電梯群控電梯等系統(tǒng)。

3.6智能機器人

課程通過對一個具有代表性的仿人機器人的拆解,將知識點拆解成6個主要教學模塊:1)機器人控制模塊,介紹各類控制模塊的原理與組成;2)機器人運動系統(tǒng),介紹電機與舵機的原理與控制方法;3)機器人動作系統(tǒng),介紹機器人各部件的協(xié)調控制;4)機器人視覺系統(tǒng),介紹典型的超聲波、影像傳感器的原理與識別算法;5)機器人表現(xiàn)系統(tǒng)原理,介紹人與機器人的交互原理;6)機器人通信系統(tǒng)原理,介紹機器人之間的數據與信息傳遞方法。學生學習時,能夠與基礎知識相聯(lián)系,并能掌握機器人這門技術,為從事機器人產品研發(fā)工作打下堅實的基礎。本課程擬定54學時,其中授課44學時,實驗10學時。

教材面向“智能科學與技術”專業(yè),同時兼顧信息類專業(yè)學生編寫,根據這類專業(yè)學生的知識結構和特點組織內容。從具體的機器人控制需求出發(fā),將自動控制的基本理論和機器人控制特點相結合,講授機器人控制系統(tǒng)的組成、規(guī)律、特點和設計方法。理論上反映當前的最新進展,內容上考慮初學者的需求,側重普及性、實用性和新穎性,結構體系符合信息類和控制類專業(yè)學生的特點,力求簡潔、清楚,對技術的敘述遵循目標、問題、理論依據、實現(xiàn)方法、實際情況、發(fā)展方向的方式。做到重點突出,符合實際,滿足需要,指導性強。

3.7智能控制系統(tǒng)

本課程是“智能科學與技術”專業(yè)的一門專業(yè)課程,使學生了解智能控制系統(tǒng)的基礎知識;掌握智能控制系統(tǒng)中最新的智能傳感技術、智能控制器、智能執(zhí)行能執(zhí)行器及智能網絡與接口技術;掌握智能控制系統(tǒng)中多個關鍵硬件裝置的識別及其使用。通過學習多個智能控制系統(tǒng)的開發(fā)實例,學生應掌握智能控制系統(tǒng)的設計方法與技術,堅實地掌握最新智能控制系統(tǒng)知識,提高理論聯(lián)系實際的能力,并為學習其他課程的打下堅實基礎。本課程擬定64學時,其中授課48學時,實驗16學時。

教材內容包括概述,介紹智能控制系統(tǒng)的基本概念、基本內容和機構及其發(fā)展趨勢;智能傳感系統(tǒng),講授智能數據采集技術、傳感器智能化的數據處理方法、多傳感器信息融合的方法、智能傳感器實現(xiàn)方法與典型實例;智能控制器設計,講授基于單片機的智能控制器設計及其應用、基于高性能嵌入式ARM的智能控制器設計及其應用、基于PLC的智能控制器設計及其應用;智能電動執(zhí)行器,講授智能電動執(zhí)行器的硬件實現(xiàn)技術,軟件設計技術以及典型的智能電動執(zhí)行器實例及其應用;智能網絡與接口技術,講授無線傳感器智能網絡,工業(yè)現(xiàn)場總線網絡以及智能傳感器、智能控制器和智能執(zhí)行器的網絡接口實現(xiàn)技術;智能控制系統(tǒng)設計實例,綜合利用前面的知識設計網絡化智能壓力傳感器的系統(tǒng)設計、基于聲音定位的智能機器人系統(tǒng)設計、基于微機電慣性傳感器的汽車多路況智能防撞系統(tǒng)的設計、大型設備的PLC智能控制系統(tǒng)設計。

4結語

通過南開大學、北京科技大學和河北工業(yè)大學3所高校的研討,我們凝練出較完整的“智能科學與技術”專業(yè)課程體系,體現(xiàn)出本專業(yè)的特色;提出可供3所高校共同使用的教學大綱和教材內容,體現(xiàn)出學生培養(yǎng)的工程實踐導向。這些研究成果可以為開辦“智能科學與技術”專業(yè)的兄弟院校進一步研討提供藍本,也可以為籌建該專業(yè)的高校所參考。

注:本文受到北京科技大學教學研究會第六批教學研究課題、北京科技大學教育教學研究基金青年教師教育教學研究立項項目、河北工業(yè)大學教改項目(2010-12)支持。

參考文獻:

[1] 王萬森,鐘義信,韓力群,等. 我國智能科學技術教育的現(xiàn)狀與思考[J]. 計算機教育,2009(11):10-14.

[2] 教育部關于公布2009年度高等學校專業(yè)設置備案或審批結果的通知[S]. 教高〔2010〕2號,2010.

[3] 方勇純,劉景泰. 南開大學“智能科學與技術”專業(yè)教學體系與實驗環(huán)境建設[J]. 計算機教育,2009(11):21-25.

[4] 石志國,劉冀偉,王志良.“智能科學與技術”本科專業(yè)軟件實踐類課程建設探討[J]. 計算機教育,2009(11):93-97.

[5] 劉作軍,張磊,楊鵬,等. 談我校增設“智能科學與技術”專業(yè)的設想與措施[J]. 計算機教育,2009(11):53-56.

[6] 盧桂章. 無處不在的智能技術[J]. 計算機教育,2009(11):68-72.

A Study on the Course System and Textbook Construction for the Discipline of

Intelligence Science and Technology

YANG Peng1, ZHANG Jian-xun2, LIU Ji-wei3, ZHANG Lei1

(1. Hebei University of Technology, Tianjin 300130, China; 2.Nankai University, Tianjin 300071, China;

3. University of Science and Technology Beijing, Beijing 100083, China)

第7篇:計算機視覺常用技術范文

關鍵詞:無人機;捷聯(lián)慣性導航系統(tǒng);計算機視覺;組合導航;卡爾曼濾波

DOI:10.16640/ki.37-1222/t.2016.22.256

0 引言

隨著無人機技術的發(fā)展,導航系統(tǒng)的種類也越來越多,通常有慣性導航系統(tǒng)、衛(wèi)星導航系統(tǒng)、多普勒導航系統(tǒng)和地形輔助導航系統(tǒng)等[1]。然而,單一的導航裝置已難以滿足當前實際應用中的飛行要求,多種形式的組合導航方案隨之產生,組合方案的采用使各導航系統(tǒng)之間取長補短,利用組合系統(tǒng)提供的冗余信息可以有效提高系統(tǒng)的導航精度和可靠性[2]。本文針對GPS/SINS組合導航系統(tǒng)中GPS信號易受干擾、易丟失等缺點,提出了SINS/GPS/視覺組合導航方案,提高了系統(tǒng)的可靠性和導航精度,具有一定的工程實際意義。

1 SINS/GPS/視覺組合導航系統(tǒng)方案

捷聯(lián)慣導系統(tǒng)SINS為主導航系統(tǒng),全球定位系統(tǒng)GPS和計算機視覺系統(tǒng)則作為導航輔助子系統(tǒng)。SINS采用姿態(tài)解算算法將 MEMS傳感器輸出數據解算為需要的導航參數,GPS接收機獲取的信號經由計算機轉換為用戶所需的機置和速度參數,而視覺系統(tǒng)則根據連續(xù)時刻的圖像信息估計機體的姿態(tài)參數[2]。利用SINS系統(tǒng)誤差模型、GPS量測誤差模型及視覺量測誤差模型構成擴展卡爾曼濾波器,兩個子濾波器給出局部最優(yōu)估計,再依據信息融合技術將局部估計有機合成,從而得到捷聯(lián)慣導系統(tǒng)狀態(tài)的全局最優(yōu)估計。SINS/GPS/視覺組合導航結構如圖1所示。

2 SINS/GPS/視覺組合導航系統(tǒng)狀態(tài)方程的建立

本系統(tǒng)采用的組合方式為SINS分別與GPS和視覺系統(tǒng)構成子組合,且都采用輸出校正,因而可采用同一組狀態(tài)方程。

2.1 SINS姿態(tài)誤差方程

理論上,SINS姿態(tài)矩陣滿足微分方程

(1)

其中,表示由向量構成的反對稱矩陣,且有。

而在實際中需要考慮陀螺儀的測量誤差和計算誤差,根據相似變換法則及反對稱矩陣與向量之間的關系,可得SINS姿態(tài)誤差方程為

(2)

為了使模型適用于特定的場合且便于分析,在可接受范圍內認為 (2)式中陀螺測量誤差主要指陀螺隨機常值漂移 ,因而可簡化為

(3)

2 SINS速度誤差方程

理想情況下,SINS速度微分方程為:

(4)

實際系統(tǒng)中,基于誤差的SINS速度微分方程為:

(5)

其中,,為速度計算誤差;

;;;,在此只考慮主要誤差源,而加速度計測量誤差主要包含加速度計隨機常值偏置,則有;

將式(5)與式(4)相減,忽略的影響,并略去二階小量,可得速度誤差方程:

(6)

2.3 SINS位置誤差方程

機體的緯度、經度變化分別是由北向速度分量和東向速度分量引起的,而高度信息則與地向速度有關[3]。由此確定的位置方程為:

(7)

由式(7)可得位置誤差方程如下:

(8)

(9)

(10)

將(3)、(6)、(8)~(10)式聯(lián)立即可得到SINS誤差模型,即組合導航系統(tǒng)的狀態(tài)方程。

3 SINS/GPS/視覺組合導航系統(tǒng)量測方程的建立

SINS/GPS子系統(tǒng)有兩組量測值,一組為位置量測值,即SINS和GPS接收機給出的位置信息的差值;另一組為速度量測值,即兩個系統(tǒng)給出的速度差值。而SINS/視覺子系統(tǒng)只包含一組量測值,利用視覺圖像信息估計得到的機姿信息和SINS給出的姿態(tài)角信息之間的差值作為量測值。

SINS系統(tǒng)的位置信息和速度信息可表達為真值與相應誤差之和:

GPS全球定位系統(tǒng)的位置信息和速度信息可表示為真值與相應誤差之差:

其中,,,分別為緯度,經度和高度的真實值;,,為GPS接收機沿北、東、地方向的位置誤差;,,為GPS接收機沿北、東、地方向的速度誤差。兩個子系統(tǒng)的量測方程為:

(11)

其中,

4 SINS/GPS/視覺組合導航系統(tǒng)仿真實驗

卡爾曼濾波是實現(xiàn)組合導航的關鍵性環(huán)節(jié)。基于先前建立的狀態(tài)方程和量測方程設計擴展卡爾曼濾波器,并將其作為導航系統(tǒng)子濾波器。同時,采用聯(lián)邦濾波技術對子濾波器輸出信息進行有效融合[4]。

軌跡發(fā)生器的參數選取如下:

位置參數:初始緯度、經度、高度,,,,。

姿態(tài)參數:,,,,,。

卡爾曼濾波器參數:初始位置誤差5m,初始速度誤差0.1m,初始平臺誤差角均為,陀螺白噪聲漂移,加速度計零偏,GPS接收機位置誤差10m,GPS接收機速度誤差0.5m/s,聯(lián)邦濾波器參數。

獲取特征點信息的幀間圖像間隔時間為150ms。SINS解算頻率為50Hz,GPS接收頻率為1Hz,組合頻率為1Hz。

由圖3~圖11所示誤差曲線可知,SINS/GPS系統(tǒng)的姿態(tài)角誤差波動范圍約為SINS/GPS/視覺系統(tǒng)的1.39倍;速度誤差波動范圍約為SINS/GPS/視覺系統(tǒng)的1.45倍;位置誤差中,高度、緯度和經度誤差波動范圍分別為SINS/GPS/視覺系統(tǒng)的1.40倍、1.28倍、1.13倍,整體而言,SINS/GPS/視覺組合系統(tǒng)的誤差波動范圍減小且誤差曲線整體的收斂性優(yōu)于SINS/GPS系統(tǒng),穩(wěn)態(tài)趨向更平穩(wěn)。綜上所述,SINS/GPS/視覺組合系統(tǒng)的導航定位精度優(yōu)于SINS/GPS系統(tǒng)。

此外,即使GPS信號丟失或受到干擾,系統(tǒng)仍可采用SINS/視覺組合完成導航任務,維持系統(tǒng)正常工作。視覺導航技術的輔助作用使得系統(tǒng)的可靠性增強。

5 結束語

無人機眾多導航系統(tǒng)中, SINS/GPS組合導航系統(tǒng)最為常見,但是,由于GPS存在信號易受干擾甚至丟失的缺點,以提高系統(tǒng)的精度和可靠性為目標,分別從狀態(tài)方程和量測方程的建立、卡爾曼濾波算法及聯(lián)邦濾波等多方面進行研究和改進,相比SINS/GPS導航系統(tǒng),本文提出的SINS/GPS/視覺組合導航技術在提高定位精度和系統(tǒng)可靠性方面都有著顯著的優(yōu)勢。

參考文獻:

[1]魏瑞軒,李學仁.無人機系統(tǒng)及作戰(zhàn)使用[M].北京:國防工業(yè)出版社,2009:23-26.

[2]萬明.基于視覺導航的無人機自主著陸飛行參數估計方法[D]. 南京航空航天大學,2009.

第8篇:計算機視覺常用技術范文

關鍵詞:圖像預處理;圖像增強;圖像銳化

中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2011)27-6727-03

Image Pre-processing Technology in Tracking System

CHEN Qian-hui1, WANG Xiao-fen2

(1.School of Mechanical and Electrical Engineering, Shangqiu Institute of Technology, Shangqiu 476000, China; 2.School of Computer Science, Shangqiu Institute of Technology, Shangqiu 476000, China)

Abstract: To get precise three attitude for space goals to achieve the purpose of tracking real-time stability, it is necessary for using an effective method to process the resulting image. In this paper, based on the theory of image processing, we introduce several methods of pretreatment to achieve the enhancement of edge information, it is also significant for edge detection, feature extraction, matching and 3D reconstruction.

Key words: image preprocessing; image enhancement; image sharpening

目標跟蹤研究屬于計算機視覺的范疇,也是如今比較熱點的研究方向之一。在日常生活、交通、國防等方面有著非常廣泛的應用。隨著計算機技術、數字圖像處理技術的不斷發(fā)展,目標跟蹤的方法也得到進一步的改進。根據計算機視覺的原理,如果能精確的模擬空中目標的飛行情況,對我國的航天以及軍事事業(yè)都將有很大的益處。要想使空間目標實現(xiàn)可視化,必須對跟蹤獲得的二維圖像信息進行圖像的預處理,通過基于邊緣的特征提取的方法來實現(xiàn)跟蹤空間運動目標。

1 圖像預處理方法

一般對圖像的預處理包括:圖像的增強、圖像的濾波、圖像的銳化。

1.1 圖像增強

圖像增強是應用計算機或光學設備通過對圖像灰度等級的變換以達到改善圖像視覺效果的處理技術。由于CCD攝像機的影響,或者是攝像機周圍環(huán)境的影響等因素,使得攝像系統(tǒng)攝取的圖像存在一些問題,為得到目標的精確信息達到研究目的,必須對圖像進行預處理。

1) 直方圖

灰度直方圖是圖像最基本的統(tǒng)計特性。其橫坐標是灰度級,縱坐標是該灰度級出現(xiàn)的頻度。用Pr(rk)=nk/n0≤rk≤1k=0,1,2,…,l-1,表示。式中:nk為圖像中出現(xiàn)rk級灰度的像素數,n是圖像像素數,而nk/n即為頻數。

由直方圖分析,有助于我們確定圖像閾值處理。其中最常用、重要方法是直方圖修正,特別是直方圖均衡。用圖像f(x,y)的直方圖代替灰度的分布密度函數pf(f),則直方圖均化后圖像g為:。若原圖像f(x,y)在像素點(x,y)處的灰度為rk,則直方圖均化后的圖像g(x,y)處的灰度sk為:,T[rk]是灰度變換函數。由于ni/N只是圖像灰度級概率密度函數的近似,因此經過直方圖均衡后,得到坦直方圖。

2) 灰度變換

灰度變換法分3種:線性、分段線性及非線性變換。

A 線性變換

假定原圖像f(x,y)的灰度范圍為[a,b],希望變換后圖像g(x,y)的灰度范圍擴至[c,d],則線性變換可表示為,若圖像灰度在[0,Mf]范圍保持f(x,y)灰度低端和高端值,表達式分別為:

B 分段線性變換

對灰度區(qū)間[0,a]和[b,Mf]加以壓縮,對灰度區(qū)間[a,b]進行擴展??刹捎梅侄尉€性變換,其表達式為:

C 非線性變換

非線性點運算對應于非線性映射函數,典型的映射包括平方函數、對數函數。截取函數、閾值函數、多值量化函數等。如對數及指數函數表達式分別為,g(i,j)=bc[f(i,j)-1]-1。

1.2 圖像噪聲及平滑濾波

1) 模板操作和卷積運算

模板操作是數字圖像處理中常用的一種運算方式,圖像平滑、銳化及后討論的細化、邊緣檢測等都要用到模板(如表1)。

2) 鄰域平均法

鄰域平均法是一種利用Box模塊(如表1)對圖像進行模塊操作(卷積運算)的圖像平滑方法,其主要優(yōu)點是算法簡單,計算速度快,但會造成圖像一定程度上的模糊。其數學含義是:,式中:(x,y)=0,1,...,N-1;S是以(x,y)為中心的鄰域集合,M是S內的點數。

3) 中值濾波

中值濾波是一張非線性信號處理方法,與其對應的中值濾波器即是一種非線性濾波器。一維fi序列公式表示為:

而二維中值濾波表示為:yij=Med A{fij},其中:A為窗口;{fij}為二維數據序列。

復合型中值濾波:中值濾波線性組合、高階中值濾波組合、加權中值濾波及迭代中值濾波等。其中線性組合方程為:

,

高階中值濾波組合為:,式中ak為不同中值濾波的系數。

4) 空間域低通濾波

從信號頻譜看,信號緩慢變化部分在頻率域屬低頻部分,而信號迅速變化部分屬頻譜域高頻部分。由于圖像邊緣及噪聲干擾頻率分量都處于頻率域較高部分。故可采用低通濾波方法去除噪聲(如表1)。

5) 頻率域低通濾波

利用卷積定理得表達式G(u,v)=H(u,v)F(u,v),其中F(u,v)是含噪聲圖像傅里葉變換,G(u,v)是平滑后圖像傅里葉變換,H(u,v)是低通濾波器傳遞函數(系統(tǒng)框圖如圖1)。

常用的頻率域低通濾波器有:理想低通濾波器、巴特沃思低通濾波器、指數低通濾波器、梯形低通濾波器。

6) 多幅圖像平均法

一幅有噪聲圖像f(x,y),可看作由原始無噪聲圖像g(x,y)和噪聲n(x,y)疊加而成,即f(x,y)= g(x,y)+ n(x,y),若疊加在圖像上的噪聲n(x,y)是非相關、具有零均值的隨機噪聲時,可針對一目標物在相同條件下作M次重復攝取的圖像相加,取平均值作為輸出圖像,便可對圖像中噪聲進行平滑。

1.3 圖像銳化

圖像平滑往往使圖像邊界、輪廓變得模糊,而圖像銳化是一種使原有圖像信息變得有利于人們觀看的質量,目的是為了改善圖像視覺效果,消f(x,y)圖像應有對象邊緣變得輪廓分明。

1) 梯度法

圖像銳化常用方法是對圖像微分處理。其最常用處理方法是梯度法。設f(x,y)方向導數為?鄣f/?鄣x,表示其在某一方向α上變化率,且,其中,稱為飛f(x,y)的梯度,可知當時,方向導數取最大值。

2) Sobel 算子

索貝爾算子是一組方向算子,從不同方向檢測邊緣。它通常對灰度漸變和噪聲較多圖像處理較好。常用的梯度銳化算法有Roberts、Isotropic Sobel、Prewitt 和Krisch算子(如表2所示),且都是用差分方法對梯度運算近似處理。

3) 拉普拉斯算子

Laplacian 算子是二階導數算子,它既能增強圖像高頻分量,又能保持低頻分量,是圖像增強的有效方法。常用于基于偏導數運算的一種各向同性的線性組合運算的邊緣增強算子(如表1)。

4) 高通濾波銳化

圖像中邊緣部分與其頻譜的高頻分量相對應,因此采用高通濾波讓高頻分量通過,實現(xiàn)圖像銳化(如表2),算子為:。

2 總結

為獲取序列二維圖像特征點、線、面,實現(xiàn)空間三維目標重建及動態(tài)軌跡模擬,以實現(xiàn)空間運動目標的實時跟蹤,對圖像信息進行預處理是必要的。本文通過圖像增強、圖像噪聲與濾波、圖像平滑與銳化等一系列圖像處理方法的介紹,通過模擬仿真就可得到邊緣被加強的處理圖像,進而實現(xiàn)目標的實時穩(wěn)定跟蹤。

參考文獻:

[1] 何東健,數字圖像處理[D].西安:西安電子科技大學,2003.

[2] 閆娟.數字圖像的平滑處理方法研究[J].軟件導刊,2009,8(1):182-184.

[3] 岡薩雷斯,數字圖像處理[M].3版.北京:電子工業(yè)出版社,2011.

[4] 陳娟,陳乾輝.圖像跟蹤中的邊緣檢測技術[J].中國光學與應用光學,2009,2(1):46-53.

[5] 榮瑩.用C++ Builder 實現(xiàn)數字圖像的平滑處理[J].電腦與信息技術,2002,5:50-52.

[6] 王憲輝.視頻圖像中的目標跟蹤技術研究[D].合肥:中國科學技術大學,2010.

第9篇:計算機視覺常用技術范文

關鍵詞:仿射不變矩;運動識別與跟蹤;計算機視覺

中圖分類號: TP391.4文獻標識碼:A文章編號:1009-3044(2011)19-4692-03

Animal Motion Detection based on Affine Invariant Moments

ZHANG Tian-jin

(School of Computer Science, Sichuan University, Chengdu 610207, China)

Abstract: Due to its appealing simplicity in mathematics and versatility, the moment technique is widely used in many areas, such as computer vision and pattern recognition. Combining with the high operation speed of frame difference detection technology, the moving target detection algorithm, based on affine invariant moments and frame difference area, is proposed. Firstly, the algorithm picks up moving region by using the distance frame-difference method. Then it calculates the invariant moment characteristic quantities of the detected moving targets. At last, identification to these quantities will be achieved by neural network. Test results show that the method can detect moving targets without missing, overcome the weakness that the target would be undetectable when suddenly stop, and at the same time, the method improves the computational speed.

Key words: affine invariant moments; Animal motion detection; computer vision

運動目標的檢測與跟蹤是計算機視覺研究的基礎任務和關鍵技術之一,已經有了多年的研究歷史。它融合了圖像處理、模式識別、人工智能、自動控制等許多領域的前沿技術,在視頻監(jiān)控、視頻會議、人機交互等領域有著廣泛的應用。對于運動目標檢測和跟蹤的許多關鍵技術:例如目標檢測、運動分析、遮擋處理、目標分類、圖像穩(wěn)定、圖像信息融合等,國內外許多學者進行了大量的研究?;谀0迤ヅ?、基于光流場、基于神經網絡、基于圖像分割技術等運動目標檢測方法已經被提出;基于灰度變化、基于特征、基于變換、基于可變模型的運動目標跟蹤方法也日趨成熟;基于分層模型、基于水平集等遮擋處理方法也相繼提出;同時也涌現(xiàn)出一批實際的運動檢測和跟蹤系統(tǒng)。

該文提出了一種基于隔幀差分區(qū)域結合仿射不變矩的運動目標檢測方法,并且進行了試驗。

1 動物的特征提取及不變矩

1.1 矩的概念

矩(Moments)是一種用來描述邊界或區(qū)域形狀的描述子,而不變矩(Invariant Moment)則是由基本的矩衍生而來。

矩(Ordinary Moments):灰度分布為f(x,y)的圖像其二維(i+i)

階矩的定義如下:

(1)

中心矩表達式如下:

(2)

其中,

1.2 矩的平移、伸縮、旋轉不變性

HU根據二階和三階中心矩的非線性組合,構成了7個不變矩表達式:

(3)

其中

1.3 仿射不變矩

現(xiàn)實情況下,動物的形體一般都存在仿射變形,為了對動物進行更好的運動識別及跟蹤,故引用F. JAN 等人在HU 不變矩的基礎提出的仿射不變距,以下出了仿射不變矩,以下是具有二階和三階中心距構成的仿射不變矩:

(4)

2 試驗及結果分析

2.1 視頻預處理

視覺系統(tǒng)在圖像的生成和處理過程中, 由于各種干擾因素, 往往產生干擾, 形成噪聲, 降低圖像質量。因此, 在圖像處理與分析之前, 需通過去噪處理改善圖像質量。該文采用的是基于空間域的中值濾波,中值濾波器是一種常用的非線性平滑濾波器,基本原理是把數字圖像或數字序列中一點的值用該點鄰域內各點的中值代換。設f(x,y)表示數字圖像像素點(x,y)的灰度值,濾波窗口為A的中值濾波器可以定義為:

(x, y)=MDE{f(x, y)}(x,y)∈A (5)

當n為奇數時,n個數x1,x2,…,xn的中值就是按數值大小順序處于中間的數;當n為偶數時,我們定義兩個中間數平均值為中值。

2.2 運動區(qū)域的檢測

本實驗所選擇的是大白鼠的運動視頻,從而實現(xiàn)對大白鼠的運動檢測及跟蹤。為了提高檢測速度及減少計算量, 該文采用隔幀差分法先檢測包含運動目標的區(qū)域,具體的過程描述如下:

1) 視頻序列圖像在經過中值濾波預處理后,去掉了圖像隨機噪聲, 再將彩色的視頻幀圖像進行灰度變換, 得到灰度圖像;

2) 在經過灰度變換后的動態(tài)視頻幀圖像中,以間隔n幀選取三幀圖像, 其中前一幀圖像fi-n(x,y), 當前幀圖像fi(x,y), 下一幀圖像fi+n(x,y)。當n=1時, 就是傳統(tǒng)連續(xù)幀差分計算, 當n=2時,為隔1幀差分,當n=3時,為隔2幀差分, 依次類推。隔幀的時間間隔選擇取決于運動目標的速度和大小, 對快速運動或者大的物體, 需要選擇較小的時間間隔; 對慢速運動或者弱小的物體, 需要選擇較大的時間間隔; 本試驗中因為白鼠運動較慢,故n取值較大。

3) 計算當前幀與前一幀的前向幀差圖像 (x,y) 和下一幀與當前幀的后向幀差圖像(x,y), 對隔幀差分后的圖像進行閾值化處理, 得到隔幀差分后的二值圖像。

4) 計算幀差圖像 (x,y) 和 (x,y) 的交集得到運動目標的運動區(qū)域En(x,y)。

(6)

(7)

(8)

其中,T為圖像二值化時的閾值。

隔幀差分的方法不僅能完整檢測到大的目標,算法實現(xiàn)簡單,程序設計復雜度低;對光線等場景變化不太敏感,能夠適應各種動態(tài)環(huán)境,穩(wěn)定性較好。

2.3 不變矩的計算

1) 令i、j分別為0、1、2, 根據式1求出其(i+j)階幾何矩m10, m01, m11, m20, m02, m30, m03, m12, m21。同時求得x=m10/m00, y=m01/m00 。

2) 根據式2求出其(i+j)階中心矩u11,u20,u02,u30,u03,u21,u12。

3) 計算出仿射不變矩Φ1~Φ4。

2.4 不變矩特征匹配

在得到仿射不變矩的特征向量后,就進入分類識別的過程了。該文選取的是BP網絡來實現(xiàn)分類識別。將Φ1~Φ4作為訓練樣本輸入BP網絡,當輸出誤差過大或大于指定的門限時就停止訓練。具體的識別是通過分別計算模板的特征向量與每個待匹配區(qū)域特征向量的歐氏距離D,預先設定一個閾值R來確定二者的相似度,如果D

其中圖1為該文試驗所采用的原視頻,圖2為檢測并且腐蝕掉尾巴之后的白鼠。

2.5 運動路線的跟蹤

1) 通過膨脹腐蝕算法將白鼠的尾巴去掉,為了便于計算白鼠的幾何中心點。

2) 計算老鼠的重心,取出當前幀老鼠的重心,以此重心周圍的5×5個像素代表老鼠的重心,并將該重心染成紅色。

圖3為該文所采用的方法試驗的最終結果。紅色的線為白鼠的運動軌跡。

3 結論

該文結合隔幀差分的方法和仿射不變矩的優(yōu)點, 提出了一種實時運動目標的檢測方法。并且該文所提的運動目標檢測與識別原理清晰, 不僅能較完整地檢測出運動目標, 克服了對突然停止目標會出現(xiàn)檢測檢測不出來的弱點。同時試驗結果表明:采用仿射不變矩方法來提取白鼠的特征是非常有效地,其特征提取算法又具有較強的抗噪優(yōu)點,因此該算法獲得了很高的識別率和運算速度。

參考文獻:

[1] 劉進,張?zhí)煨颍畧D像不變矩的推廣[J]. 計算機學報,2004,27(5):668-674.

[2] 范立南, 徐心和. 基于不變矩特征和神經網絡的圖像模式模糊分類[J]. 東北大學學報(自然科學版), 2004,25(8):738-741.

[3] 謝林海,劉相濱. 基于不變矩特征和神經網絡的步態(tài)識別[J]. 微計算機信息, 2007,7(1):279-281.

[4] 張濤,費樹岷,李曉東.基于GA-RBF神經網絡及邊界不變特征的車輛識別[J]. 智能系統(tǒng)學報,2009,4(3):278-282.