公務(wù)員期刊網(wǎng) 精選范文 計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用主題范文,僅供參考,歡迎閱讀并收藏。

計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用

第1篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

關(guān)鍵詞:計(jì)算機(jī);視覺(jué)技術(shù);交通工程

中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-7712 (2014) 04-0000-01

一、引言

隨著科技的發(fā)展,計(jì)算機(jī)替代人的視覺(jué)與思維已經(jīng)成為現(xiàn)實(shí),這也是計(jì)算機(jī)視覺(jué)的突出顯現(xiàn)。那么在物體圖像中識(shí)別物體并作進(jìn)一步處理,是客觀世界的主觀反應(yīng)。在數(shù)字化圖像中,我們可以探尋出較為固定的數(shù)字聯(lián)系,在物體特征搜集并處理時(shí)做到二次實(shí)現(xiàn)。這既是對(duì)物體特征的外在顯現(xiàn)與描繪,更是對(duì)其定量信息的標(biāo)定。從交通工程領(lǐng)域的角度來(lái)看,該種技術(shù)一般應(yīng)用在交管及安全方面。監(jiān)控交通流、識(shí)別車(chē)況及高速收費(fèi)都是屬于交通管理的范疇;而對(duì)交通重大事件的勘察及甄別則是交通安全所屬。在這個(gè)基礎(chǔ)上,筆者對(duì)計(jì)算機(jī)視覺(jué)系統(tǒng)的組成及原理進(jìn)行了分析,并形成視覺(jué)處理相關(guān)技術(shù)研究。

二、設(shè)計(jì)計(jì)算機(jī)視覺(jué)系統(tǒng)構(gòu)成

計(jì)算機(jī)視覺(jué)處理技術(shù)的應(yīng)用是建立在視覺(jué)系統(tǒng)的建立基礎(chǔ)上的。其內(nèi)部主要的構(gòu)成是計(jì)算機(jī)光源、光電轉(zhuǎn)換相關(guān)器件及圖像采集卡等元件。

(一)照明條件的設(shè)計(jì)。在測(cè)量物體的表征時(shí),環(huán)境的創(chuàng)設(shè)是圖像分析處理的前提,其主要通過(guò)光線反射將影像投射到光電傳感器上。故而要想獲得清晰圖像離不開(kāi)照明條件的選擇。在設(shè)計(jì)照明條件時(shí),我們通常會(huì)視具體而不同處理,不過(guò)總的目標(biāo)是一定的,那就是要利于處理圖像及對(duì)其進(jìn)行提取分析。在照明條件的設(shè)定中,主動(dòng)視覺(jué)系統(tǒng)結(jié)構(gòu)光是較為典型的范例。

(二)數(shù)據(jù)采集的處理。如今電耦合器件(CCD)中,攝像機(jī)及光電傳感器較為常見(jiàn)。它們輸出形成的影像均為模擬化的電子信號(hào)。在此基礎(chǔ)上,A模式與D模式的相互對(duì)接更能夠讓信號(hào)進(jìn)入計(jì)算機(jī)并達(dá)到數(shù)字處理標(biāo)準(zhǔn),最后再量化入計(jì)算機(jī)系統(tǒng)處理范圍??陀^物體色彩的不同,也就造就了色彩帶給人信息的差異。一般地黑白圖像是單色攝像機(jī)輸入的結(jié)果;彩色圖像則需要彩色相機(jī)來(lái)實(shí)現(xiàn)。其過(guò)程為:彩色模擬信號(hào)解碼為RGB單獨(dú)信號(hào),并單獨(dú)A/D轉(zhuǎn)換,輸出后借助色彩查找表來(lái)顯示相應(yīng)色彩。每幅圖像一旦經(jīng)過(guò)數(shù)字處理就會(huì)形成點(diǎn)陣,并將n個(gè)信息濃縮于每點(diǎn)中。彩色獲得的圖像在16比特,而黑白所獲黑白灰圖像則僅有8比特。故而從信息采集量上來(lái)看,彩色的圖像采集分析更為繁復(fù)些。不過(guò)黑白跟灰度圖像也基本適應(yīng)于基礎(chǔ)信息的特征分析。相機(jī)數(shù)量及研究技法的角度,則有三個(gè)分類(lèi):“單目視覺(jué)”、“雙目”及“三目”立體視覺(jué)。

三、研究與應(yīng)用計(jì)算機(jī)視覺(jué)處理技術(shù)

從對(duì)圖像進(jìn)行編輯的過(guò)程可以看出,計(jì)算機(jī)視覺(jué)處理技術(shù)在物體成像及計(jì)算后會(huì)在灰度陣列中參雜無(wú)效信息群,使得信息存在遺失風(fēng)險(xiǎn)。成像的噪聲在一定程度上也對(duì)獲取有效信息造成了干擾。故而,處理圖像必須要有前提地預(yù)設(shè)分析,還原圖像本相,從而消去噪音。邊緣增強(qiáng)在特定的圖像變化程度中,其起到的是對(duì)特征方法的削減?;诙祷?,分割圖像才能夠進(jìn)一步開(kāi)展。對(duì)于物體的檢測(cè)多借助某個(gè)范圍來(lái)達(dá)到目的。識(shí)別和測(cè)算物體一般總是靠對(duì)特征的甄別來(lái)完成的。

四、分析處理三維物體技術(shù)

物體外輪擴(kuò)線及表面對(duì)應(yīng)位置的限定下,物體性質(zhì)的外在表現(xiàn)則是其形狀。三維物體從內(nèi)含性質(zhì)上來(lái)看也有體現(xiàn),如通過(guò)其內(nèi)含性質(zhì)所變現(xiàn)出來(lái)的表層構(gòu)造及邊界劃定等等。故而在確定圖像特征方面,物體的三維形態(tài)是最常用的處理技術(shù)。檢測(cè)三維物體形狀及分析距離從計(jì)算機(jī)視覺(jué)技術(shù)角度來(lái)看,渠道很多,其原理主要是借助光源特性在圖像輸入時(shí)的顯現(xiàn)來(lái)實(shí)現(xiàn)的。其類(lèi)別有主動(dòng)與被動(dòng)兩類(lèi)。借助自然光照來(lái)對(duì)圖像獲取并挖掘深入信息的技術(shù)叫做被動(dòng)測(cè)距;主動(dòng)測(cè)距的光源條件則是利用人為設(shè)置的,其信息也是圖像在經(jīng)過(guò)測(cè)算分析時(shí)得到的。被動(dòng)測(cè)距的主要用途體現(xiàn)在軍工業(yè)保密及限制環(huán)境中,而普通建筑行業(yè)則主要利用主動(dòng)測(cè)距。特別是較小尺寸物體的測(cè)算,以及擁有抗干擾及其他非接觸測(cè)距環(huán)境。

(一)主動(dòng)測(cè)距技術(shù)。主動(dòng)測(cè)距,主要是指光源條件是在人為創(chuàng)設(shè)環(huán)境中滿足的,且從景物外像得到相關(guān)點(diǎn)化信息,可以適當(dāng)顯示圖像大概并進(jìn)行初步分析處理,以對(duì)計(jì)算適應(yīng)功率及信息測(cè)算程度形成水平提高。從技術(shù)種類(lèi)上說(shuō),主動(dòng)測(cè)距技術(shù)可分為雷達(dá)取像、幾何光學(xué)聚焦、圖像干擾及衍射等。除了結(jié)構(gòu)光法外的測(cè)量方法均為基于物理成像,并搜集所成圖像,并得到特殊物理特征圖像。從不同的研究環(huán)境到條件所涉,以結(jié)構(gòu)光法測(cè)量作為主要技術(shù)的工程需求較為普遍,其原理為:首先在光源的設(shè)計(jì)上由人為來(lái)進(jìn)行環(huán)境考慮測(cè)算,再?gòu)钠渲蝎@取較為全面的離散點(diǎn)化信息。在離散處理后,此類(lèi)圖像已經(jīng)形成了較多的物體真是特征表象。在此基礎(chǔ)上,信息需要不斷簡(jiǎn)化與甄別、壓縮。如果分析整個(gè)物體特征信息鏈,則后期主要體現(xiàn)在對(duì)于數(shù)據(jù)的簡(jiǎn)化分析。如今人們已經(jīng)把研究的目光轉(zhuǎn)向了結(jié)構(gòu)光測(cè)量方法的應(yīng)用,體現(xiàn)在物體形狀檢測(cè)等方面。

(二)被動(dòng)測(cè)距技術(shù)。被動(dòng)測(cè)距,對(duì)光照條件的選擇具有局限性,其主要通過(guò)對(duì)于自然光的覆蓋得以實(shí)現(xiàn)。它在圖像原始信息處理及分析匹配方面技術(shù)指向較為突出。也通過(guò)此三維物體之形狀及周?chē)h(huán)境深度均被顯露。在圖像原始信息基礎(chǔ)上的應(yīng)用計(jì)算,其與結(jié)構(gòu)光等相比繁雜程度較高。分析物體三維特性,著重從立體視覺(jué)內(nèi)涵入手,適應(yīng)物體自身特點(diǎn)而存在。不過(guò)相對(duì)來(lái)說(shuō)獲得圖像特征才是其適應(yīng)匹配的條件保障。點(diǎn)、線、區(qū)域及結(jié)構(gòu)紋理等是物象特征的主體形式。其中物特較為基礎(chǔ)與原始的特征是前兩個(gè)特征,同時(shí)它們也是其他相關(guān)表征的前提。計(jì)算機(jī)系統(tǒng)技術(shù)測(cè)量基本原理為對(duì)攝像機(jī)進(jìn)行構(gòu)建分析,并對(duì)其圖像表征進(jìn)行特征匹配,以得到圖像不同區(qū)間的視覺(jué)差異。

五、結(jié)束語(yǔ)

通過(guò)對(duì)計(jì)算機(jī)視覺(jué)技術(shù)的研究,悉知其主要的應(yīng)用領(lǐng)域及技術(shù)組成。在系統(tǒng)使用的基礎(chǔ)上深入設(shè)計(jì),對(duì)系統(tǒng)主要構(gòu)成環(huán)節(jié)進(jìn)行分析。從而將三維復(fù)雜形態(tài)原理、算法及測(cè)量理論上升到實(shí)際應(yīng)用。隨著社會(huì)對(duì)于計(jì)算機(jī)的倚賴程度增加,相信該技術(shù)在建筑或者其他領(lǐng)域會(huì)有更加深入的研究及應(yīng)用。

參考文獻(xiàn):

[1]段里仁.智能交通系境在我國(guó)道路空通管理中的應(yīng)用[J].北方工業(yè)時(shí)報(bào),2012(06).

[2]王豐元.計(jì)算機(jī)視覺(jué)在建筑區(qū)間的應(yīng)用實(shí)例分析[J].河北電力學(xué)報(bào),2011(04).

第2篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

關(guān)鍵詞:計(jì)算機(jī)視覺(jué);果蔬分類(lèi);應(yīng)用;挑戰(zhàn);展望

自“農(nóng)業(yè)4.0”時(shí)代的來(lái)臨,以“互聯(lián)網(wǎng)+”為驅(qū)動(dòng)的農(nóng)業(yè)技術(shù)已成為發(fā)展農(nóng)業(yè)強(qiáng)有力的支撐。在果蔬業(yè)中,果蔬分類(lèi)通常由經(jīng)過(guò)訓(xùn)練的人員人工評(píng)估農(nóng)產(chǎn)品或農(nóng)作物的質(zhì)量。但是,人工分類(lèi)會(huì)帶來(lái)許多相關(guān)的限制,工作人員需要熟悉果蔬的許多特征,并且高強(qiáng)度的機(jī)械性工作帶來(lái)的失誤不可避免,因而分類(lèi)技術(shù)的提高是農(nóng)產(chǎn)品質(zhì)量提升的關(guān)鍵。計(jì)算機(jī)視覺(jué)技術(shù)具有效率高、非接觸、抗干擾能力強(qiáng)等優(yōu)點(diǎn),在多個(gè)領(lǐng)域已經(jīng)廣泛應(yīng)用,能實(shí)現(xiàn)農(nóng)產(chǎn)品快速無(wú)損檢測(cè)的要求[1]。果蔬分級(jí)效率的提升對(duì)我國(guó)產(chǎn)品質(zhì)量提升、農(nóng)民增產(chǎn)增收具有重要意義。

1圖像處理技術(shù)在果蔬分類(lèi)領(lǐng)域的應(yīng)用

本文對(duì)基于計(jì)算機(jī)視覺(jué)技術(shù)的果蔬分類(lèi)進(jìn)行了比較調(diào)查,發(fā)現(xiàn)研究人員多使用一種或者多種傳感器或者機(jī)器學(xué)習(xí)技術(shù)進(jìn)行農(nóng)產(chǎn)品的分類(lèi)與分級(jí),但是由于相同水果品種不同造成形狀、大小與顏色的不同,果蔬的分類(lèi)依然面臨著許多挑戰(zhàn)[2]。為解決這些問(wèn)題研究人員已經(jīng)進(jìn)行了多種實(shí)驗(yàn),其中結(jié)合機(jī)器學(xué)習(xí)技術(shù)對(duì)于系統(tǒng)有明顯提升。通過(guò)使用傳感器捕獲水果與蔬菜的特征,使用機(jī)器學(xué)習(xí)對(duì)任務(wù)進(jìn)行優(yōu)化,以提高系統(tǒng)整體性能[3]。

2果蔬分類(lèi)的主要挑戰(zhàn)

雖然已經(jīng)在多個(gè)產(chǎn)業(yè)中實(shí)現(xiàn)目標(biāo)分類(lèi),但將果蔬作為對(duì)象進(jìn)行分類(lèi)仍然是一項(xiàng)復(fù)雜的問(wèn)題。在實(shí)際過(guò)程中,環(huán)境、光及空間等因素制約了系統(tǒng)的優(yōu)化,使系統(tǒng)的時(shí)間與準(zhǔn)確性方面受到限制。光照方向及亮度、色溫以及背景所造成的鏡面反射與漫反射都會(huì)制約系統(tǒng)的進(jìn)一步優(yōu)化,并且不同種類(lèi)果蔬的特征并不相同,這也使果蔬分類(lèi)系統(tǒng)沒(méi)有被廣泛地開(kāi)發(fā)。

2.1缺乏合適的傳感器

分類(lèi)任務(wù)的一個(gè)關(guān)鍵步驟就是選擇適合場(chǎng)景的傳感器用于數(shù)據(jù)采集。在果蔬的分類(lèi)任務(wù)中視覺(jué)傳感器與非視覺(jué)傳感器已經(jīng)廣泛地應(yīng)用,但是由于各種傳感器性質(zhì)不同其所適用的應(yīng)用場(chǎng)景亦有不同[4-6]。例如超聲波傳感器與觸覺(jué)傳感器都不太適合易損的目標(biāo)物[7]。因?yàn)檫@些傳感器需要物理接觸果蔬以獲取數(shù)據(jù)。另外,視覺(jué)傳感器對(duì)許多因素高度敏感,例如照明條件和背景環(huán)境。這些基本因素是許多復(fù)雜因素的結(jié)合,包括反射、折射、縮放、旋轉(zhuǎn)和平移,這在系統(tǒng)實(shí)際的設(shè)計(jì)中需要深入考慮。傳感器大致分為視覺(jué)傳感器和非視覺(jué)傳感器。由于每個(gè)傳感器具有一定的局限性,例如視覺(jué)傳感器對(duì)照明條件和背景顏色高度敏感。高光譜相機(jī)可以得出物體反射特性,檢測(cè)具有相似顏色或背景的不同對(duì)象的固有特性,其對(duì)許多顏色等因素不敏感,并且高光譜信息與水果的其他特征相結(jié)合,可以提高系統(tǒng)性能。最近,熱紅外分析已用于許多領(lǐng)域,例如植物病害檢測(cè)、冷藏對(duì)果實(shí)的冷害、農(nóng)作物成熟度估算和農(nóng)作物產(chǎn)量估算[8]。然而,由于蔬菜和背景的熱物理性質(zhì)大致相似,并且這種技術(shù)對(duì)溫度變化敏感,因而熱紅外分析仍不能很好地完成綠顏色水果和多葉蔬菜的分類(lèi)任務(wù)。

2.2難以準(zhǔn)確選擇特征

特征是用于與其他物體區(qū)分的物理特征。果蔬具有多種物理特征,例如顏色、質(zhì)地、形狀和大小,這些都是可以用作分類(lèi)的特征參數(shù),并且果蔬具有類(lèi)間和類(lèi)內(nèi)的同異性。類(lèi)別間的變化是主要變化,即顏色、紋理和形狀的變化,而類(lèi)別內(nèi)的變化更難以發(fā)現(xiàn),特征更加難以區(qū)分。理想的系統(tǒng)能夠進(jìn)行類(lèi)間和類(lèi)內(nèi)分類(lèi)。研究表明,單個(gè)特征不能有效地對(duì)果蔬或物體進(jìn)行有效分類(lèi)。計(jì)算機(jī)視覺(jué)是用于圖像分類(lèi)和識(shí)別的一種技術(shù),可以設(shè)計(jì)算法通過(guò)多種方式對(duì)果蔬進(jìn)行分類(lèi),通常分類(lèi)是基于神經(jīng)網(wǎng)絡(luò)完成。在任何機(jī)器學(xué)習(xí)應(yīng)用程序中選擇合適的算法至關(guān)重要,但是由于果蔬的類(lèi)間相似性,算法優(yōu)化尤為重要。數(shù)字圖像中某些與特性有關(guān)信息的識(shí)別、分類(lèi)、檢索、重建稱(chēng)為特征描述,果蔬具有相關(guān)的獨(dú)特視覺(jué)特征。果蔬的分類(lèi)和識(shí)別最常用的特征是顏色、形狀、大小和質(zhì)地,可以根據(jù)整體或局部圖像特征來(lái)選擇特征描述是全局或者局部的特征。特別是對(duì)于對(duì)象識(shí)別,全局圖像特征描述整個(gè)對(duì)象,具有良好的不變性,而局部圖像特征則易于實(shí)現(xiàn)快速匹配。因此,通常將局部和全局圖像特征配合使用以提高整體性能。在圖像經(jīng)過(guò)去噪、平滑等操作之后,圖像的細(xì)節(jié)將不可避免地丟失,因而需要更加注意特征的選取。這些因素對(duì)特征描述的選取造成了一些限制。

3展望

第3篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

 

數(shù)據(jù)挖掘就是從大量的不完全的有噪聲的模糊的隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,抽取隱含在其中的、事先并不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。

 

決策樹(shù)算法作為常用的數(shù)據(jù)挖掘技術(shù)之一,其基本思想是將實(shí)例庫(kù)中記錄的大量有限的具體事實(shí)數(shù)據(jù)進(jìn)行歸納和分類(lèi)并建立樹(shù)型結(jié)構(gòu),以發(fā)現(xiàn)并形成隱含在大量實(shí)例中的若干形式化的分類(lèi)判別規(guī)則,典型的決策樹(shù)算法方法有ID3方法和IBLE(Information—based Learning from Example)方法。

 

利用決策樹(shù)評(píng)估教材質(zhì)量的基本思想

 

筆者以高校教學(xué)質(zhì)量建設(shè)中的重頭戲——教材建設(shè)為例來(lái)闡釋決策樹(shù)算法在教育統(tǒng)計(jì)學(xué)中的應(yīng)用。

 

從教材的教學(xué)水平,科學(xué)水平等兩大要素來(lái)對(duì)教材的質(zhì)量進(jìn)行合理分類(lèi),探索出科學(xué)合理的決策樹(shù)的模型,使之成為學(xué)校教材建設(shè)管理的理論方法,并在今后的教材管理中起著一定的指導(dǎo)作用。

 

教學(xué)水平:教材符合人才培養(yǎng)目標(biāo)及本課程教學(xué)的要求:取材合適、深度適宜、份量恰當(dāng);符合認(rèn)知規(guī)律;富有啟發(fā)性;便于學(xué)習(xí)。

 

科學(xué)水平:能反映本學(xué)科國(guó)內(nèi)外科學(xué)研究和教學(xué)研究的先進(jìn)成果;能完整地表達(dá)本課程應(yīng)包含的知識(shí);反映其相互聯(lián)系及發(fā)展規(guī)律;結(jié)構(gòu)嚴(yán)謹(jǐn)。

 

構(gòu)建決策樹(shù)模型

 

即利用訓(xùn)練集(教材建設(shè)數(shù)據(jù)庫(kù))建立并精化一棵決策樹(shù)。該過(guò)程可分為建樹(shù)和剪枝兩階段。其中,建樹(shù)是用每一個(gè)屬性將訓(xùn)練集劃分成一個(gè)或多個(gè)子集,遞歸地調(diào)用該過(guò)程,直到每個(gè)子集中的記錄都屬于同一類(lèi),最終得到?jīng)Q策樹(shù)。剪枝是為提高樹(shù)的精度及分類(lèi)效率,而去掉因訓(xùn)練數(shù)據(jù)中的噪聲和孤立點(diǎn)等引起的不可靠或可能是噪聲的一些枝條。

 

利用決策樹(shù)研究影響教材質(zhì)量的因素

 

首先,將學(xué)生問(wèn)卷調(diào)查數(shù)據(jù)庫(kù)和教學(xué)管理部門(mén)所掌握的資料結(jié)合起來(lái),分類(lèi)整理,同時(shí)進(jìn)行規(guī)范化的數(shù)據(jù)清洗,得到創(chuàng)建決策樹(shù)模型的訓(xùn)練集,如表1所示。

 

根據(jù)評(píng)估預(yù)期的要求,將所有教材的評(píng)估結(jié)果分為兩類(lèi):

 

Class p:綜合評(píng)價(jià)=“優(yōu)秀”

 

Class n:綜合評(píng)價(jià)=“一般”

 

從上表顯示的數(shù)據(jù)可知,綜合評(píng)價(jià)為“一般”的教材有9種, 綜合評(píng)價(jià)為“優(yōu)秀”的教材有6種,從而可以計(jì)算出樣本分類(lèi)的期望信息:

 

—∑Pi log2(pi)=

 

I(p,n)=I(9,6)= —[(9/15)×log2(9/15)+6/15×log2=(6/15)]

 

=—(—0.444—0.53)=0.974

 

下面以綜合評(píng)價(jià)是否為“優(yōu)秀”作為衡量標(biāo)準(zhǔn)分別計(jì)算由各個(gè)屬性劃分子集的信息熵,以及各自的信息增益度。

 

計(jì)算“教學(xué)水平”的信息增加益度

 

從而算出信息熵E(教學(xué)水平)=

 

I(3,1)+I(3,2)+I(0,3)+I(0,3)=0.43

 

再計(jì)算出其信息增益度

 

GainI(p,n)—E(教學(xué)水平)=0.974—0.507=0.467

 

計(jì)算“科學(xué)水平”的信息增益度

 

計(jì)算信息熵E(科學(xué)水平)=I(2,1)+I(3,2)+I(1,6)+I(0,0)—0.783再計(jì)算出其信息增益度GainI(科學(xué)水平)=I(p,n)—E(科學(xué)水平)=0.974—0.783=0.191

 

計(jì)算“教材編者職稱(chēng)”的信息增益度

 

從而算出信息熵E(教材編者職稱(chēng))=I(4,1)+I(2,1)+I(0,4)+I(0,3)=0.424再計(jì)算出其信息增益度GainI(教材編者職稱(chēng))—I(p,n)—E(教材編者職稱(chēng))=0.974—0.424=0.55

 

計(jì)算“教材編者學(xué)歷”的信息增益度

 

計(jì)算信息熵E(教材編者學(xué)歷)=I(3,1)+I(3,3)+I(0,5)=0.667再計(jì)算出其信息增益度GainI(教材編者學(xué)歷)=(p,n)—(教材編者學(xué)歷)=0.974—0.667=0.307

 

由此可以得知“教材編者職稱(chēng)”的信息增益度最大,它是最能區(qū)別訓(xùn)練集實(shí)例中教材質(zhì)量的屬性,應(yīng)作為決策樹(shù)的根節(jié)點(diǎn)。根據(jù)各個(gè)屬性的信息增益度的大小,可以構(gòu)建該訓(xùn)練集實(shí)例的決策樹(shù)如下圖1所示:

 

由該決策樹(shù)可以得出諸如以下結(jié)論:

第4篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

 

1 計(jì)算機(jī)視覺(jué)定義

 

人類(lèi)天生具有五感,視覺(jué)便是其中之一,而計(jì)算機(jī)視覺(jué),就是讓計(jì)算機(jī)網(wǎng)絡(luò)能夠睜開(kāi)眼看世界。讓計(jì)算機(jī)有一定的視覺(jué)能力,可以從各個(gè)方面幫助人們進(jìn)行監(jiān)督、檢驗(yàn)檢測(cè)。利用計(jì)算機(jī)視覺(jué)科學(xué)可以使工作變得更加簡(jiǎn)便。計(jì)算機(jī)視覺(jué)主要應(yīng)用于對(duì)二維碼、條形碼、照片、視頻資料如片段等進(jìn)行智能處理。

 

2 計(jì)算機(jī)視覺(jué)研究在醫(yī)療、交通中的作用

 

隨著醫(yī)學(xué)成像技術(shù)的發(fā)展與進(jìn)步,圖像處理在醫(yī)學(xué)研究與臨床醫(yī)學(xué)中的應(yīng)用越來(lái)越廣泛。最常見(jiàn)的有癌細(xì)胞顯微圖像分割與識(shí)別、基于多特征融合的血紅細(xì)胞識(shí)別和乳腺癌細(xì)胞計(jì)算機(jī)的自動(dòng)識(shí)別等。計(jì)算機(jī)視覺(jué)技術(shù)的迅猛發(fā)展,為醫(yī)療診斷帶來(lái)了很大的方便,同時(shí)促進(jìn)了臨床醫(yī)學(xué)的發(fā)展。另外,在各大綜合醫(yī)院慢慢發(fā)展起的體檢體系中,計(jì)算機(jī)視覺(jué)技術(shù)起到了決定性因素。隨著體檢的人數(shù)上升,對(duì)醫(yī)院體檢的管理、速度、準(zhǔn)確性都提出了更高的要求。視覺(jué)識(shí)別輕而易舉的解決了這個(gè)問(wèn)題,只需要去識(shí)別體檢人員的身份證,就可以將體檢人員對(duì)號(hào)入座,檢查過(guò)的項(xiàng)目,沒(méi)有檢查的項(xiàng)目一目了然。理化指標(biāo)的檢驗(yàn),只需要在采血試管或采尿瓶上粘貼與體檢者對(duì)應(yīng)的條形碼即可,利用視覺(jué)技術(shù)對(duì)號(hào)入座,方便而準(zhǔn)確的確定每一位體檢人員的血樣及尿樣。及提高了醫(yī)院的工作效率,又將錯(cuò)誤率降到最低。

 

計(jì)算機(jī)視覺(jué)在交通上同樣得到了廣泛的應(yīng)用及發(fā)展。交通安全是交通運(yùn)輸中的重大問(wèn)題,隨著近年來(lái)機(jī)動(dòng)汽車(chē)數(shù)量的迅猛增長(zhǎng),交通事故的發(fā)生也隨之越來(lái)越頻繁,給人類(lèi)社會(huì)帶來(lái)的危害也日趨嚴(yán)重,使很多的家庭失去親人,甚至家破人亡。全國(guó)一線城市例如:北京、上海、廣州、深圳等交通道路供需的矛盾日趨嚴(yán)重,交通安全、交通堵塞及環(huán)境污染已成為困擾我國(guó)交通領(lǐng)域的三大難題?;趫D像處理的計(jì)算機(jī)視覺(jué)技術(shù)是通過(guò)攝像機(jī)獲取場(chǎng)景圖像,并借助于計(jì)算機(jī)軟件構(gòu)建一個(gè)自動(dòng)化或半自動(dòng)化的圖像、視頻理解和分析系統(tǒng),并提供及時(shí)準(zhǔn)確的圖像、視頻處理結(jié)果,以模仿人的視覺(jué)功能。主要功能如下:

 

一是基于計(jì)算機(jī)視覺(jué)技術(shù)的車(chē)輛牌照自動(dòng)識(shí)別: 車(chē)輛牌照是車(chē)輛的唯一身份,對(duì)車(chē)輛牌照的有效檢測(cè)與識(shí)別在車(chē)輛違章檢測(cè)、停車(chē)場(chǎng)管理、不停車(chē)收費(fèi)、被盜車(chē)輛稽查等方面有著重要的應(yīng)用價(jià)值。盡管針對(duì)車(chē)牌識(shí)別技術(shù)的研究相對(duì)成熟,然而在實(shí)際的應(yīng)用場(chǎng)景中,受到天氣、光照、拍攝視角、車(chē)牌扭曲等因素的影響,車(chē)牌識(shí)別技術(shù)仍然有一定的改善空間。

 

二是基于計(jì)算機(jī)視覺(jué)技術(shù)的車(chē)輛檢測(cè)與流量統(tǒng)計(jì):目前城市交通路口的紅路燈間隔時(shí)間是固定的,而不同路段、不同時(shí)間段交通流量是隨機(jī)變化的。若能根據(jù)各個(gè)交通路口的交通狀況輔以計(jì)算機(jī)進(jìn)行自動(dòng)分析,并判斷與預(yù)測(cè)交通流量,無(wú)疑為交通警察出警,紅綠燈時(shí)間間隔的動(dòng)態(tài)設(shè)置等提供技術(shù)支持。

 

三是基于計(jì)算機(jī)視覺(jué)技術(shù)的公交專(zhuān)用道路非法占道抓拍:公共交通是每個(gè)城市交通的重中之重,城市的公共交通為老百姓提供了便捷的出行方式。公共交通的發(fā)展,有利于城市的節(jié)能減排,有利于降低城市的空氣污染指數(shù)。由于城市公共交通具有運(yùn)量大、相對(duì)投資少、人均占有道路少等優(yōu)點(diǎn),解決城市交通問(wèn)題必須優(yōu)先發(fā)展城市公共交通。然而目前擁擠、緩慢的公交出行方式已成詬病,因此發(fā)展“快速公交”將是未來(lái)公交的一種運(yùn)行模式。道路暢通則是發(fā)展“快速公交”的前提,相應(yīng)地,公交專(zhuān)用車(chē)道的設(shè)定必不可少。為防止其他社會(huì)車(chē)輛的駛?cè)?,并?duì)違規(guī)駛?cè)氲钠渌鐣?huì)違規(guī)車(chē)輛進(jìn)行抓拍與懲罰是保證公交車(chē)道公交車(chē)專(zhuān)駛的一種重要手段。因此在公交車(chē)前部裝置攝像頭并輔以其他處理設(shè)備,從而可以使得每一輛公交車(chē)成為了一個(gè)流動(dòng)的監(jiān)控設(shè)備。

 

3 計(jì)算機(jī)視覺(jué)在條形碼檢測(cè)中的應(yīng)用

 

條形碼是將寬度不等的多個(gè)黑條和空白,按照一定的編碼規(guī)則排列,用以表達(dá)一組信息的圖形標(biāo)識(shí)符。在中國(guó),由中國(guó)物品編碼中心賦予制造廠商代碼。那么最常見(jiàn)的計(jì)算機(jī)視覺(jué)應(yīng)用與條形碼檢測(cè)就是在超市中。超市中每樣產(chǎn)品都有自己的條形碼,當(dāng)人們選擇了自己需要的物品后,來(lái)到收銀臺(tái)進(jìn)行結(jié)賬,我們會(huì)看見(jiàn)收銀人員會(huì)用掃碼器對(duì)物品的條形碼進(jìn)行掃描,掃描后就會(huì)出現(xiàn)產(chǎn)品的信息及價(jià)錢(qián)。記錄以及掃描條形碼的技術(shù)就是計(jì)算機(jī)視覺(jué)技術(shù)。

 

4 計(jì)算機(jī)視覺(jué)重要技術(shù)——智能識(shí)別

 

近年來(lái),基于生物特征的鑒別技術(shù)得到了廣泛重視,主要集中在對(duì)人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺(jué)信息有關(guān)。指紋、人臉功能已經(jīng)大范圍在生活中應(yīng)用,其中很多單位的打卡制度就是依據(jù)面部識(shí)別、指紋識(shí)別來(lái)實(shí)現(xiàn)的。社會(huì)飛速發(fā)展的今天,很多的單位都實(shí)行了上下班打卡制度,這一制度已經(jīng)被作為單位管理制度中的重要一條。購(gòu)買(mǎi)的打卡機(jī)就是采用計(jì)算機(jī)視覺(jué)的重要技術(shù)——智能識(shí)別來(lái)實(shí)現(xiàn)的。利用打卡機(jī)的儲(chǔ)存功能,記錄每個(gè)職工的指紋或面部容貌,規(guī)定在某一個(gè)時(shí)間范圍內(nèi)對(duì)應(yīng)識(shí)別指紋或面部容貌,視為打卡。在上下班打卡的過(guò)程中,員工將面部或指紋對(duì)應(yīng)在打卡機(jī)的制定位置上,讓打卡機(jī)進(jìn)行識(shí)別,當(dāng)識(shí)別的結(jié)果與存儲(chǔ)結(jié)果相同時(shí),打卡成功。這樣看起來(lái)十分簡(jiǎn)單的打卡機(jī)可以使單位的工作有序化,制度化,而實(shí)現(xiàn)這個(gè)功能的技術(shù)就是計(jì)算機(jī)視覺(jué)技術(shù)中的重要技術(shù)之一:智能識(shí)別。

 

5 計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展過(guò)程及未來(lái)

 

計(jì)算機(jī)視覺(jué)技術(shù)研究經(jīng)歷了近40年的過(guò)程,20世紀(jì)50年代的統(tǒng)計(jì)模式識(shí)別、60年代的Roberts的三圍積木世界、70年代的Marr為代表的計(jì)算理論、80年代的主動(dòng)視覺(jué),但是仍然面臨許多的問(wèn)題。主要由于計(jì)算機(jī)視覺(jué)是一個(gè)逆問(wèn)題,視覺(jué)信息多種多樣,視覺(jué)知識(shí)的表達(dá)很困難,圖像數(shù)據(jù)量巨大,信息存儲(chǔ)于檢索困難,對(duì)生物學(xué)、神經(jīng)生物學(xué)等的研究有待深入。

 

計(jì)算機(jī)視覺(jué)技術(shù)的未來(lái)必定會(huì)朝著高科技發(fā)展,航空遙感測(cè)控地形地貌、電影特效制作、工業(yè)生產(chǎn)自動(dòng)化檢測(cè)、醫(yī)學(xué)影像檢測(cè),再到天文領(lǐng)域等,在這些科學(xué)領(lǐng)域中計(jì)算機(jī)視覺(jué)將無(wú)法取代,成為主流的技術(shù)之一。

 

作者簡(jiǎn)介

第5篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

【關(guān)鍵詞】精密測(cè)量 計(jì)算機(jī)視覺(jué)圖像 關(guān)鍵技術(shù)

在現(xiàn)代城市的建設(shè)中離不開(kāi)測(cè)量的運(yùn)用,對(duì)于測(cè)量而言需要精確的數(shù)值來(lái)表達(dá)建筑物、地形地貌等特征及高度。在以往的測(cè)量中無(wú)法精準(zhǔn)的進(jìn)行計(jì)算及在施工中無(wú)法精準(zhǔn)的達(dá)到設(shè)計(jì)要求。本文就計(jì)算機(jī)視覺(jué)圖像精密測(cè)量進(jìn)行分析,并對(duì)其關(guān)鍵技術(shù)做以簡(jiǎn)析。

1 概論

1.1 什么是計(jì)算機(jī)視覺(jué)圖像精密測(cè)量

計(jì)算機(jī)視覺(jué)精密測(cè)量從定義上來(lái)講是一種新型的、非接觸性測(cè)量。它是集計(jì)算機(jī)視覺(jué)技術(shù)、圖像處理技術(shù)及測(cè)量技術(shù)于一體的高精度測(cè)量技術(shù),且將光學(xué)測(cè)量的技術(shù)融入當(dāng)中。這樣讓它具備了快速、精準(zhǔn)、智能等方面的優(yōu)勢(shì)及特性。這種測(cè)量方法在現(xiàn)代測(cè)量中被廣泛使用。

1.2 計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的工作原理

計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的工作原理類(lèi)似于測(cè)量?jī)x器中的全站儀。它們具有相同的特點(diǎn)及特性,主要還是通過(guò)微電腦進(jìn)行快速的計(jì)算處理得到使用者需要的測(cè)量數(shù)據(jù)。其原理簡(jiǎn)單分為以下幾步:

(1)對(duì)被測(cè)量物體進(jìn)行圖像掃描,在對(duì)圖像進(jìn)行掃描時(shí)需注意外借環(huán)境及光線因素,特別注意光線對(duì)于儀器掃描的影響。

(2)形成比例的原始圖,在對(duì)于物體進(jìn)行掃描后得到與現(xiàn)實(shí)原狀相同的圖像,在個(gè)步驟與相機(jī)的拍照原理幾乎相同。

(3)提取特征,通過(guò)微電子計(jì)算機(jī)對(duì)掃描形成的原始圖進(jìn)行特征的提取,在設(shè)置程序后,儀器會(huì)自動(dòng)進(jìn)行相應(yīng)特征部分的關(guān)鍵提取。

(4)分類(lèi)整理,對(duì)圖像特征進(jìn)行有效的分類(lèi)整理,主要對(duì)于操作人員所需求的數(shù)據(jù)進(jìn)行整理分類(lèi)。

(5)形成數(shù)據(jù)文件,在完成以上四個(gè)步驟后微計(jì)算機(jī)會(huì)對(duì)于整理分類(lèi)出的特征進(jìn)行數(shù)據(jù)分析存儲(chǔ)。對(duì)于計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的工作原理就進(jìn)行以上分析。

1.3 主要影響

從施工測(cè)量及測(cè)繪角度分析,對(duì)于計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的影響在于環(huán)境的影響。其主要分為地形影響和氣候影響。地形影響對(duì)于計(jì)算機(jī)視覺(jué)圖像精密測(cè)量是有限的,基本對(duì)于計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的影響不是很大,但還是存在一定的影響。主要體現(xiàn)在遮擋物對(duì)于掃描成像的影響,如果掃描成像質(zhì)量較差,會(huì)直接影響到對(duì)于特征物的提取及數(shù)據(jù)的準(zhǔn)確性。還存在氣候影響,氣候影響的因素主要在于大風(fēng)及光線影響。大風(fēng)對(duì)于掃描儀器的穩(wěn)定性具有一定的考驗(yàn),如有稍微抖動(dòng)就會(huì)出現(xiàn)誤差不能準(zhǔn)確的進(jìn)行精密測(cè)量。光線的影響在于光照的強(qiáng)度上,主要還是表現(xiàn)在基礎(chǔ)的成像,成像結(jié)果會(huì)直接導(dǎo)致數(shù)據(jù)結(jié)果的準(zhǔn)確性。

2 計(jì)算機(jī)視覺(jué)圖像精密測(cè)量下的關(guān)鍵技術(shù)

計(jì)算機(jī)視覺(jué)圖像精密測(cè)量下的關(guān)鍵技術(shù)主要分為以下幾種:

2.1 自動(dòng)進(jìn)行數(shù)據(jù)存儲(chǔ)

在對(duì)計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的原理分析,參照計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的工作原理,對(duì)設(shè)備的質(zhì)量要求很高,計(jì)算機(jī)視覺(jué)圖像精密測(cè)量?jī)x器主要還是通過(guò)計(jì)算機(jī)來(lái)進(jìn)行數(shù)據(jù)的計(jì)算處理,如果遇到計(jì)算機(jī)系統(tǒng)老舊或處理數(shù)據(jù)量較大,會(huì)導(dǎo)致計(jì)算機(jī)系統(tǒng)崩潰,導(dǎo)致計(jì)算結(jié)果無(wú)法進(jìn)行正常的存儲(chǔ)。為了避免這種情況的發(fā)生,需要對(duì)于測(cè)量成果技術(shù)進(jìn)行有效的存儲(chǔ)。將測(cè)量數(shù)據(jù)成果存儲(chǔ)在固定、安全的存儲(chǔ)媒介中,保證數(shù)據(jù)的安全性。如果遇到計(jì)算機(jī)系統(tǒng)崩潰等無(wú)法正常運(yùn)行的情況時(shí),應(yīng)及時(shí)將數(shù)據(jù)進(jìn)行備份存儲(chǔ),快速還原數(shù)據(jù)。在對(duì)于前期測(cè)量數(shù)據(jù)再次進(jìn)行測(cè)量或多次測(cè)量,系統(tǒng)會(huì)對(duì)于這些數(shù)據(jù)進(jìn)行統(tǒng)一對(duì)比,如果出現(xiàn)多次測(cè)量結(jié)果有所出入,系統(tǒng)會(huì)進(jìn)行提示。這樣就可以避免數(shù)據(jù)存在較大的誤差。

2.2 減小誤差概率

在進(jìn)行計(jì)算機(jī)視覺(jué)圖像精密測(cè)量時(shí)往往會(huì)出現(xiàn)誤差,而導(dǎo)致這些誤差的原因主要存在于操作人員與機(jī)器系統(tǒng)故障,在進(jìn)行操作前操作員應(yīng)對(duì)于儀器進(jìn)行系統(tǒng)性的檢查,再次使用儀器中的自檢系統(tǒng),保證儀器的硬件與軟件的正常運(yùn)行,如果硬軟件出現(xiàn)問(wèn)題會(huì)導(dǎo)致測(cè)量精度的誤差,從而影響工作的進(jìn)度。人員操作也會(huì)導(dǎo)致誤差,人員操作的誤差在某些方面來(lái)說(shuō)是不可避免的。這主要是對(duì)操作人員工作的熟練程度的一種考驗(yàn),主要是對(duì)于儀器的架設(shè)及觀測(cè)的方式。減少人員操作中的誤差,就要做好人員的技術(shù)技能培訓(xùn)工作。讓操作人員有過(guò)硬過(guò)強(qiáng)的操作技術(shù),在這些基礎(chǔ)上再建立完善的體制制度。利用多方面進(jìn)行全面控制誤差。

2.3 方便便攜

在科學(xué)技術(shù)發(fā)展的今天我們?cè)谏町?dāng)中運(yùn)用到東西逐漸在形狀、外觀上發(fā)生巨大的變大。近年來(lái),對(duì)于各種儀器設(shè)備的便攜性提出了很高的要求,在計(jì)算機(jī)視覺(jué)圖像精密測(cè)量中對(duì)設(shè)備的外形體積要求、系統(tǒng)要求更為重要,其主要在于人員方便攜帶可在大范圍及野外進(jìn)行測(cè)量,不受環(huán)境等特殊情況的限制。

3 計(jì)算機(jī)視覺(jué)圖像精密測(cè)量發(fā)展趨勢(shì)

目前我國(guó)國(guó)民經(jīng)濟(jì)快速發(fā)展,我們對(duì)于精密測(cè)量的要求越來(lái)越來(lái)高,特別是近年我國(guó)科技技術(shù)的快速發(fā)展及需要,很多工程及工業(yè)方面已經(jīng)超出我們所能測(cè)試的范圍。在這樣的前景下,我們對(duì)于計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的發(fā)展趨勢(shì)進(jìn)行一個(gè)預(yù)估,其主要發(fā)展趨勢(shì)有以下幾方面:

3.1 測(cè)量精度

在我們?nèi)粘I钪校覀兂S玫拈L(zhǎng)度單位基本在毫米級(jí)別,但在現(xiàn)在生活中,毫米級(jí)別已經(jīng)不能滿足工業(yè)方面的要求,如航天航空方面。所以提高測(cè)量精度也是計(jì)算機(jī)視覺(jué)圖像精密測(cè)量發(fā)展趨勢(shì)的重要方向,主要在于提高測(cè)量精度,在向微米級(jí)及納米級(jí)別發(fā)展,同時(shí)提高成像圖像方面的分辨率,進(jìn)而達(dá)到我們預(yù)測(cè)的目的。

3.2 圖像技術(shù)

計(jì)算機(jī)的普遍對(duì)于各行各業(yè)的發(fā)展都具有時(shí)代性的意義,在計(jì)算機(jī)視覺(jué)圖像精密測(cè)量中運(yùn)用圖像技術(shù)也是非常重要的,在提高圖像處理技術(shù)做以提高。同時(shí)工程方面遙感測(cè)量的技術(shù)也是對(duì)于精密測(cè)量的一種推廣。

4 結(jié)束語(yǔ)

在科技發(fā)展的現(xiàn)在,測(cè)量是生活中不可缺少的一部分,測(cè)量同時(shí)也影響著我們的衣食住行,在測(cè)量技術(shù)中加入計(jì)算機(jī)視覺(jué)圖像技術(shù)是對(duì)測(cè)量技術(shù)的一種革新。在融入這種技術(shù)后,我相信在未來(lái)的工業(yè)及航天事業(yè)中計(jì)算機(jī)視覺(jué)圖像技g能發(fā)揮出最大限度的作用,為改變?nèi)藗兊纳钭龀鼋艹龅呢暙I(xiàn)。

參考文獻(xiàn)

[1]湯劍.周芳芹.楊繼隆.計(jì)算機(jī)視覺(jué)圖像系統(tǒng)的技術(shù)改造[J].機(jī)電產(chǎn)品開(kāi)發(fā)與創(chuàng)新周刊,2015,14(18):33-36.

[2]馬玉真.程殿彬.范文兵,計(jì)算機(jī)視覺(jué)檢測(cè)技術(shù)的發(fā)展及應(yīng)用研究[J].濟(jì)南大學(xué)學(xué)報(bào),2014,18(23):222-227.

[3]李華.基于計(jì)算機(jī)視覺(jué)圖像精密測(cè)量的關(guān)鍵技術(shù)分析[J].電腦知識(shí)與技術(shù),2013(05):1211-1212.

第6篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

1計(jì)算機(jī)視覺(jué)概述

1.1計(jì)算機(jī)視覺(jué)學(xué)概述

從某種意義上說(shuō),計(jì)算機(jī)視覺(jué)學(xué)是一門(mén)在20世紀(jì)60年代興起的新學(xué)科。它是一門(mén)邊緣學(xué)科,融入了很多學(xué)科的特點(diǎn),具有很強(qiáng)的工程性特征。比如,圖像處理、應(yīng)用數(shù)學(xué)、光電技術(shù)。換個(gè)角度來(lái)說(shuō),計(jì)算機(jī)視覺(jué)同屬于工程領(lǐng)域、科學(xué)領(lǐng)域。

1.2計(jì)算機(jī)視覺(jué)的應(yīng)用

計(jì)算機(jī)視覺(jué)的應(yīng)用能夠使計(jì)算機(jī)具有和人一樣的視覺(jué)功能。在生活和生產(chǎn)過(guò)程中,照片資料、視頻資料的處理是計(jì)算機(jī)視覺(jué)應(yīng)用的主要方面。比如,在航空事業(yè)方面,對(duì)衛(wèi)星照片的翻譯;在醫(yī)學(xué)領(lǐng)域中,主要用于輔方面的診斷;在工業(yè)生產(chǎn)方面,由于各種復(fù)雜因素的影響,計(jì)算機(jī)視覺(jué)在這方面的應(yīng)用顯得特別簡(jiǎn)單,有利于相關(guān)系統(tǒng)的實(shí)際構(gòu)成。

2目標(biāo)圖像檢索存在的問(wèn)題

從某種角度來(lái)說(shuō),目標(biāo)圖像檢索需要分為特征匹配、特征提取兩個(gè)方面。它們表達(dá)了不同的含義。對(duì)于特征提取來(lái)說(shuō),它是圖像進(jìn)行檢索的第一步,其提取結(jié)果會(huì)對(duì)進(jìn)一步的研究造成直接的影響。而對(duì)于特征匹配來(lái)說(shuō),其匹配的準(zhǔn)確度會(huì)直接影響圖像檢索系統(tǒng)的返回結(jié)果。但在目標(biāo)圖像檢索完善的過(guò)程中,遇到一些問(wèn)題阻礙了這兩個(gè)方面的完善。因此,本文作者對(duì)其中的一些予以了相關(guān)的探討。

2.1環(huán)境因素不斷變化

對(duì)于目標(biāo)圖像來(lái)說(shuō),環(huán)境因素是影響其準(zhǔn)確率的重要因素。同時(shí),在復(fù)雜混亂的環(huán)境中,由于受到眾多干擾物的影響,加上部分目標(biāo)圖像區(qū)域被遮蓋,致使目標(biāo)圖像信息不夠全面,使目標(biāo)物體特征的提取難度進(jìn)一步加大。

2.2圖像噪聲的影響

子為了更好地模仿生活中的圖像檢索,數(shù)據(jù)庫(kù)中的圖像也會(huì)隨之發(fā)生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會(huì)使目標(biāo)物體的外觀發(fā)生對(duì)應(yīng)的變化。在此基礎(chǔ)上,嚴(yán)重降低了目標(biāo)圖像信息獲取的準(zhǔn)確度。

2.3目標(biāo)圖像檢索訓(xùn)練數(shù)據(jù)的自動(dòng)標(biāo)注

由于處于網(wǎng)絡(luò)中的圖像資源信息過(guò)于繁多,需要采用手工的方式對(duì)它們進(jìn)行標(biāo)注。但這種方法非常浪費(fèi)時(shí)間,準(zhǔn)確率也比較低。很顯然,這就需要目標(biāo)檢索圖像能夠具有自動(dòng)標(biāo)注的能力。實(shí)際上,圖像檢索方法過(guò)分依賴人工標(biāo)注信息。而這些信息很多收到來(lái)自各方面因素的影響。比如,認(rèn)識(shí)差異因素、個(gè)人經(jīng)驗(yàn)。以至于對(duì)圖像產(chǎn)生誤解。

3基于計(jì)算機(jī)視覺(jué)下的目標(biāo)圖像檢索技術(shù)

3.1以多尺度視覺(jué)為紐帶的目標(biāo)圖像檢索方法

該種目標(biāo)檢索技術(shù)的應(yīng)用主要是為了提高目標(biāo)圖像檢索的準(zhǔn)確率,能夠?qū)崿F(xiàn)目標(biāo)圖像訓(xùn)練數(shù)據(jù)的自動(dòng)化標(biāo)注。該類(lèi)技術(shù)主要是用于那些沒(méi)有遮擋,不需要進(jìn)行監(jiān)督的目標(biāo)圖像檢索方面。具體來(lái)說(shuō),它需要經(jīng)過(guò)一系列的訓(xùn)練。在訓(xùn)練的過(guò)程中,以統(tǒng)計(jì)學(xué)習(xí)為紐帶,對(duì)相應(yīng)多尺度的目標(biāo)檢測(cè)模型進(jìn)行適當(dāng)?shù)挠?xùn)練。在此基礎(chǔ)上,以該模型為基點(diǎn),對(duì)圖像中那些顯著性的區(qū)域進(jìn)行合理地提取。比如,該區(qū)域的亮度、顏色。最后,需要對(duì)用于該實(shí)驗(yàn)研究中的概率潛在語(yǔ)義分析模型進(jìn)行合理地利用??傊?,利用這種檢索方法可以對(duì)圖像中那些顯著目標(biāo)所處的區(qū)域自動(dòng)進(jìn)行檢測(cè)。同時(shí),對(duì)其中目標(biāo)圖像的顯著性進(jìn)行合理地排序,能夠提高檢索引擎所返回圖像結(jié)果的準(zhǔn)確度。

3.2以彩色LBP局部紋理特點(diǎn)為媒介的目標(biāo)圖像檢索方法

這種目標(biāo)圖像檢索方法能夠有效地解決圖像信息采集過(guò)程圖像噪聲以及其它相關(guān)因素對(duì)所提取紋理特征的影響,提高了圖像目標(biāo)的準(zhǔn)確率。對(duì)于這種圖像目標(biāo)檢索方法來(lái)說(shuō),它把圖像彩色空間特征和簡(jiǎn)化的LBP特征有機(jī)地相融合。在此基礎(chǔ)上,該類(lèi)方法增加了光照的不變特性,卻保留了LBP局部的旋轉(zhuǎn)特點(diǎn)。在提高圖像檢索速度方面,主要是利用原來(lái)的LBP特征來(lái)丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時(shí),這種目標(biāo)圖像檢索方法的應(yīng)用可以使對(duì)應(yīng)計(jì)算方法的難度得以降低,還能對(duì)角度等變化狀態(tài)下的目標(biāo)圖像進(jìn)行準(zhǔn)確地識(shí)別以及檢索。

3.3以視覺(jué)一致性為橋梁的目標(biāo)圖像檢索方法

從某個(gè)角度來(lái)說(shuō),它的應(yīng)用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對(duì)搜索引擎返回結(jié)果的目標(biāo)顯著圖予以準(zhǔn)確的計(jì)算。此外,還要對(duì)其中的目標(biāo)顯著系數(shù)進(jìn)行適當(dāng)?shù)剡^(guò)濾。二是:以所有圖像為基點(diǎn),以顯著目標(biāo)為導(dǎo)向,采取視覺(jué)一致性的模式。三是:以視覺(jué)一致性為基礎(chǔ),對(duì)其中的不同目標(biāo)圖像信息進(jìn)行客觀地分類(lèi)。這種以視覺(jué)一致性為核心的方法能夠有效地提高圖像檢索結(jié)果的準(zhǔn)確率。更重要的是,在提高圖像搜索引擎檢索性能的同時(shí),能夠及時(shí)為用戶選出最優(yōu)的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關(guān)。

4結(jié)語(yǔ)

第7篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

關(guān)鍵詞:三目攝像機(jī);標(biāo)定;立體視覺(jué);外部參數(shù)

一、緒論

1.1研究的背景及意義

計(jì)算機(jī)視覺(jué)是當(dāng)今極為重要的學(xué)科之一,它在具有很強(qiáng)的挑戰(zhàn)性的同時(shí)又擁有廣泛的應(yīng)用前景和實(shí)用價(jià)值。計(jì)算機(jī)視覺(jué)以視覺(jué)理論為中心,以圖像處理、模式識(shí)別、計(jì)算機(jī)技術(shù)和生理學(xué)、心理學(xué)為基礎(chǔ),研究?jī)?nèi)容主要有兩個(gè)方面:一是開(kāi)發(fā)從輸入圖像數(shù)據(jù)自動(dòng)構(gòu)造場(chǎng)景描述的圖像處理系統(tǒng);二是理解人類(lèi)視覺(jué)機(jī)理,用機(jī)器代替人去做人類(lèi)難以達(dá)到或根本無(wú)法達(dá)到的工作[1]。

計(jì)算機(jī)視覺(jué)應(yīng)用的廣泛性體現(xiàn)在其不僅用于文字、指紋、面部、商標(biāo)以及圖像數(shù)據(jù)庫(kù)、檢測(cè)集成電路芯片、多媒體技術(shù)這些圖像方面,還應(yīng)用到機(jī)器人導(dǎo)航、工業(yè)檢測(cè)和產(chǎn)品的自動(dòng)裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識(shí)別以及重建上?,F(xiàn)如今,計(jì)算機(jī)視覺(jué)已經(jīng)應(yīng)用到機(jī)器人、地理、醫(yī)學(xué)、物理、化學(xué)、天文等各大的研究領(lǐng)域。

作為多個(gè)學(xué)科交叉與融合中心的計(jì)算機(jī)視覺(jué),攝像機(jī)是其研究的重要工具,而攝像機(jī)標(biāo)定又是計(jì)算機(jī)視覺(jué)研究的一個(gè)關(guān)鍵問(wèn)題,故攝像機(jī)的標(biāo)定越來(lái)越受到廣泛的重視。攝像機(jī)標(biāo)定是通過(guò)物體空間上的點(diǎn)與圖像中的對(duì)應(yīng)點(diǎn)的幾何關(guān)系,來(lái)確定攝像機(jī)的內(nèi)外參數(shù)的過(guò)程。標(biāo)定結(jié)果是否準(zhǔn)確影響著三維測(cè)量的精度和三維重建的結(jié)果,而且實(shí)時(shí)的標(biāo)定更能滿足自動(dòng)導(dǎo)航機(jī)器視覺(jué)的需要[2]。

伴隨著應(yīng)用的發(fā)展,攝像機(jī)廣泛地被應(yīng)用于三維立體的測(cè)量、視覺(jué)檢測(cè)、運(yùn)動(dòng)檢測(cè)等領(lǐng)域。由此,對(duì)攝像機(jī)標(biāo)定的精度要求也日益增加。攝像機(jī)標(biāo)定結(jié)果的優(yōu)劣影響了計(jì)算機(jī)視覺(jué)在各領(lǐng)域的應(yīng)用。攝像機(jī)標(biāo)定的準(zhǔn)確與否,對(duì)能否提高計(jì)算機(jī)視覺(jué)在各領(lǐng)域測(cè)量的準(zhǔn)確度有重要影響[3]。因此,研究攝像機(jī)標(biāo)定方法具有重要的理論研究意義和實(shí)際應(yīng)用價(jià)值。

1.2攝像機(jī)標(biāo)定技術(shù)研究的發(fā)展及現(xiàn)狀

攝像機(jī)有一個(gè)圖像平面和提供三維空間到圖像平面轉(zhuǎn)換的鏡頭。由于鏡頭會(huì)產(chǎn)生畸變,不能把這個(gè)轉(zhuǎn)化過(guò)程簡(jiǎn)單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實(shí)數(shù)據(jù),而其精確性則依靠于建立的模型及模型參數(shù)的準(zhǔn)確性。

首先進(jìn)行攝像機(jī)標(biāo)定工作的是加拿大的Deville,他于1910年建立實(shí)驗(yàn)室,使用多個(gè)瞄準(zhǔn)儀對(duì)他的“測(cè)量攝像機(jī)”(surveying camera)進(jìn)行標(biāo)定[4]。上個(gè)世紀(jì)三十年代后期,美國(guó)標(biāo)準(zhǔn)局發(fā)明了一種精確鏡頭,用來(lái)檢測(cè)攝像機(jī),同時(shí)將它用在攝像機(jī)標(biāo)定上。四十年代后期,該項(xiàng)工作得到進(jìn)一步加深,有了更多對(duì)高精度的需求和對(duì)易操作設(shè)備的需求。1955年,Carman出版了 《棋盤(pán)平面度的干涉測(cè)量和控制》,該書(shū)引起了社會(huì)各界對(duì)攝像機(jī)標(biāo)定的關(guān)注。二戰(zhàn)時(shí)期,隨著飛機(jī)的大規(guī)模使用,航空攝影與制圖興起,為得到更加精確的測(cè)量結(jié)果,對(duì)攝像機(jī)鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術(shù)發(fā)展最為迅速的時(shí)間段。在這期間,各種鏡頭像差的表達(dá)式逐步被提出并且得到普遍認(rèn)同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻(xiàn),他們導(dǎo)出了近焦距情況下給定位置處徑向畸變表達(dá)式并證明了近焦距情況下測(cè)量出鏡頭兩個(gè)位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達(dá)式成為后來(lái)各攝像機(jī)的標(biāo)定非線性模型的基礎(chǔ)。這段時(shí)間里,研究的重點(diǎn)是如何校正鏡頭與用何種方法補(bǔ)償鏡頭像差,這些研究對(duì)促進(jìn)各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡(jiǎn)便的攝像機(jī)標(biāo)定方法,該方法介于傳統(tǒng)標(biāo)定和自標(biāo)定之間,操作方便靈活,能夠得到不錯(cuò)的精度,滿足了眾多擁有桌面視覺(jué)系統(tǒng)的用戶在攝像機(jī)標(biāo)定方面的需求。

1.3本文的主要研究?jī)?nèi)容

本文的主要研究多個(gè)攝像機(jī)的標(biāo)定問(wèn)題。標(biāo)定主要是對(duì)攝像機(jī)內(nèi)外參的測(cè)量計(jì)算,利用這些參數(shù)對(duì)多個(gè)攝像機(jī)識(shí)別的物體尺寸進(jìn)行衡量并建立起多攝像機(jī)系統(tǒng)的數(shù)字環(huán)境。

論文的內(nèi)容包括:

第一章為緒論,介紹攝像機(jī)標(biāo)定相關(guān)的研究背景、國(guó)內(nèi)外研究現(xiàn)狀。

第二章為攝像機(jī)標(biāo)定理論基礎(chǔ):主要介紹標(biāo)定的坐標(biāo)系與待標(biāo)定的參數(shù)。

第三章提出本文的多攝像機(jī)標(biāo)定方法與實(shí)驗(yàn)過(guò)程。

第四章進(jìn)行全文的總結(jié)。

二、攝像機(jī)標(biāo)定方法研究

2.1攝像機(jī)標(biāo)定原理

攝像機(jī)通過(guò)透鏡將三維物體投影到--維圖像平面上,這個(gè)成像變換的過(guò)程稱(chēng)為攝像機(jī)成像模型。攝像機(jī)成像模型有多種,最常用的為小孔成像模型。由于實(shí)際的攝像機(jī)鏡頭會(huì)發(fā)生一定的畸變,使得空間點(diǎn)所成的像不在線性模型描述的位置而會(huì)發(fā)生一定的偏移,為了能準(zhǔn)確的標(biāo)定攝像機(jī)參數(shù),標(biāo)定的過(guò)程中要考慮非線性畸變因子。

一般來(lái)說(shuō),得到標(biāo)定結(jié)果后要對(duì)其精度進(jìn)行評(píng)估,然而很難得到準(zhǔn)確的攝像機(jī)標(biāo)定參數(shù)真值作為參考,其中基于圖像坐標(biāo)和世界坐標(biāo)的絕對(duì)和相對(duì)誤差的評(píng)價(jià)方法應(yīng)用廣泛,本文將對(duì)這些方法的原理進(jìn)行探討。

2.2攝像機(jī)標(biāo)定坐標(biāo)系建立

首先定義了四個(gè)坐標(biāo)系,如圖1所示,圖像坐標(biāo)系的坐標(biāo)原點(diǎn)為O0,列與行由坐標(biāo)軸u和v表示;成像平面坐標(biāo)系的原點(diǎn)是攝像機(jī)光軸與圖像坐標(biāo)系的交點(diǎn)0l,x、y 軸分別與u、v 軸平行;在攝像機(jī)坐標(biāo)系中,坐標(biāo)原點(diǎn)0c即為在攝像機(jī)的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機(jī)光軸作為Zc軸,0c0l為攝像機(jī)焦距f;世界坐標(biāo)系是假想的參考坐標(biāo)系,可固定于場(chǎng)景中某物體上,用于描述攝像機(jī)的位置,由Xw,Yw,Zw軸組成。

圖(1)

2.3攝像機(jī)外部參數(shù)構(gòu)成

主動(dòng)視覺(jué)傳感器從在笛卡爾直角坐標(biāo)系中的運(yùn)動(dòng)表現(xiàn)為相應(yīng)的旋轉(zhuǎn)矩陣和平移矩陣,故攝像機(jī)外部參數(shù)表現(xiàn)為旋轉(zhuǎn)矩陣R和平移矩陣T,則攝像機(jī)坐標(biāo)系與世界坐標(biāo)系的轉(zhuǎn)化關(guān)系可以表示成:

上式中(Xc,Yc,Zc)表示空間點(diǎn)在攝像機(jī)坐標(biāo)系下的坐標(biāo),(Xw,Yw,Zw)表示空間點(diǎn)在世界坐標(biāo)系下的坐標(biāo)。根據(jù)靶標(biāo)點(diǎn)在像空間坐標(biāo)系和物方空間坐標(biāo)系中的坐標(biāo),通過(guò)分解旋轉(zhuǎn)矩陣線性計(jì)算像空間坐標(biāo)系與物方空間坐標(biāo)之間的轉(zhuǎn)換參數(shù),即外方位元素(攝站參數(shù))[6]。

2.4各攝像機(jī)相對(duì)位置確定

三目攝像機(jī)擁有三個(gè)視覺(jué)傳感器,而三個(gè)傳感器之間的相對(duì)位置可通過(guò)已獲得的外部參數(shù)進(jìn)行確定。將三個(gè)攝像機(jī)坐標(biāo)系設(shè)置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內(nèi)容可知,這三個(gè)攝像機(jī)坐標(biāo)系與世界坐標(biāo)系的關(guān)系為:

i=(1,2,3)

由此我們可以得到任意兩個(gè)攝像機(jī)i,j的坐標(biāo)系轉(zhuǎn)換關(guān)系:

其中: = = i,j=1,2,3

三、攝像機(jī)標(biāo)定實(shí)驗(yàn)過(guò)程及結(jié)果

3.1實(shí)驗(yàn)系統(tǒng)介紹

實(shí)驗(yàn)中被用來(lái)標(biāo)定的是一個(gè)多攝像機(jī)系統(tǒng),攝像機(jī)標(biāo)定有關(guān)的基本參數(shù)、系統(tǒng)組成和開(kāi)發(fā)環(huán)境如下:

(1)硬件環(huán)境

標(biāo)定板、三目攝像機(jī)和圖像采集卡等。

(2)軟件環(huán)境

OpenCV開(kāi)源視覺(jué)庫(kù),它僅由一系列C函數(shù)和少量C++類(lèi)構(gòu)成,為Python、MATLAB等語(yǔ)言提供了接口,在圖像處理和計(jì)算機(jī)視覺(jué)方面實(shí)現(xiàn)了很多通用算法。

3.2實(shí)驗(yàn)過(guò)程

本系統(tǒng)以棋盤(pán)格模板作為標(biāo)定模板。采用激光打印機(jī)打印棋盤(pán)格黑白方塊間隔紙,方塊邊長(zhǎng)為3cm,共6行9列,將打印紙固定在一塊平板上,作為標(biāo)定模板,如圖(2)。安裝三目攝像機(jī)系統(tǒng),調(diào)節(jié)固定好個(gè)攝像機(jī)位置,如圖(3)。手持標(biāo)定板在三目攝像機(jī)前方各個(gè)位置拍攝5組共15張各姿態(tài)的照片,利用Canny算子進(jìn)行像點(diǎn)灰度中心提取、同名像點(diǎn)匹配并解算出三個(gè)攝像機(jī)在標(biāo)定板坐標(biāo)系中的外部參數(shù)值。

3.3標(biāo)定結(jié)果

攝像機(jī)1:

R= T=

攝像機(jī)2:

R= T=

攝像機(jī)3:

R= T=

四、總結(jié)

隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,計(jì)算機(jī)視覺(jué)成為當(dāng)今熱門(mén)的研究課題,受到了廣泛關(guān)注。本文就如何在機(jī)器視覺(jué)的理論基礎(chǔ)上對(duì)三目視覺(jué)系統(tǒng)進(jìn)行標(biāo)定進(jìn)行了研究,討論了計(jì)算機(jī)視覺(jué)理論知識(shí),分析攝像機(jī)標(biāo)定原理以及標(biāo)定坐標(biāo)系的建立。同時(shí)通過(guò)計(jì)算機(jī)視覺(jué)知識(shí)的分析討論了基于三目視覺(jué)系統(tǒng)的攝像機(jī)標(biāo)定技術(shù),完成了三目視覺(jué)系統(tǒng)的外部參數(shù)標(biāo)定實(shí)驗(yàn)。三目攝像機(jī)測(cè)量系統(tǒng)外部參數(shù)的標(biāo)定能夠解決測(cè)量作業(yè)現(xiàn)場(chǎng)、測(cè)量控制場(chǎng)建立難的問(wèn)題,為快速地建立簡(jiǎn)單實(shí)用的控制場(chǎng)提供了方案,有一定的實(shí)用價(jià)值。

參考文獻(xiàn)

[1] 荊麗秋.雙目視覺(jué)系統(tǒng)標(biāo)定與匹配的研究與實(shí)現(xiàn)[D].哈爾濱工程大學(xué),2009.DOI:10.7666/d.y1489086.

[2] 馬頌德.計(jì)算機(jī)視覺(jué)―計(jì)算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,1998.

[3] 王榮一.攝像機(jī)標(biāo)定及關(guān)鍵技術(shù)研究[D].哈爾濱理工大學(xué),2011.DOI:10.7666/d.y2012483.

[4] Clarke T A,F(xiàn)ryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66

[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.

[6] 范亞兵,黃桂平,高寶華等.三目立體工業(yè)攝影測(cè)量系統(tǒng)外部參數(shù)的快速標(biāo)定[J].測(cè)繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013

第8篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

關(guān)鍵詞 模式分析 計(jì)算機(jī)視覺(jué) 教學(xué)改革

中圖分類(lèi)號(hào):G643.2 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/ki.kjdkz.2016.03.015

Research and Practice on Course Group of Pattern Analysis and

Visual Processing for Graduated Students

SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi

(College of Computer Science and Technology, Nanjing University of

Aeronautics and Astronautics, Nanjing, Jiangsu 210016)

Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.

Key words pattern analysis; computer vision; teaching reform

1 背景

我校模式分析與智能計(jì)算研究所師資團(tuán)隊(duì)是江蘇省“青藍(lán)工程”創(chuàng)新團(tuán)隊(duì),主要研究領(lǐng)域包括智能數(shù)據(jù)分析、圖像處理和機(jī)器視覺(jué)等方向,承擔(dān)研究生和本科生的模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、智能信息檢索、數(shù)字圖像處理、計(jì)算機(jī)視覺(jué)等課程的教學(xué)任務(wù)。以往的教學(xué)過(guò)程中雖然積累了豐富的教學(xué)經(jīng)驗(yàn),但當(dāng)前新知識(shí)不斷涌現(xiàn)、新技術(shù)發(fā)展迅猛,對(duì)模式分析與視覺(jué)處理課程群的知識(shí)體系、實(shí)踐體系改進(jìn)提出了新的挑戰(zhàn)。

近年來(lái),國(guó)內(nèi)外高校在該類(lèi)課程教學(xué)上,已涌現(xiàn)出眾多新理念、新方法。Coursera聯(lián)合創(chuàng)始人Andrew Ng推出的機(jī)器學(xué)習(xí)課程,開(kāi)啟了教育領(lǐng)域的MOOC時(shí)代,引領(lǐng)了教育教學(xué)方法的新革命。①深圳大學(xué)、②江蘇科技大學(xué)③分別進(jìn)行了基于CDIO工程教育理念的計(jì)算機(jī)視覺(jué)課程教學(xué)改革實(shí)踐,實(shí)現(xiàn)多層次項(xiàng)目設(shè)計(jì)的教學(xué)模式改革,講座式、討論式、實(shí)踐式教學(xué)方法的探索。國(guó)防科技大學(xué)④在計(jì)算機(jī)視覺(jué)課程中引入研討式教學(xué)模式,通過(guò)案例教學(xué)、小組研討的方式來(lái)替代傳統(tǒng)的教學(xué)方式。華中科技大學(xué)⑤從教學(xué)內(nèi)容國(guó)際化、教學(xué)方式國(guó)際化、教學(xué)成果國(guó)際化三個(gè)方面開(kāi)展了計(jì)算機(jī)視覺(jué)課程的國(guó)際化建設(shè)。另外,也有高校進(jìn)行了圖像工程課程群建設(shè),⑥基于圖像分析與計(jì)算機(jī)視覺(jué)應(yīng)用課程結(jié)合的項(xiàng)目協(xié)同創(chuàng)新能力培養(yǎng)實(shí)踐。⑦

在分析上述國(guó)內(nèi)外高校該類(lèi)課程改革的基礎(chǔ)上,我們重點(diǎn)以模式分析與視覺(jué)處理課程群的實(shí)踐教學(xué)體系改革為切入點(diǎn),優(yōu)化師資隊(duì)伍結(jié)構(gòu),梳理課程群知識(shí)體系,優(yōu)化課程授課模式,完善課程群實(shí)踐體系,改革實(shí)踐考核模式,實(shí)現(xiàn)學(xué)生國(guó)際化視野、理論聯(lián)系實(shí)際、工程實(shí)踐和創(chuàng)新能力全面提升的目標(biāo)。

2 模式分析與視覺(jué)處理課程群特點(diǎn)

模式分析與視覺(jué)處理課程群涵蓋了模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、數(shù)字圖像處理、計(jì)算機(jī)視覺(jué)等多門(mén)課程。該類(lèi)課程存在以下特點(diǎn)。

(1)該類(lèi)課程屬于多學(xué)科交叉,涉及的知識(shí)面既廣又深。由于該方向涉及計(jì)算機(jī)科學(xué)與技術(shù)、應(yīng)用數(shù)學(xué)、自動(dòng)化、電子科學(xué)與技術(shù)、信息工程等多學(xué)科內(nèi)容,而學(xué)生在大學(xué)本科階段很難學(xué)習(xí)和了解如此多的知識(shí)模塊,這對(duì)研究生階段學(xué)習(xí)來(lái)說(shuō),具有相當(dāng)大的挑戰(zhàn)。同時(shí),對(duì)于每個(gè)知識(shí)模塊,所要求的數(shù)學(xué)基礎(chǔ)較高,理論具有相當(dāng)?shù)纳疃?,理解和掌握不容易?/p>

(2)該類(lèi)課程既重視扎實(shí)的基礎(chǔ)理論,也強(qiáng)調(diào)良好的工程實(shí)踐能力。該類(lèi)課程的基礎(chǔ)理論教學(xué)一直受到各高校的重視。隨著近年來(lái)產(chǎn)業(yè)界的迅猛發(fā)展,計(jì)算機(jī)視覺(jué)應(yīng)用層出不窮,對(duì)學(xué)生的工程實(shí)踐也提出了更高要求,需要能夠在系統(tǒng)層次上有整體認(rèn)知,同時(shí)要能對(duì)各功能模塊進(jìn)行優(yōu)化,提升系統(tǒng)的整體性能。

(3)該類(lèi)課程所面向的選修學(xué)生面廣。該類(lèi)課程既是多學(xué)科交叉,也面向計(jì)算機(jī)應(yīng)用、電子科學(xué)與技術(shù)、自動(dòng)化、應(yīng)用數(shù)學(xué)等不同研究方向、不同水平層次的研究生開(kāi)設(shè)。這對(duì)課堂教學(xué)和實(shí)驗(yàn)實(shí)踐也帶來(lái)更大挑戰(zhàn)。

3 模式分析與視覺(jué)處理課程群改革舉措

針對(duì)上述分析的課程群特點(diǎn),我們重點(diǎn)以實(shí)踐體系改革為突破口,通過(guò)優(yōu)化師資隊(duì)伍結(jié)構(gòu),梳理課程群知識(shí)體系,優(yōu)化課程授課模式,完善課程群實(shí)踐體系,改革實(shí)踐考核模式等舉措,實(shí)現(xiàn)學(xué)生國(guó)際化視野、理論聯(lián)系實(shí)際、工程實(shí)踐和創(chuàng)新能力全面提升的目標(biāo)。

3.1 師資隊(duì)伍結(jié)構(gòu)優(yōu)化

為了學(xué)生能夠適應(yīng)模式分析與視覺(jué)處理產(chǎn)業(yè)的快速發(fā)展,在課程群建設(shè)過(guò)程中更強(qiáng)調(diào)學(xué)生的工程實(shí)踐和創(chuàng)新能力培養(yǎng)。這首先對(duì)師資隊(duì)伍結(jié)構(gòu)提出了新的要求。

近年來(lái),課程教學(xué)團(tuán)隊(duì)引進(jìn)海內(nèi)外具有深厚理論功底和較強(qiáng)工程能力的高水平師資4名,大大充實(shí)了機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、圖像處理等課程的教學(xué)力量。對(duì)于現(xiàn)有教師隊(duì)伍,鼓勵(lì)教師跟產(chǎn)業(yè)一線企業(yè)廣泛合作,目前已與華為、中興等企業(yè)在視頻檢索、智能交通視覺(jué)處理等方面開(kāi)展了實(shí)質(zhì)合作。這些來(lái)源于產(chǎn)業(yè)界的高質(zhì)量課題對(duì)科研和教學(xué)起到了良好的促進(jìn)作用。

與此同時(shí),通過(guò)研究生工作站、企業(yè)短期實(shí)習(xí)等渠道,鼓勵(lì)企業(yè)高級(jí)研發(fā)人員參與到學(xué)生實(shí)踐能力培養(yǎng)環(huán)節(jié)中,將實(shí)際項(xiàng)目進(jìn)行適當(dāng)切分或提煉,實(shí)現(xiàn)該類(lèi)課程實(shí)踐環(huán)節(jié)的模塊化、專(zhuān)題化訓(xùn)練。

綜上,通過(guò)引培并舉,優(yōu)化校內(nèi)師資隊(duì)伍結(jié)構(gòu);通過(guò)校企合作,積極吸引企業(yè)師資參與。良好的師資隊(duì)伍為該類(lèi)課程的實(shí)踐體系改革提供了有力支撐。

3.2 課程群知識(shí)體系梳理與授課模式改革

模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、智能信息檢索、數(shù)字圖像處理、計(jì)算機(jī)視覺(jué)等課程既有一定的邏輯關(guān)系,也存在相互交叉的混雜關(guān)系。一般認(rèn)為,模式識(shí)別、機(jī)器學(xué)習(xí)是模式分析與視覺(jué)處理領(lǐng)域的基礎(chǔ)理論課程,數(shù)據(jù)挖掘是建立在模式識(shí)別、機(jī)器學(xué)習(xí)和數(shù)據(jù)庫(kù)基礎(chǔ)上的應(yīng)用類(lèi)課程,智能信息檢索則是數(shù)據(jù)挖掘基礎(chǔ)上更為具體的應(yīng)用實(shí)現(xiàn)。數(shù)字圖像處理為計(jì)算機(jī)視覺(jué)課程提供了基礎(chǔ)支撐,計(jì)算機(jī)視覺(jué)則是在綜合利用模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)字圖像處理、數(shù)據(jù)挖掘等知識(shí)模塊基礎(chǔ)上面向應(yīng)用的系統(tǒng)實(shí)現(xiàn)。但是,這些課程也存在著知識(shí)點(diǎn)的交叉或重復(fù)。例如,模式識(shí)別和機(jī)器學(xué)習(xí)中都有貝葉斯參數(shù)估計(jì)、支持向量機(jī)模型等知識(shí)點(diǎn),但視角和側(cè)重點(diǎn)有所不同;圖像處理、計(jì)算機(jī)視覺(jué)中都有顏色模型、成像模型等知識(shí)點(diǎn),也同時(shí)存在與模式識(shí)別、機(jī)器學(xué)習(xí)交叉的知識(shí)點(diǎn)。

我們針對(duì)來(lái)自不同研究領(lǐng)域的學(xué)生群體,對(duì)該課程群的知識(shí)點(diǎn)進(jìn)行系統(tǒng)梳理,既避免知識(shí)點(diǎn)的重復(fù)講授,也防止重要知識(shí)點(diǎn)的缺漏。課程教師集體討論,形成每門(mén)課程的核心知識(shí)集,和針對(duì)不同研究領(lǐng)域的選講知識(shí)集。學(xué)生在學(xué)習(xí)課程時(shí),在掌握核心知識(shí)集的基礎(chǔ)上,結(jié)合自己的研究方向選擇相關(guān)的選講知識(shí)集學(xué)習(xí)。

在課程教材和參考書(shū)的選擇上,注重挑選國(guó)際上有影響力的教材。例如,模式識(shí)別的參考書(shū)為Richard O. Duda等人編著的Pattern Classification;機(jī)器學(xué)習(xí)的參考書(shū)為T(mén)om M. Mitchell編著的Machine Learning和Christopher M. Bishop編著的Pattern Recognition and Machine Learning;數(shù)據(jù)挖掘的參考書(shū)為Jiawei Han等人編著的Data Mining:Concepts and Techniques;數(shù)字圖像處理的參考書(shū)為K. R. Castleman編著的Digital Image Processing;計(jì)算機(jī)視覺(jué)的參考書(shū)為D. A. Foryth編著的Computer Vision: A Modern Approach和Richard Szeliski編著的Computer Vision: Alogrithms and Applications。這些教材已被國(guó)內(nèi)外著名大學(xué)普遍采用。同時(shí),每門(mén)課程都提供相關(guān)的國(guó)內(nèi)外頂級(jí)會(huì)議和期刊的列表,供學(xué)生課后追蹤研究領(lǐng)域的熱點(diǎn)問(wèn)題。

在課堂授課環(huán)節(jié)上,注意采用靈活多樣的授課方式。對(duì)于核心基礎(chǔ)知識(shí)模塊,以教師講授為主,同時(shí)提供國(guó)內(nèi)外該類(lèi)課程的熱門(mén)MOOC網(wǎng)址給學(xué)生參考。對(duì)于選講知識(shí)模塊,鼓勵(lì)學(xué)生事先結(jié)合各自研究方向有目的自學(xué),在學(xué)生報(bào)告的基礎(chǔ)上進(jìn)行課堂討論方式進(jìn)行。充分發(fā)揮學(xué)生學(xué)習(xí)的主體作用,也便于教師了解學(xué)生的水平和學(xué)習(xí)狀況。

除此以外,不定期邀請(qǐng)國(guó)內(nèi)外著名學(xué)者來(lái)校做學(xué)術(shù)報(bào)告,讓學(xué)生充分了解該研究領(lǐng)域的最新前沿動(dòng)態(tài),并就熱點(diǎn)問(wèn)題進(jìn)行專(zhuān)題討論。

3.3 課程群實(shí)踐體系完善與考核方式改革

工程實(shí)踐和創(chuàng)新能力的培養(yǎng)是該課程群改革的重要目標(biāo)。我們?cè)谏鲜鰩熧Y隊(duì)伍結(jié)構(gòu)優(yōu)化、課程群知識(shí)體系梳理與授課模式改革的基礎(chǔ)上,著力進(jìn)行課程群實(shí)踐體系的改革與完善。我們通過(guò)多層次菜單式的實(shí)驗(yàn)項(xiàng)目選擇、項(xiàng)目牽引的創(chuàng)新能力訓(xùn)練、學(xué)生綜合研究能力的全面考查等方面來(lái)實(shí)現(xiàn)。

首先,整合和優(yōu)化課程群實(shí)踐內(nèi)容,實(shí)現(xiàn)多層次菜單式靈活選擇。根據(jù)各研究領(lǐng)域的要求進(jìn)行靈活搭配,根據(jù)學(xué)生個(gè)體的能力與水平選擇適當(dāng)規(guī)模和難度的實(shí)踐內(nèi)容,通過(guò)課程內(nèi)的基礎(chǔ)實(shí)驗(yàn)、課程間的綜合實(shí)驗(yàn)、課程群的創(chuàng)新實(shí)驗(yàn)來(lái)選擇和組合,如圖1所示。

圖1 多層次菜單式實(shí)驗(yàn)內(nèi)容示意圖

基礎(chǔ)型實(shí)驗(yàn)內(nèi)容主要是各課程核心知識(shí)點(diǎn)的實(shí)驗(yàn)驗(yàn)證,主要包括模式識(shí)別,機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,圖像處理與分析,計(jì)算機(jī)視覺(jué)等課程的實(shí)驗(yàn)。要求選課學(xué)生對(duì)這些基礎(chǔ)實(shí)驗(yàn)必做,打下良好的研究基礎(chǔ)。

綜合探索型實(shí)驗(yàn)在基礎(chǔ)型實(shí)驗(yàn)基礎(chǔ)上,既有單門(mén)課程內(nèi)總的綜合實(shí)驗(yàn),也有課程間知識(shí)的綜合應(yīng)用。主要分為兩大塊,包括模式分析與機(jī)器學(xué)習(xí)方向的綜合實(shí)驗(yàn),以及圖像處理與機(jī)器視覺(jué)方向的綜合實(shí)驗(yàn)。實(shí)驗(yàn)?zāi)康闹饕轻槍?duì)這兩大塊方向重點(diǎn)知識(shí)的綜合分析和比較,能夠熟練掌握和靈活應(yīng)用。例如模式分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等方向都用到的線性判別分析、支持向量機(jī)、均值聚類(lèi)等內(nèi)容;圖像處理與機(jī)器視覺(jué)中的圖像特征抽取、視覺(jué)系統(tǒng)選型、目標(biāo)檢測(cè)、特定平臺(tái)的算法優(yōu)化等內(nèi)容。學(xué)生可根據(jù)各自研究方向有目的的選擇兩塊綜合實(shí)驗(yàn)的大部分內(nèi)容。

在綜合型實(shí)驗(yàn)基礎(chǔ)上,該課程群通過(guò)若干創(chuàng)新型實(shí)驗(yàn)來(lái)檢驗(yàn)學(xué)生理論知識(shí)掌握程度和實(shí)踐方法應(yīng)用能力,為后續(xù)的研究課題開(kāi)展打下良好的科研素養(yǎng)。主要內(nèi)容包括人臉識(shí)別、二維條碼識(shí)別、車(chē)輛屬性識(shí)別、智能視覺(jué)監(jiān)控、以及企業(yè)來(lái)源的關(guān)鍵技術(shù)等。這些項(xiàng)目實(shí)踐既涉及用到圖像處理與機(jī)器視覺(jué)的內(nèi)容,也涉及模式分析與機(jī)器學(xué)習(xí)方向的知識(shí)。并且需要學(xué)生在綜合運(yùn)用相關(guān)知識(shí)的基礎(chǔ)上有創(chuàng)新能力。

其次,重視各類(lèi)項(xiàng)目牽引的創(chuàng)新能力訓(xùn)練。一方面,鼓勵(lì)教師從國(guó)家自然科學(xué)基金、企業(yè)合作項(xiàng)目等研究中提煉出問(wèn)題規(guī)模和難度適中的訓(xùn)練項(xiàng)目,作為課程群的綜合能力訓(xùn)練項(xiàng)目。另一方面,鼓勵(lì)學(xué)生參加挑戰(zhàn)杯、全國(guó)研究生智慧城市技術(shù)與創(chuàng)意設(shè)計(jì)大賽等各類(lèi)具有挑戰(zhàn)性的競(jìng)賽項(xiàng)目,以賽代練,提升學(xué)生的工程實(shí)踐和創(chuàng)新能力。同時(shí),也鼓勵(lì)學(xué)生利用百度、微軟等相關(guān)研究領(lǐng)域的企業(yè)實(shí)習(xí)機(jī)會(huì),參與產(chǎn)品一線的工程實(shí)踐能力訓(xùn)練。

再次,注重考核環(huán)節(jié),實(shí)現(xiàn)科研素養(yǎng)和實(shí)踐能力的全面考查。只有嚴(yán)格、公平、公正的考核,才能保證實(shí)驗(yàn)實(shí)踐的質(zhì)量和水平,才能提升學(xué)生的科研素養(yǎng)和實(shí)踐能力。我們主要在手段、方式方法上進(jìn)行了改進(jìn)。在題目選擇上,根據(jù)學(xué)生個(gè)體水平和研究領(lǐng)域要求的差異,在選題上有適當(dāng)?shù)碾y易區(qū)分度,讓每位學(xué)生都有鍛煉和提升的機(jī)會(huì);在考核方式上,采用結(jié)題書(shū)面報(bào)告來(lái)檢驗(yàn)學(xué)術(shù)論文的寫(xiě)作能力,采用程序演示檢驗(yàn)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)水平,采用上臺(tái)匯報(bào)的方式檢驗(yàn)學(xué)生的表達(dá)能力,多管齊下全面檢查學(xué)生的綜合科研素養(yǎng);在考核成績(jī)?cè)u(píng)定上,采用現(xiàn)場(chǎng)教師和學(xué)生共同評(píng)分的方式,公平合理;最后,通過(guò)網(wǎng)站展示、發(fā)表學(xué)術(shù)小論文、專(zhuān)利、軟件著作權(quán)等方式展示和公開(kāi)優(yōu)秀成果,激發(fā)學(xué)生的學(xué)習(xí)熱情,并由此形成積累,有利于學(xué)生實(shí)驗(yàn)實(shí)踐氛圍的傳承。

4 結(jié)語(yǔ)

本文在分析國(guó)內(nèi)外高校模式分析與視覺(jué)處理類(lèi)課程群改革現(xiàn)狀的基礎(chǔ)上,以學(xué)生國(guó)際化視野、理論聯(lián)系實(shí)際、工程實(shí)踐和創(chuàng)新能力全面提升為目標(biāo),重點(diǎn)開(kāi)展了師資隊(duì)伍結(jié)構(gòu)優(yōu)化、課程群知識(shí)體系梳理、課程授課模式改革、課程群實(shí)踐體系完善和實(shí)踐考核模式改革等工作,取得了良好的效果,并為校內(nèi)其他課程群的教學(xué)改革作為示范推廣。

注釋

① https:///learn/machine-learning/

② 郭小勤,曹廣忠.計(jì)算機(jī)視覺(jué)課程的CDIO教學(xué)改革實(shí)踐.理工高教研究,2010.29(5):98-100,148.

③ 史金龍,白素琴,龐林斌,錢(qián)強(qiáng).研究生機(jī)器視覺(jué)課程的CDIO教學(xué)改革實(shí)踐.計(jì)算機(jī)教育,2013.9:40-43.

④ 陳芳林,劉亞?wèn)|,沈輝.在《計(jì)算機(jī)視覺(jué)》課程中引入研討式教學(xué)模式.當(dāng)代教育理論與實(shí)踐,2013.5(7):112-114.

⑤ 王岳環(huán),桑農(nóng),高常鑫.計(jì)算機(jī)視覺(jué)課程的國(guó)際化教學(xué)模式.計(jì)算機(jī)教育,2014.19:101-103.

第9篇:計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用范文

生活中,每個(gè)人都問(wèn)過(guò)別人“這件衣服是從哪買(mǎi)的?”“這雙鞋是什么牌子的?”這一問(wèn)題很快會(huì)被AI技術(shù)解決,只需要拿出手機(jī)對(duì)著物品拍照,就會(huì)得到商品的各種信息,并且能一鍵買(mǎi)買(mǎi)買(mǎi)。這就是美國(guó)著名圖片社交網(wǎng)站Pinterest(拼趣)即將推出的應(yīng)用圖片識(shí)別購(gòu)買(mǎi)業(yè)務(wù)。

Pinterest總裁Tim Kendall表示,“Pinterest可以即刻在存儲(chǔ)750多億張圖片的巨大網(wǎng)絡(luò)空間內(nèi)進(jìn)行搜索,從而為用戶找到與所拍攝照片相似的配對(duì)圖片,以及查找到哪些地方能夠買(mǎi)到他們所需的商品?!?/p>

目前,Pinterest的估值已經(jīng)達(dá)到了110億美元,該公司的專(zhuān)注點(diǎn)正在向營(yíng)收增長(zhǎng)和創(chuàng)收方面轉(zhuǎn)變。相比Facebook、Twiter等社交網(wǎng)站,Pinterest已經(jīng)率先找到了一條清晰的創(chuàng)收道路。

從興趣到產(chǎn)品

亞里士多德曾經(jīng)說(shuō)過(guò),古往今來(lái)人們開(kāi)始探索,都應(yīng)起源于對(duì)自然萬(wàn)物的驚異??萍嫉倪M(jìn)步也是如此,就像微軟研發(fā)主管和項(xiàng)目負(fù)責(zé)人Mitch Goldberg所說(shuō):“我們想通過(guò)該應(yīng)用向人們展示識(shí)別技術(shù)的無(wú)限魅力?!?/p>

今年2月,微軟旗下的Garage實(shí)驗(yàn)室了一款名為“Fetch!”的應(yīng)用,它可通過(guò)機(jī)器學(xué)習(xí)系統(tǒng)識(shí)別照片中寵物狗的品種并用文字對(duì)該品種進(jìn)行簡(jiǎn)單的介紹。

隨著計(jì)算機(jī)視覺(jué)領(lǐng)域開(kāi)始利用深層神經(jīng)網(wǎng)絡(luò)這種模仿人類(lèi)大腦生物過(guò)程的系統(tǒng)來(lái)從事機(jī)器學(xué)習(xí),識(shí)別的精確度實(shí)現(xiàn)了巨大飛躍。也就是說(shuō)通過(guò)機(jī)器學(xué)習(xí)技術(shù),F(xiàn)etch!識(shí)別的準(zhǔn)確度會(huì)越來(lái)越高,隨著大量圖片的涌入,F(xiàn)etch! 可以自我修復(fù)錯(cuò)誤,從而更加精確地識(shí)別每一只狗的樣貌、形態(tài)、動(dòng)作。除了測(cè)試狗類(lèi)品種以外,你還可以把朋友的照片上傳至平臺(tái),看看他們能夠?qū)?yīng)出哪種寵物。

微軟的這款產(chǎn)品基于目前最為熱門(mén)的一種圖像識(shí)別技術(shù)――“深度神經(jīng)網(wǎng)絡(luò)”,同樣基于這種技術(shù),微軟還有另一款有趣的產(chǎn)品:。去年5月,有超過(guò)5.75億圖片被提交到,超過(guò)8500萬(wàn)來(lái)自世界各地的使用者訪問(wèn)了這個(gè)網(wǎng)站,只為尋找一個(gè)簡(jiǎn)單問(wèn)題的答案――顏齡機(jī)器人認(rèn)為我看起來(lái)像幾歲?如果是合照,并且顏齡機(jī)器人識(shí)別出的自己比周?chē)四挲g小,則更能引發(fā)用戶的興趣,這種“損人利己”的識(shí)別應(yīng)用著實(shí)在社交媒體上火了一把。

另一讓計(jì)算機(jī)視覺(jué)研究技術(shù)人員特別感興趣的領(lǐng)域是生物識(shí)別,當(dāng)下最為火爆的莫過(guò)于人臉識(shí)別技術(shù)了。早期的人臉識(shí)別技術(shù)多為安防領(lǐng)域,如海關(guān)識(shí)別走私犯、商店識(shí)別小偷等。近年來(lái),深度學(xué)習(xí)的研究與應(yīng)用使得人臉識(shí)別和人工智能的核心技術(shù)得到了極大的提升,攝像頭等圖像硬件的發(fā)展為人臉識(shí)別提供了很好的圖像基礎(chǔ),如今人臉識(shí)別技術(shù)應(yīng)用更加廣泛,比如公司可以使用刷臉打卡來(lái)杜絕代人打卡簽到現(xiàn)象。

其實(shí)早在2012年,谷歌就開(kāi)發(fā)出了安卓系統(tǒng)的“刷臉解鎖”技術(shù),但因安全問(wèn)題未解決,該技術(shù)一直未能得到普及。

而今年3月,電商巨頭亞馬遜提交了一項(xiàng)針購(gòu)物付費(fèi)的專(zhuān)利技術(shù),即消費(fèi)者在亞馬遜網(wǎng)站購(gòu)物時(shí)可以通過(guò)自拍或者視頻來(lái)進(jìn)行付費(fèi),無(wú)須再輸入賬號(hào)密碼。在消費(fèi)時(shí)系統(tǒng)會(huì)提示用戶表現(xiàn)出特定的行為、情緒或手勢(shì)來(lái)證明消費(fèi)者就是本人,而不是拿著照片的冒名頂替者。

亞馬遜表示,這項(xiàng)技術(shù)能使消費(fèi)者更加安全地進(jìn)行網(wǎng)上購(gòu)物,因?yàn)楹芏嘤脩魹榱耸∈聲?huì)把所有賬戶都用同一個(gè)密碼,或者把密碼記在手機(jī)里,一旦遭遇“撞庫(kù)”或者手機(jī)被盜,后果不堪設(shè)想,而刷臉技術(shù)則沒(méi)有這個(gè)風(fēng)險(xiǎn)。

除了識(shí)別人臉,在識(shí)別其他生物方面也有了突破性進(jìn)展,比如識(shí)別寄生蟲(chóng)。瘧疾,是一種由瘧原蟲(chóng)造成的全球性急性寄生蟲(chóng)傳染病,據(jù)統(tǒng)計(jì),2015年有大約有2.14億人受瘧疾的影響。

一直以來(lái),醫(yī)療工作者是通過(guò)肉眼觀察采樣玻片來(lái)確定采樣對(duì)象是否被瘧原蟲(chóng)感染,這不但是對(duì)醫(yī)療工作者經(jīng)驗(yàn)的考驗(yàn),而且工作效率也十分低下,而貧困地區(qū)一直都缺乏有經(jīng)驗(yàn)的醫(yī)療工作者。

今年2月,根據(jù)MIT Technology Review報(bào)道,Intellectual Ventures Laboratory(智能事業(yè)實(shí)驗(yàn)室)開(kāi)發(fā)出了能夠檢測(cè)和評(píng)估瘧疾感染的便攜式顯微鏡。這種顯微鏡采用的是一個(gè)名為“Autoscope”的系統(tǒng),通過(guò)計(jì)算機(jī)視覺(jué)和深度神經(jīng)網(wǎng)絡(luò)技術(shù),采用深度學(xué)習(xí)算法來(lái)鑒別瘧原蟲(chóng)。這款便攜式顯微鏡今年在泰國(guó)實(shí)地測(cè)試,成功鑒別出了 170塊玻片中的瘧原蟲(chóng)如果這項(xiàng)技術(shù)得到普及之后,只要診所有一臺(tái)Autoscope顯微鏡和一些載玻片,就可解決瘧疾的診斷問(wèn)題,這將使瘧疾診斷不再依賴于有限的專(zhuān)業(yè)醫(yī)療人員。

技術(shù)轉(zhuǎn)化為產(chǎn)品

新技術(shù)的出現(xiàn),讓計(jì)算機(jī)不但“看見(jiàn)”這個(gè)世界,更能“看懂”這個(gè)世界,可以代替人眼甚至超越人眼。

人的視野是有限的,并且會(huì)受到周邊條件的影響,駕駛員在開(kāi)車(chē)時(shí)會(huì)有視野盲區(qū),還會(huì)受到光線的影響,并且大霧、暴雨等極端天氣也會(huì)嚴(yán)重影響駕駛員的視線。而計(jì)算機(jī)視覺(jué)技術(shù)就不一樣了,視野會(huì)更開(kāi)闊,受限制更小。根據(jù)汽車(chē)媒體《Leftlane》報(bào)道,福特公司最新的無(wú)人駕駛汽車(chē)研究計(jì)劃是由激光感應(yīng)(LiDAR)和雷達(dá)、攝像頭形成一張周?chē)h(huán)境的高清3D地圖,不但讓無(wú)人駕駛汽車(chē)看到攝像頭視野范圍之外的物體,而且并不受光線限制。在夜間試駕后,福特工程師Wayne Williams說(shuō):“坐在汽車(chē)?yán)铮夷芨械剿谧?,但是我往?chē)外看,只能看到一片漆黑。結(jié)果令人驚喜,車(chē)輛準(zhǔn)確地沿著蜿蜒的道路行駛。”

識(shí)別場(chǎng)景這一領(lǐng)域技術(shù)的發(fā)展,使得計(jì)算機(jī)不但能當(dāng)機(jī)器的眼睛,還能變成人類(lèi)的眼睛。

對(duì)于雙目失明的人來(lái)說(shuō),能親自感知這個(gè)世界是夢(mèng)寐以求的事,而微軟2016 Build開(kāi)發(fā)者大會(huì)上Seeing AI項(xiàng)目正是要幫助盲人實(shí)現(xiàn)這一愿望。

Seeing AI項(xiàng)目是通過(guò)計(jì)算機(jī)視覺(jué)和自然語(yǔ)言去形容一個(gè)人的周?chē)h(huán)境、朗讀文本、回答問(wèn)題以及識(shí)別人的面部表情,可以在手機(jī)上使用,也可以在Pivothead的智能眼鏡上使用。如果投入使用,將有助于為視障人士營(yíng)造更公平的環(huán)境,是一款能夠真正改變?nèi)藗兩畹漠a(chǎn)品,就像此項(xiàng)目的高級(jí)項(xiàng)目經(jīng)理Anne Taylor所說(shuō)的,這是“為真正重要的場(chǎng)景尋求解決方案”。也許不久微軟能開(kāi)發(fā)出一種仿生眼,直接發(fā)送視覺(jué)信號(hào)到大腦,讓盲人真正看到這個(gè)世界。